news 2026/5/1 16:56:14

EverMemOS 访问外部(deepinfra)API接口

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
EverMemOS 访问外部(deepinfra)API接口

EverMemOS 访问外部API接口


📋 概述

  • EverMemOS 通过调用 外部大模型API 服务,实现evermemos内部业务响应,请求三方接口详情

✅ 目标接口

接口功能输入格式输出格式
POST /v1/chat/completions大语言模型对话Chat Completions 格式Chat 格式
POST /v1/reranker文档重排序Rerank Service 统一请求格式统一响应格式(含 rank)
POST /v1/embeddings文本向量化Vectorize Service 请求格式(支持is_queryEmbedding 格式

详细接口说明

1./v1/chat/completions

功能描述

生成基于输入消息的聊天响应,使用配置的 LLM 引擎。

请求参数
参数名类型是否必需默认值描述
modelstringNone模型名称
messagesarray of objectNone聊天消息列表,每个消息包含rolecontent字段
temperaturefloat0.7生成温度,控制输出随机性
max_tokensinteger1024最大生成 token 数
streambooleanfalse是否流式输出
response_formatobjectNone响应格式
请求示例
{"model":"qwen-7b","messages":[{"role":"user","content":"你好,请介绍一下自己"}],"temperature":0.7,"max_tokens":512}
响应结构
字段名类型描述
idstring响应 ID
objectstring对象类型,固定为 “chat.completion”
createdinteger创建时间戳
modelstring使用的模型名称
choicesarray of object响应选项列表
choices[].indexinteger选项索引
choices[].messageobject包含rolecontent的消息对象
choices[].finish_reasonstring完成原因
usageobject令牌使用情况
usage.prompt_tokensinteger提示令牌数
usage.completion_tokensinteger完成令牌数
usage.total_tokensinteger总令牌数
响应示例
{"id":"chatcmpl-abcdef123456","object":"chat.completion","created":1689123456,"model":"qwen-7b","choices":[{"index":0,"message":{"role":"assistant","content":"你好!我是一个基于 Qwen 模型的 AI 助手,很高兴为你服务。请问有什么我可以帮助你的吗?"},"finish_reason":"stop"}],"usage":{"prompt_tokens":10,"completion_tokens":25,"total_tokens":35}}

2./v1/embeddings

功能描述

生成文本的嵌入向量,可用于文本相似度计算、检索等任务。

请求参数
参数名类型是否必需默认值描述
inputarray of stringNone要生成嵌入的文本列表
modelstring“dengcao/Qwen3-Embedding-0.6B”模型名称
encoding_formatstring“float”编码格式
dimensionsinteger1024嵌入维度
is_querybooleanfalse是否为查询文本
请求示例
{"input":["人工智能的发展历程","机器学习的基本原理"],"model":"dengcao/Qwen3-Embedding-0.6B","is_query":false}
响应结构
字段名类型描述
objectstring对象类型,固定为 “list”
dataarray of object嵌入数据列表
data[].objectstring数据对象类型,固定为 “embedding”
data[].embeddingarray of float嵌入向量
data[].indexinteger索引
modelstring使用的模型名称
usageobject使用情况
usage.prompt_tokensinteger提示令牌数
usage.total_tokensinteger总令牌数
响应示例
{"object":"list","data":[{"object":"embedding","embedding":[0.123,0.456,-0.789,...],"index":0},{"object":"embedding","embedding":[0.987,-0.654,0.321,...],"index":1}],"model":"dengcao/Qwen3-Embedding-0.6B","usage":{"prompt_tokens":2,"total_tokens":2}}
错误处理
状态码描述
500内部服务器错误,返回错误详情

3./v1/reranker

功能描述

根据查询对文档列表进行重排序,返回按相关性排序的结果。

请求参数
参数名类型是否必需默认值描述
querystringNone查询文本
documentsarray of stringNone文档列表
modelstring“dengcao/Qwen3-Reranker-0.6B”模型名称
instructionstring“Given a search query, retrieve relevant passages that answer the query”指令文本
请求示例
{"query":"人工智能的应用领域","documents":["人工智能在医疗领域的应用包括疾病诊断和药物研发","机器学习是人工智能的一个重要分支","人工智能在金融领域用于风险评估和欺诈检测","人工智能的发展历史可以追溯到上世纪50年代"],"model":"dengcao/Qwen3-Reranker-0.6B"}
响应结构
字段名类型描述
resultsarray of object排序结果列表
results[].indexinteger原始文档索引
results[].scorefloat相关性分数
results[].rankinteger排序 rank
modelstring使用的模型名称
input_tokensinteger输入令牌数
request_idstring请求 ID
响应示例
{"results":[{"index":0,"score":0.95,"rank":0},{"index":2,"score":0.90,"rank":1},{"index":3,"score":0.75,"rank":2},{"index":1,"score":0.60,"rank":3}],"model":"dengcao/Qwen3-Reranker-0.6B","input_tokens":50,"request_id":"uuid-123456"}

✅ 3. 启动与测试

测试命令

Chat
curl-X POST http://xxx.xxx.xxx/v1/chat/completions\-H"Content-Type: application/json"\-d'{ "model": "qwen3:4b", "messages": [{"role": "user", "content": "你好!"}] }'
Embedding
curl-X POST http://xxx.xxx.xxx/v1/embeddings\-H"Content-Type: application/json"\-d'{ "input": ["这里太暗了"], "is_query": true }'
Reranker
curl-X POST http://xxx.xxx.xxx/v1/reranker\-H"Content-Type: application/json"\-d'{ "query": "这里太暗了", "documents": ["请打开灯", "今天天气很好"] }'

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/29 17:30:09

CAM++ vs 其他声纹模型:说话人验证精度与速度对比评测

CAM vs 其他声纹模型:说话人验证精度与速度对比评测 1. 为什么需要一场真实的声纹模型横向评测? 你有没有遇到过这样的情况:项目里要集成说话人验证功能,翻遍 GitHub 和 ModelScope,看到十几个名字带“CAM”“ECAPA”…

作者头像 李华
网站建设 2026/4/19 1:19:13

解决窗口尺寸难题:专业窗口尺寸调整工具让桌面管理更高效

解决窗口尺寸难题:专业窗口尺寸调整工具让桌面管理更高效 【免费下载链接】WindowResizer 一个可以强制调整应用程序窗口大小的工具 项目地址: https://gitcode.com/gh_mirrors/wi/WindowResizer 你是否曾遇到过无法调整大小的应用窗口?在4K显示器…

作者头像 李华
网站建设 2026/4/21 3:10:17

SiameseUniNLU多场景落地指南:电商评论情感分析+政务文本分类应用实例

SiameseUniNLU多场景落地指南:电商评论情感分析政务文本分类应用实例 1. 模型概述与核心能力 SiameseUniNLU是一个基于提示(Prompt)和文本(Text)构建的通用自然语言理解模型。它通过创新的指针网络(Pointer Network)技术,实现了对多种NLP任务的统一处理…

作者头像 李华
网站建设 2026/4/23 1:46:13

DAMO-YOLO故障排查手册:常见500错误/显存溢出/上传失败解决方案

DAMO-YOLO故障排查手册:常见500错误/显存溢出/上传失败解决方案 1. 为什么你需要这份手册 你刚部署好DAMO-YOLO,界面酷炫得像从赛博朋克电影里截出来的——霓虹绿框、玻璃拟态面板、实时动态统计,一切看起来都完美。可当你拖进第一张图片&a…

作者头像 李华
网站建设 2026/4/16 10:42:37

Windows系统HEIC预览解决方案:企业级图片管理效率提升指南

Windows系统HEIC预览解决方案:企业级图片管理效率提升指南 【免费下载链接】windows-heic-thumbnails Enable Windows Explorer to display thumbnails for HEIC files 项目地址: https://gitcode.com/gh_mirrors/wi/windows-heic-thumbnails 企业环境中的HE…

作者头像 李华