news 2026/4/16 11:13:35

jina-embeddings-v3 现已在 Elastic Inference Service 上可用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
jina-embeddings-v3 现已在 Elastic Inference Service 上可用

作者:来自 Elastic Sean Handley 及 Ranjana Devaji

亲身体验 Elasticsearch:深入了解我们的示例 notebooks,开始免费的 cloud 试用,或立即在本地机器上试用 Elastic。


今天,我们很高兴在 Elastic Inference Service( EIS )上推出 jina-embeddings-v3,使快速的多语言 dense retrieval 能够直接集成到 Elasticsearch 中。jina-embeddings-v3 是首个在 EIS 上可用的 Jina AI 模型,后续还将推出更多模型。

Jina AI 近期通过收购加入 Elastic,是开源多语言和多模态 embeddings、rerankers 以及 small language models 领域的领导者。Jina 在 search foundation models 方面拥有深厚的专业能力,帮助开发者在 text、images、code 以及长篇多语言内容上构建高质量的检索 和 RAG 系统。

Elastic Inference Service( EIS )让开发者能够以可预测、基于使用量的定价方式,轻松为 search、RAG 和 agentic 应用添加快速、高质量且可靠的 semantic retrieval。EIS 提供完全托管的 GPU 推理和开箱即用的 models,无需额外的设置或 hosting 复杂度。

jina-embeddings-v3 支持高质量的多语言 retrieval,具备长上下文推理,并提供针对 RAG 和 agents 的 task-tuned 模式。它为开发者在多种语言中提供快速的 dense embeddings,同时无需承担运维开销。

为什么选择 jina-embeddings-v3?

jina-embeddings-v3 是一个 text embedding 模型,支持 32 种语言和最高 8192-token 的上下文,在更低成本下提供高相关性,并通过 EIS 提供 GPU 驱动的推理。

关键能力

  • 多语言能力:弥合语言差距,在 32 种语言之间对齐语义,包括阿拉伯语、孟加拉语、中文、丹麦语、荷兰语、英语、芬兰语、法语、格鲁吉亚语、德语、希腊语、印地语、印尼语、意大利语、日语、韩语、拉脱维亚语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、斯洛伐克语、西班牙语、瑞典语、泰语、土耳其语、乌克兰语、乌尔都语和越南语。
  • 参数效率:仅使用 570M 参数即可提供更高性能,在更低成本下实现与更大规模、基于 LLM 的 embeddings 相当的效果。
  • 维度控制:默认 1024 维,并支持 Matryoshka 表示法,允许开发者将 embedding 维度一路调低到 32 维,从而根据你的需求在准确率、延迟和存储之间灵活平衡。
  • 任务特定优化:提供任务特定的 Low-Rank Adaptation( LoRA )适配器,使其能够为多种任务生成高质量 embeddings,包括 query-document retrieval、聚类、分类和文本匹配。

开始使用

POST _inference/text_embedding/.jina-embeddings-v3 { "input": ["Rocky Mountain National Park"], "input_type": "ingest" }

该响应:

{ "text_embedding": [ { "embedding": [ -0.06678891, -0.0073341704, 0.011903269, -0.041797, ... ] } ] }

接下来是什么

在这些新 models 的同时,EIS 将持续演进,以支持更多用户,并简化跨环境的 semantic search。

用于EIS 的 Cloud Connect:用于 EIS 的 Cloud Connect 即将把 EIS 带到自托管环境中,降低运维开销,并支持 hybrid 架构和按你最合适方式进行的扩展。

semantic_text 在 EIS 上默认使用 jina-embeddings-v3:semantic_text 目前在后台使用 ELSER 作为 embeddings 模型,但在不久的将来将默认使用 EIS 上的 jina-embeddings-v3 endpoint。这一变化将在数据写入时提供内置推理,使在无需额外配置的情况下更容易采用多语言 search。

更多 models:我们正在扩展 EIS 的 model 目录,以满足客户不断增长的 inference 需求。在接下来的几个月中,我们将推出支持更广泛 search 和 inference 工作负载的新 models。紧随 jina-embeddings-v3 之后,下一个推出的 models 是 jina-reranker-v2-base-multilingual 和 jina-reranker-v3。这两个 Jina AI models 通过多语言 reranking,大幅提升 RAG 和 AI agents 的精度。

总结

通过在 EIS 上使用 jina-embeddings-v3,你可以在无需管理 models、GPUs 或基础设施的情况下,构建多语言、高精度的 retrieval pipelines。你可以获得快速的 dense retrieval,并与 Elasticsearch 的 relevance stack 紧密集成,全部集中在一个平台中。

无论你是在构建全球化的 RAG 系统、search,还是需要可靠 context 的 agentic workflows,Elastic 现在都为你提供了开箱即用的高性能 model,以及从 prototype 顺利走向 production 的运维简化能力。

所有 Elastic Cloud 试用都可以访问 Elastic Inference Service。现在就在 Elastic Cloud Serverless 和 Elastic Cloud Hosted 上试用。

原文:https://www.elastic.co/search-labs/blog/jina-embeddings-v3-elastic-inference-service

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 13:46:16

AI人体骨骼识别边缘计算部署:树莓派运行实测案例

AI人体骨骼识别边缘计算部署:树莓派运行实测案例 1. 引言:AI 人体骨骼关键点检测的现实意义 随着人工智能在计算机视觉领域的深入发展,人体姿态估计(Human Pose Estimation)已成为智能健身、动作捕捉、人机交互和安防…

作者头像 李华
网站建设 2026/4/15 19:53:56

UVC协议驱动开发中端点配置图解说明

UVC驱动开发中的端点配置:从协议到实战的完整图解指南你有没有遇到过这样的场景?摄像头插上电脑,系统识别为“未知设备”,或者虽然能枚举成功,但一打开OBS或VLC就卡顿、花屏甚至崩溃。问题往往不在于传感器或多线程处理…

作者头像 李华
网站建设 2026/4/6 18:56:51

AI行为识别:MediaPipe Pose应用实例

AI行为识别:MediaPipe Pose应用实例 1. 引言:AI人体骨骼关键点检测的现实价值 随着人工智能在计算机视觉领域的深入发展,人体姿态估计(Human Pose Estimation)已成为智能交互、运动分析、安防监控和虚拟现实等场景中…

作者头像 李华
网站建设 2026/4/15 9:18:00

如何让SillyTavern提示词不再“答非所问“?

如何让SillyTavern提示词不再"答非所问"? 【免费下载链接】SillyTavern LLM Frontend for Power Users. 项目地址: https://gitcode.com/GitHub_Trending/si/SillyTavern 你是否遇到过这样的场景:明明精心设计了提示词,AI却…

作者头像 李华
网站建设 2026/4/13 4:48:06

38种语言自由切换:HY-MT1.5-1.8B翻译模型使用避坑指南

38种语言自由切换:HY-MT1.5-1.8B翻译模型使用避坑指南 1. 引言 在全球化加速的今天,高质量、低延迟的机器翻译已成为企业出海、内容本地化和跨语言协作的核心基础设施。腾讯混元团队推出的 HY-MT1.5-1.8B 模型,作为一款参数量仅1.8B&#x…

作者头像 李华
网站建设 2026/4/12 17:10:27

AI骨骼检测在远程办公中的创新应用:坐姿提醒系统案例

AI骨骼检测在远程办公中的创新应用:坐姿提醒系统案例 1. 引言:AI驱动的健康办公新范式 随着远程办公和居家办公的普及,长时间久坐、不良坐姿引发的颈椎病、腰椎间盘突出等职业健康问题日益突出。传统的人工提醒或定时闹钟方式缺乏个性化与实…

作者头像 李华