news 2026/6/15 1:09:48

Jina Rerankers 为 Elastic 推理服务(EIS)带来了快速、多语言的重排序能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Jina Rerankers 为 Elastic 推理服务(EIS)带来了快速、多语言的重排序能力

作者:来自 Elastic Sean Handley, Brendan Jugan 及 Ranjana Devaji

Elastic 现在在 EIS 上提供了 jina-reranker-v2-base-multilingual 和 jina-reranker-v3,使得可以直接在 Elasticsearch 中进行快速多语言重排序,实现更高精度的检索、RAG 和 agentic workflow,无需额外基础设施。

动手体验 Elasticsearch:现在就可以浏览我们的示例 notebooks、启动免费云试用,或在本地机器上尝试 Elastic。


今天,我们很高兴在 Elastic Inference Service (EIS) 上推出jina-reranker-v2-base-multilingualjina-reranker-v3,实现直接在 Elasticsearch 中进行快速、多语言、高精度的重排序。

Jina AI(最近被 Elastic 收购)是开源多语言和多模态模型领域的领导者,提供用于高质量检索和检索增强生成(RAG)的最先进搜索基础模型。EIS 让你可以轻松在托管 GPU 上运行这些现成模型的快速、高质量推理,无需任何设置或托管复杂性。

Reranker 通过优化检索结果的排序提高语义精度,帮助选择最匹配查询的结果。它们能够在不重新索引或干扰管道的情况下提升相关性,对混合搜索和 RAG 工作流尤为重要,因为更好的上下文能提高下游任务的准确性。

此前 EIS 上已推出jina-embeddings-v3,扩展了多语言 reranking 的模型目录。开发者现在可以结合 BM25F 词汇搜索和来自jina-embeddings-v3的多语言向量搜索进行混合搜索,再根据具体使用场景使用 Jina Rerankers v2 或 v3 进行重排序,从而在 Elasticsearch 中原生实现对召回调优的完全控制。

jina-reranker-v2-base-multilingual

jina-reranker-v2-base-multilingual 是一个紧凑型通用重排序器,具备支持函数调用和 SQL 查询的特性。

  • 低延迟大规模推理:这是一个 2.78 亿参数的紧凑模型,使用 Flash Attention 2 提供低延迟推理,在多语言性能上表现出色,根据 AIR 指标和其他常用基准甚至优于更大的重排序模型。

  • 支持 agentic 用例:可以进行准确的多语言文本重排序,并额外支持选择与文本查询匹配的 SQL 表和外部函数,从而实现 agentic 工作流。

  • 无限候选支持:v2 可以处理任意大的候选列表,通过独立评分文档实现。评分可跨批次兼容,因此开发者可以增量重排序大型结果集。例如,流水线可以每次评分 100 个候选项,然后合并评分并排序综合结果。这使得 v2 在不严格应用 top-k 限制的流水线中非常适用。

jina-reranker-v3

jina-reranker-v3 提供多语言 listwise 重新排序,在 RAG 和 agent 驱动的工作流中实现更高精度和最先进的性能。

  • 轻量化、适合生产环境的架构:约 6 亿参数的 listwise 重新排序模型,优化以实现低延迟推理和高效部署。

  • 强大的多语言表现:基准测试显示 v3 在多语言任务上性能领先于更大的模型,同时在置换情况下保持稳定的 top-k 排序。

  • 高效跨文档重新排序:与 v2 不同,v3 可以在单次推理中对最多 64 个文档进行整体重新排序,通过考察候选集合内的关系提升排序质量。通过批量处理候选而非单独评分,v3 显著降低推理成本,非常适合具有固定 top-k 结果的 RAG 和 agent 驱动工作流。

更多模型即将推出:EIS 正在持续扩展用于候选重排、检索和 agent 推理的优化模型。下一个是用于多模态重排的 jina-reranker-m0,其次是来自 OpenAI、Google 和 Anthropic 的 frontier 模型。

开始使用

你可以通过几个简单步骤,在 EIS 上使用jina-reranker-v2-base-multilingual

使用 jina-embeddings-v3 创建向量

POST _inference/text_embedding/.jina-embeddings-v3 { "input": [ "The Atlantic is a vast, deep ocean.", "A small puddle formed on the sidewalk." ] }

响应:

{ "text_embedding": [ { "embedding": [ 0.0061287, ... ] }, { "embedding": [ -0.11765291, ... ] } ] }

使用 jina-reranker-v2-base-multilingual 重新排序

执行推理:

POST _inference/rerank/.jina-reranker-v2-base-multilingual { "input": ["puddle", "ocean", "cup of tea"], "query": "a large body of water" }

响应结果:

{ "rerank": [ { "index": 1, "relevance_score": 0.48755136 }, { "index": 0, "relevance_score": 0.41489884 }, { "index": 2, "relevance_score": 0.07696084 } ] }

使用 jina-reranker-v3 重新排序

执行推理:

POST _inference/rerank/.jina-reranker-v3 { "input": ["pebble", "The Swiss Alps", "a steep hill"], "query": "mountain range" }

响应结果:

{ "rerank": [ { "index": 1, "relevance_score": 0.06519848 }, { "index": 2, "relevance_score": -0.05002501 }, { "index": 0, "relevance_score": -0.09782915 } ] }

类似于 jina-reranker-v2-base-multilingual,响应结果提供了按相关性排序的输入优先列表。在这个例子中,模型将 “The Swiss Alps” 识别为 “mountain range” 的最相关匹配,而 “pebble” 和 “a steep hill” 排名较低。

然而,一个关键区别是 jina-reranker-v3 是列表式重新排序器(listwise reranker)。与逐个对文档-查询对评分的 jina-reranker-v2-base-multilingual 不同,jina-reranker-v3 会同时处理所有输入,使模型能够在确定最终排序之前进行丰富的跨文档交互。

EIS 新特性

通过 Cloud Connect,EIS 可用于自托管集群,让开发者能够访问 GPU 集群来快速原型和部署 RAG、语义搜索以及 agent 工作流,而无需在自托管集群上采购 GPU 资源。平台团队可以实现混合灵活性:数据和索引保留在本地,同时在需要时在 Elastic Cloud 扩展 GPU 推理能力。

接下来

semantic_text 字段将很快默认使用 EIS 上的 jina-embeddings-v3,在数据摄取时提供内置推理,使采用多语言搜索更简单,无需额外配置。

试用体验

利用 EIS 上的 Jina AI 模型,你可以构建多语言、高精度检索管道,而无需管理模型、GPU 或基础设施。你将获得快速的密集检索、准确的重新排序,以及与 Elasticsearch 相关性栈的紧密集成,一站式平台完成。

无论你是在构建 RAG 系统、搜索,还是需要可靠上下文的 agent 工作流,Elastic 现在都提供了高性能开箱即用的模型,以及从原型到生产部署的简便运维能力。

所有 Elastic Cloud 试用用户均可访问 Elastic Inference Service。现在就可以在 Elastic Cloud Serverless 或 Elastic Cloud Hosted 上体验。

原文:https://www.elastic.co/search-labs/blog/jina-rerankers-elastic-inference-service

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 9:15:49

Instagram 创作者变现指南(2026):从内容到收入的实战路径

过去,很多人把 Instagram 当成“发图平台”;而在 2026 年,它更像是一个完整的商业渠道,你可以在这里获取流量、建立信任、并最终实现变现。随着 Reels 的持续放量、品牌合作模式成熟,以及多账号矩阵的普及,…

作者头像 李华
网站建设 2026/6/10 9:15:11

探索大数据领域数据中台的实时处理能力

探索大数据领域数据中台的实时处理能力 关键词:数据中台、实时处理、流批一体、低延迟计算、大数据架构 摘要:在“秒级决策”成为企业核心竞争力的今天,数据中台的实时处理能力就像“商业世界的心跳监测仪”,能让企业实时感知业务脉搏。本文将从生活场景切入,用“早餐店升…

作者头像 李华
网站建设 2026/6/10 9:15:48

Java实习模拟面试实录:致远互联一面高频考点全解析 —— Spring MVC、线程安全、AOP、分库分表、MySQL优化一网打尽!

Java实习模拟面试实录:致远互联一面高频考点全解析 —— Spring MVC、线程安全、AOP、分库分表、MySQL优化一网打尽! 前言:本文还原了笔者参加致远互联(Seeyon)Java实习生岗位的一轮技术面试全过程。作为国内知名协同办…

作者头像 李华
网站建设 2026/6/10 9:12:55

《P3157 [CQOI2011] 动态逆序对》

题目描述对于序列 a&#xff0c;它的逆序对数定义为集合{(i,j)∣i<j∧ai​>aj​}中的元素个数。现在给出 1∼n 的一个排列&#xff0c;按照某种顺序依次删除 m 个元素&#xff0c;你的任务是在每次删除一个元素之前统计整个序列的逆序对数。输入格式第一行包含两个整数 n…

作者头像 李华
网站建设 2026/6/12 9:59:18

如何在Android上恢复已删除的联系人

不幸的是&#xff0c;您的联系人有时会被意外地从Android设备中删除。失去联系人可能会给您的个人和职业生活带来许多不便。在这种情况下&#xff0c;您可能想知道如何在Android设备上恢复已删除的联系人。本文将全面讨论如何在Android手机上恢复已删除的联系人。 第 1 部分&am…

作者头像 李华
网站建设 2026/6/10 2:18:39

Native AOT 能改变什么?.NET 预编译技术深度剖析

当面试官问怎么缩小.NET发布后的文件体积、去掉多余依赖呢&#xff1f;想起了AOT,那么提到AOT首先要了解JIT。 长期以来&#xff0c;大多数 .NET 应用都依赖 即时编译&#xff08;JIT&#xff0c;Just-In-Time&#xff09; 机制运行。也就是说&#xff0c;程序发布时是中间语言…

作者头像 李华