新闻
模型
API
keyboard_arrow_down
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
弹性推理服务
在 Elasticsearch 中原生运行 Jina 模型。
MCP terminal命令行articlellms.txtsmart_toy代理人data_object模式menu_book文档



登录
login
warning
此模型已被较新的模型弃用。
重排器
copyright CC BY-NC 4.0
open_in_new 发行说明

jina-reranker-v2-base-multilingual

支持多语言、函数调用和代码搜索的交叉编码器重排序器。
许可证
copyright CC-BY-NC-4.0
发布日期
calendar_month
2024-06-25
输入
abc
文本(查询)
abc
文本(文档)
arrow_forward
输出
format_list_numbered
排名
模型详细信息
参数: 278M
输入词元长度: 1K
底座模型 help_outline
open_in_new
XLM-RoBERTa Base
训练过的语言 help_outline
24 语言
支持的语言 help_outline
108 语言
相关模型
link
jina-reranker-v1-base-en
link
jina-reranker-v1-turbo-en
link
jina-reranker-v1-tiny-en
标签
multilingual
cross-lingual
function-calling
code-search
long-context
production-ready
reranker
rag-optimized
high-performance
100-languages
可通过以下方式获取
弹性推理服务Jina API亚马逊云微软云谷歌云抱抱脸
I/O 图

多个

文档

查询

jina-reranker-v2-base-multilingual

排序

选择要比较的模型

概述

Jina Reranker v2 Base Multilingual 是一种跨编码器模型,旨在提高跨语言障碍和数据类型的搜索准确性。此重排器解决了多语言环境中精确信息检索的关键挑战,对于需要跨不同语言和内容类型优化搜索结果的全球企业尤其有价值。它支持 100 多种语言,并具有独特的函数调用和代码搜索功能,是需要跨国际内容、API 文档和多语言代码库进行精确搜索优化的团队的统一解决方案。该模型紧凑的 278M 参数设计使其对于寻求平衡高性能和资源效率的组织特别有吸引力。

方法

该模型采用交叉编码器架构,并结合 Flash Attention 2 技术,能够直接比较查询和文档,从而更准确地评估相关性。模型经过四阶段训练:首先建立英语语言能力,然后逐步整合跨语言和多语言数据,最后使用反例进行最终优化。这种创新的训练方法与 Flash Attention 2 的实现相结合,使模型能够处理长度达 1024 个词元的上下文,并支持对更长文档进行自动分块。该架构的高效性使其能够处理跨多种语言的复杂重排序任务,吞吐量比上一代模型高出 6 倍,同时通过直接的查询-文档交互确保了相关性评估的准确性。

性能

在实际评估中,该模型在各种基准测试中都表现出色。它在 RAG 系统的 AirBench 排行榜上取得了最先进的性能,并在多语言任务中表现出色,包括涵盖 26 种语言的 MKQA 数据集。该模型在结构化数据任务中尤其出色,在函数调用(ToolBench 基准测试)和 SQL 模式匹配(NSText2SQL 基准测试)中都取得了高召回率。最令人印象深刻的是,它在提供这些结果的同时,处理文档的速度比 bge-reranker-v2-m3 等同类模型快 15 倍,使其适用于实时应用。但是,用户应注意,最佳性能需要具有 CUDA 功能的 GPU 进行推理。

最佳实践

为了实现最佳部署,该模型需要支持 CUDA 的 GPU,并且可以通过多种渠道访问,包括 Reranker API、Haystack 和 LangChain 等主流 RAG 框架,或者通过云市场进行私有部署。该模型在需要跨越语言障碍和数据类型进行精确理解的场景中表现出色,使其成为处理多语言内容、API 文档或代码库的全球企业的理想选择。凭借 1024 个词元的上下文窗口和针对较长文档的自动分块功能,该模型能够高效地处理扩展内容。当团队需要提高跨语言搜索的准确性、需要为代理 RAG 系统提供函数调用功能,或者希望改进跨多语言代码库的代码搜索功能时,应考虑使用此模型。该模型与向量搜索系统结合使用时效果尤为显著,可以显著提高检索到的文档的最终排名。
提及此模型的博客
十月 03, 2025 • 7 分钟的读取量
Jina Reranker v3:用于 SOTA 多语言检索的 0.6B Listwise 重排器
全新 0.6B 参数的 listwise 重排器,可在单个上下文窗口中考虑查询和所有候选文档。
Jina AI
Light blue background with stylized text in the center, composed of small dots or squares, evoking a modern and minimalistic
四月 16, 2025 • 10 分钟的读取量
嵌入向量长度偏差及其对搜索的影响
大小偏差指的是文本输入的长度如何影响相似度,而不考虑语义相关性。这解释了为什么搜索系统有时会返回冗长但相关性不高的文档,而不是与你的查询更精确匹配的简短内容。
Scott Martens
Black background with a simple white ruler marked in centimeters, emphasizing a minimalist design.
四月 08, 2025 • 21 分钟的读取量
jina-reranker-m0:多语言多模态文档重排模型
介绍我们的新型多语言多模态重排序器 jina-reranker-m0,它专门用于视觉文档检索,在多语言长文档和代码搜索任务中达到了最先进的性能水平。
Jina AI
Modern dot matrix text display on a dark blue background, conveying a digital feel.
四月 01, 2025 • 17 分钟的读取量
在 DeepSearch 中使用 DeepSeek R1 推理模型
标准 LLM 还是推理模型,哪个更适合 DeepSearch?在这篇文章中,我们探索了在 DeepSearch 实现中使用 DeepSeek-R1 来选择下一步行动。
Andrei Ungureanu
Alex C-G
Brown background with a stylized whale graphic and the text "THINK:" and ":SEARCH>" in code-like font.
三月 12, 2025 • 11 分钟的读取量
DeepSearch/DeepResearch 中的片段选择和 URL 排序
掌握这两个细节可以让你的 DeepSearch 从平庸变成神器:从冗长的网页中选择最佳片段,以及在爬取前对 URL 进行排序。
Han Xiao
Logo with words "THINK SEARCH THINK" in black dot and arrow patterns on an orange background, accompanied by horizontal lines
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, 加州 94085, 美国
location_on
德国柏林
Prinzessinnenstraße 19-20,10969 柏林,德国
搜索底座
读取器
向量模型
重排器
弹性推理服务
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生项目
下载 Jina 标志
open_in_new
下载 Elastic 徽标
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Elastic Jina AI © 2020-2026.