重排器 new_releases m0 发布!
利用我们先进的重排 API 最大限度地提高搜索相关性和 RAG 准确性。
重排器 API
尝试我们先进的重排器 API,最大限度地提高您的搜索相关性和 RAG 准确性。免费试用!
chevron_leftchevron_right
返回最优的重排文档数量
与查询最相关的文档的数量。
查询示例
试试改变它看看响应如何变化!
待排序候选文档示例
试试改变它们看看响应如何变化!
upload
请求
curl https://api.jina.ai/v1/rerank \
-H "Content-Type: application/json" \
-H "Authorization: Bearer " \
-d @- <<EOFEOF
{
"query": "Organic skincare products for sensitive skin",
"top_n": 3,
"documents": [
"Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
"New makeup trends focus on bold colors and innovative techniques: Step into the world of cutting-edge beauty with this seasons makeup trends. Bold, vibrant colors and groundbreaking techniques are redefining the art of makeup. From neon eyeliners to holographic highlighters, unleash your creativity and make a statement with every look.",
"Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
"Neue Make-up-Trends setzen auf kräftige Farben und innovative Techniken: Tauchen Sie ein in die Welt der modernen Schönheit mit den neuesten Make-up-Trends. Kräftige, lebendige Farben und innovative Techniken setzen neue Maßstäbe. Von auffälligen Eyelinern bis hin zu holografischen Highlightern – lassen Sie Ihrer Kreativität freien Lauf und setzen Sie jedes Mal ein Statement.",
"Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
"Las nuevas tendencias de maquillaje se centran en colores vivos y técnicas innovadoras: Entra en el fascinante mundo del maquillaje con las tendencias más actuales. Colores vivos y técnicas innovadoras están revolucionando el arte del maquillaje. Desde delineadores neón hasta iluminadores holográficos, desata tu creatividad y destaca en cada look.",
"针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。",
"新的化妆趋势注重鲜艳的颜色和创新的技巧:进入化妆艺术的新纪元,本季的化妆趋势以大胆的颜色和创新的技巧为主。无论是霓虹眼线还是全息高光,每一款妆容都能让您脱颖而出,展现独特魅力。",
"敏感肌のために特別に設計された天然有機スキンケア製品: アロエベラとカモミールのやさしい力で、自然の抱擁を感じてください。敏感肌用に特別に設計された私たちのスキンケア製品は、肌に優しく栄養を与え、保護します。肌トラブルにさようなら、輝く健康な肌にこんにちは。",
"新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
],
"return_documents": false
}
EOFEOF
jina-reranker-m0:多语言多模态文档重排器
我们新的多模态多语言重排器可用于检索多种语言的视觉文档,在多语言长文档和代码搜索任务上具有 SOTA 性能。
搜索的本质就是快速有效地找到最用户想要的结果。上世纪的BM25 或 tf-idf 等关键字匹配算法已成熟用在各类搜索结果进行排名。近几年来,基于向量模型的余弦相似度大放异彩,已在许多向量数据库成为标配。但这些方法的本质都相对简单,经常会忽略掉自然语言的微妙之处,最重要的是,忽略掉文档和查询意图之间的关联信息。
“重排模型”由此而生!重排模型实际是一种高级AI模型,它从搜索中获取初始候选集(通常由基于向量/基于词元的搜索结果提供)并重新评估它们与用户搜索意图之间的相关性。重排器超越了文字的表层匹配,探索查询和文档内容之间更深层次的交互。
1
初始检索根据用户的查询,使用向量模型或BM25或TF-IDF等维度,在数据库中粗略匹配相关文档。
2
重排重排模型会获取这些初排结果,并在更精细的颗粒度上对文档和查询其进行相关性分析,同时考虑查询术语与文档内容交互等细微差别。
3
改善后的结果重排模型会将其认为最相关的结果放在顶部,从而改善搜索质量。
重排器可以显着提高搜索质量,因为它在子文档和子查询级别运行,这意味着它会查看各个单词和短语、它们的含义以及它们在查询和文档中如何相互关联。这会产生一组更精确且与上下文相关的搜索结果。
Jina Reranker v2 是同类最佳的重排器,于 2024 年 6 月 25 日发布;它是为 Agentic RAG 构建的。它具有函数调用支持、超过 100 种语言的多语言检索、代码搜索功能,并且比 v1 的速度提高了 6 倍。了解有关 v2 模型的更多信息。
多语言检索
Reranker v2 支持超过 100 种语言的文档检索,无论查询语言是什么。
函数调用和代码搜索
Reranker v2 根据自然语言查询对代码片段和函数签名进行排名,非常适合 Agentic RAG 应用程序。
表格和结构化数据支持
Reranker v2 根据自然语言查询对最相关的表进行排名,帮助对不同的表模式进行排序并在生成 SQL 查询之前确定最相关的表模式。
三种购买方式
订阅我们的 API、通过云提供商购买或为您的组织获取商业许可证。
radio_button_unchecked
cloud
与 3 个云服务提供商合作
您的公司是否在使用 AWS 或 Azure?那么请直接在贵公司的这些平台上私有化部署我们的搜索底座模型,这样您的数据就能保持安全且合规。
私有化部署
在 AWS Sagemaker 和 Microsoft Azure 上部署 Jina Reranker,很快就会在 Google Cloud Services 上部署 Jina Reranker,或者联系我们的销售团队,为您的虚拟私有云和本地服务器获取定制的 Kubernetes 部署。
向量模型
重排器
向量模型
重排器
向量模型
重排器
显示 v2 模型的基准(最新)
MKQA(多语言知识问答)
回忆一下 MKQA 数据集中不同重排器报告的 10 个分数
BEIR(不同 IR 任务的异构基准测试)
针对 Beir 数据集的不同重排器报告的 NDCG 10 分数
ToolBench。该基准测试收集了超过 16,000 个公共 API 以及相应的合成生成指令,以便在单 API 和多 API 设置中使用它们。
召回 ToolBench 数据集中不同重排器报告的 3 个分数
NSText2SQL
回顾 NSText2SQL 数据集中不同重排器报告的 3 个分数
CodeSearchNet。基准测试是文档字符串和自然语言格式的查询的组合,并带有与查询相关的标记代码段。
CodeSearchNet 数据集中不同重排模型的 MRR 10 得分报告
Jina Reranker v2 在 RTX4090 上的吞吐量
RTX 4090 GPU 上不同重排模型的吞吐量(50 毫秒内检索到的文档)分数报告。
了解重排器
什么是重排模型?为什么向量搜索或两两余弦相似度还不够?通过我们的综合指南从头开始了解重排器。
重排器 API 的费用是多少?
keyboard_arrow_down
这两个重排器有什么区别?
keyboard_arrow_down
Jina Rerankers 是开源的吗?
keyboard_arrow_down
重排器是否支持多种语言?
keyboard_arrow_down
查询和文档的最大长度是多少?
keyboard_arrow_down
每个查询可以重排的最大文档数是多少?
keyboard_arrow_down
批量大小是多少以及在一个请求中可以发送多少个查询文档元组?
keyboard_arrow_down
对 100 个文档重排时,预计延迟会是多少?
keyboard_arrow_down
您的服务可以在 AWS、Azure 或 GCP 上私有化部署吗?
keyboard_arrow_down
你们是否提供针对特定领域数据的微调重排器?
keyboard_arrow_down
文档的最小图像尺寸是多少?
keyboard_arrow_down
速率限制
列
arrow_drop_down
产品 | API端口 | 描述arrow_upward | 无 API 密钥key_off | 使用 API 密钥key | 带有高级 API 密钥key | 平均延迟 | 词元使用计数 | 请求类型 | |
---|---|---|---|---|---|---|---|---|---|
读取器 API | https://r.jina.ai | 将 URL 转换为大模型友好文本 | 20 RPM | 200 RPM | trending_up2000 RPM | 4.6s | 以输出响应中的词元数量为准。 | GET/POST | |
读取器 API | https://s.jina.ai | 搜索网络并将结果转换为大模型友好文本 | block | 40 RPM | trending_up400 RPM | 5.7s | 每个请求都需要固定数量的词元,从 10000 个词元开始 | GET/POST | |
深度搜索 | https://deepsearch.jina.ai/v1/chat/completions | 推理、搜索和迭代以找到最佳答案 | 1 RPM | 10 RPM | 100 RPM | 56.7s | 统计整个过程中词元的总数。 | POST | |
向量模型API | https://api.jina.ai/v1/embeddings | 将文本/图片转为定长向量 | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 取决于输入大小 help | 以输入请求中的词元数量为准。 | POST | |
重排器 API | https://api.jina.ai/v1/rerank | 按查询对文档进行精排 | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 取决于输入大小 help | 以输入请求中的词元数量为准。 | POST | |
分类器 API | https://api.jina.ai/v1/train | 使用训练样本训练分类器 | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 取决于输入大小 | 词元计数为:输入词元 × 迭代次数 | POST | |
分类器 API (少量样本) | https://api.jina.ai/v1/classify | 使用经过训练的少样本分类器对输入进行分类 | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 取决于输入大小 | 词元计数为:输入词元 | POST | |
分类器 API (零样本) | https://api.jina.ai/v1/classify | 使用零样本分类对输入进行分类 | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart 取决于输入大小 | 词元计数为:输入词元 加 标签词元 | POST | |
切分器 API | https://api.jina.ai/v1/segment | 对长文本进行分词分句 | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | 词元不计算使用量。 | GET/POST |
CC BY-NC 许可证自检
play_arrow
您是否使用我们的官方 API 或在 Azure 或 AWS 上我们的官方镜像?
play_arrow
done
是的
play_arrow
您使用的是付费 API 密钥还是免费试用密钥?
play_arrow
您是否在 AWS 和 Azure 上使用我们的官方模型?
play_arrow
close
不
API相关常见问题
code
我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗?
keyboard_arrow_down
code
我可以查看 API 密钥的词元使用情况吗?
keyboard_arrow_down
code
如果我忘记了 API 密钥,该怎么办?
keyboard_arrow_down
code
API 密钥会过期吗?
keyboard_arrow_down
code
我可以在 API 密钥之间转移词元余额吗?
keyboard_arrow_down
code
我可以销毁我的 API 密钥吗?
keyboard_arrow_down
code
为什么有些机型第一次请求比较慢?
keyboard_arrow_down
code
用户输入数据是否用于训练您的模型?
keyboard_arrow_down
与计费相关的常见问题
attach_money
API是根据句子的数量或请求的数量计费吗?
keyboard_arrow_down
attach_money
新用户可以免费试用吗?
keyboard_arrow_down
attach_money
失败的请求是否会扣除词元?
keyboard_arrow_down
attach_money
接受哪些付款方式?
keyboard_arrow_down
attach_money
词元购买后可以开具发票吗?
keyboard_arrow_down