jina-reranker-v3

重排器

CC BY-NC 4.0

發行説明

jina-reranker-v3

行業領先的面向多語言檢索的列表式重排器

許可證

CC-BY-NC-4.0

發佈日期

2025-10-01

輸入

文本（查詢）

文本（文檔）

輸出

排名

模型詳細信息

參數: 597M

輸入詞元長度: 131K

輸出維度: 256

底座模型

Qwen3-0.6B

訓練過的語言

24 語言

支持的語言

93 語言

量化版本

GGUF

蘋果芯片優化

MLX

相關模型

jina-reranker-v2-base-multilingual

jina-reranker-m0

標籤

listwise

multilingual

code-search

long-context

reranker

decoder-only

可通過以下方式獲取

Elastic Inference Service Jina API 亞馬遜雲微軟雲谷歌雲抱抱臉

I/O 圖

選擇要比較的模型

jina-reranker-v3

jina-reranker-v2-base-multilingual

jina-reranker-m0

論文 (1)

AAAI 2026

十月 01, 2025

jina-reranker-v3: Last but Not Late Interaction for Document Reranking

概述

jina-reranker-v3 是一個參數量達 0.6B 的多語言文檔重排器，引入了一種新穎的“後發先至”的交互架構。與 ColBERT 採用多向量匹配的單獨編碼不同，該模型在同一上下文窗口內對查詢和文檔執行因果自注意力機制，從而在從每個文檔的最後一個標記提取上下文向量化之前實現豐富的跨文檔交互。該模型基於 Qwen3-0.6B 構建，擁有 28 個 Transformer 層和一個輕量級 MLP 投影器（1024→512→256），可在 131K 標記上下文中同時處理多達 64 個文檔。該模型實現了 61.94 nDCG-10 的行業領先性能，同時比生成式列表式重排器小 10 倍。

方法

採用三階段漸進式訓練，多目標損失函數結合了 InfoNCE、分散損失（0.45）、雙重匹配損失（0.85）和相似性損失（0.85）。第一階段使用 LoRA 微調（r=16，α=32），在特定領域數據集（包括 BGE-M3、Cornstack）上進行訓練，每個查詢包含 16 個文檔。第二階段將上下文擴展至 8,192 個標記，並在檢索系統中挖掘硬負樣本，最多可包含 25 個負樣本，τ=0.05。第三階段合併權重為 0.25-0.65 的專用模型。特殊標記 doc_emb 和 query_emb 標記向量化提取位置。訓練使用具有系統/用户/助手角色的結構化提示，將查詢置於開頭和結尾以進行雙向注意。

性能

在 BEIR 數據集上，nDCG-10 得分達到 61.94，在所有評估的重排器中最高，比 jina-reranker-v2 提升 4.88%。在多跳檢索方面表現出色，在 HotpotQA 數據集上達到 78.56，在 FEVER 數據集上達到 93.95。在 MIRACL 數據集上，18 種語言的多語言性能達到 66.50，其中阿拉伯語為 78.69，泰語為 81.06。在 CoIR 數據集上，代碼檢索達到 63.28。在參數減少 2.5 倍的情況下，性能優於 15 億 mxbai-rerank-large 數據集（61.44）。比同規模的 bge-reranker-v2-m3 提升 5.43%。在文檔排序方面相對穩定：隨機排序（62.54）、降序排序（61.94）、升序排序（61.52）。

最佳實踐

使用包含系統/用户/助手角色的結構化提示模板和特殊標記進行向量化提取。對於超過 131K 上下文的集合，每次前向傳遞最多可處理 64 個文檔。文檔隨機排序或按相關性降序排列效果最佳。利用跨文檔交互功能進行比較排名任務。對於多語言應用，該模型可在 18 種語言之間提供強大的零樣本遷移。對大型文檔集進行批處理，並在各個批次之間保持一致的查詢向量化。考慮使用 256 維輸出向量化進行高效的相似度計算。非常適合同時要求排名質量和推理效率的應用，尤其是多跳推理和事實驗證任務。

提及此模型的博客

十月 03, 2025 • 7 分鐘的讀取量

Jina Reranker v3：用於 SOTA 多語檢索的 0.6B Listwise 重排器

全新 0.6B 參數的列表式重排器，可以在單一上下文視窗中考量查詢語句和所有候選文件。

一月 22, 2025 • 10 分鐘的讀取量

從 ModernBERT 中我們應該學到什麼？

更大的訓練資料、高效的參數配置，以及深而窄的架構，ModernBERT 為未來類 BERT 模型指出了發展方向。

九月 18, 2024 • 10 分鐘的讀取量

Jina Embeddings v3：前沿多語言嵌入式模型

jina-embeddings-v3 是一個具有突破性的多語言文本嵌入模型，擁有 570M 參數和 8192 個 token 長度，在 MTEB 基準測試中的表現超越了 OpenAI 和 Cohere 最新的專有嵌入模型。