ニュース
モデル
API
keyboard_arrow_down
読者
URL を読み取ったり検索したりすると、大規模なモデルのサポートが向上します。
ベクトルモデル
世界クラスのマルチモーダル、多言語埋め込み。
並べ替え者
検索の関連性を最大化する世界クラスのニューラルレトリーバー。
Elastic Inference Service
Elasticsearch内でJinaモデルをネイティブに実行する。
MCP terminalコマンドラインarticlellms.txtsmart_toyエージェントdata_objectモデルmenu_book書類



ログイン
login
並べ替え者
copyright CC BY-NC 4.0
open_in_new リリースノート

jina-reranker-v3

業界をリードする多言語検索用リスト並べ替えツール
ライセンス
copyright CC-BY-NC-4.0
発売日
calendar_month
2025-10-01
入力
abc
テキスト(クエリ)
abc
テキスト(文書)
arrow_forward
出力
format_list_numbered
ランキング
モデル詳細
パラメータ: 597M
単語の長さを入力してください: 131K
出力寸法: 256
ベースモデル help_outline
open_in_new
Qwen3-0.6B
訓練された言語 help_outline
24 言語
サポートされている言語 help_outline
93 言語
定量版 help_outline
GGUF
Appleチップの最適化 help_outline
MLX
関連機種
link
jina-reranker-v2-base-multilingual
link
jina-reranker-m0
ラベル
listwise
multilingual
code-search
long-context
reranker
decoder-only
以下の方法で入手できます
Elastic Inference ServiceAPIアマゾンクラウドマイクロソフトクラウドグーグルクラウド顔を抱きしめる
I/O 図

複数

書類

クエリ

jina-reranker-v3

選別

比較するモデルを選択してください
紙 (1)
AAAI 2026
10月 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking

概要

jina-reranker-v3は、0.6Bのパラメータを持つ多言語ドキュメントリオーダラーで、斬新な「後着順」インタラクションアーキテクチャを導入しています。ColBERTがマルチベクトルマッチングを用いて個別にエンコーディングするのとは異なり、このモデルはクエリとドキュメントを同一コンテキストウィンドウ内で因果的セルフアテンション(causal self-attention)することで、各ドキュメントの最後のトークンからコンテキストベクトル化を抽出する前に、ドキュメント間のリッチなインタラクションを可能にします。Qwen3-0.6Bをベースに構築されたこのモデルは、28のTransformerレイヤーと軽量MLPプロジェクター(1024→512→256)を備え、131Kトークンのコンテキストで最大64のドキュメントを同時に処理します。このモデルは、生成リストベースのリオーダラーの10分の1のサイズでありながら、業界最高水準の61.94 nDCG-10というパフォーマンスを達成しています。

方法

3段階の漸進的トレーニング手法を採用し、InfoNCE、分散損失 (0.45)、二重マッチング損失 (0.85)、類似度損失 (0.85) を組み合わせた多目的損失関数を使用しました。第1段階では、ドメイン固有のデータセット (BGE-M3 および Cornstack を含む) で LoRA ファインチューニング (r=16、α=32) を使用し、各クエリには16のドキュメントが含まれていました。第2段階では、コンテキストを8,192トークンに拡張し、検索システムからハードネガティブサンプルを最大25のネガティブサンプルまでマイニングし、τ=0.05を使用しました。第3段階では、0.25から0.65の範囲の重みで特殊モデルをマージしました。特殊トークン doc_emb と query_emb を使用して、場所をベクトル化して抽出しました。トレーニングでは、システム/ユーザー/アシスタントの役割を持つ構造化キューを使用し、双方向の注意のためにクエリを最初と最後に配置しました。

パフォーマンス

BEIRデータセットでは、nDCG-10のスコアは61.94に達し、評価対象となったリランカーの中で最高値となり、jina-reranker-v2と比較して4.88%の向上を達成しました。マルチホップ検索においても非常に優れた性能を示し、HotpotQAデータセットでは78.56、FEVERデータセットでは93.95を達成しました。MIRACLデータセットでは、18言語における多言語検索において66.50を達成し、アラビア語では78.69、タイ語では81.06を達成しました。CoIRデータセットでは、コード検索において63.28を達成しました。パラメータ数が2.5倍少ないにもかかわらず、15億個のmxbai-rerank-largeデータセット(61.44)を上回りました。また、同規模のbge-reranker-v2-m3と比較して5.43%の向上を達成しました。ドキュメントの並べ替えでは、ランダム並べ替え (62.54)、降順並べ替え (61.94)、昇順並べ替え (61.52) と比較的安定しています。

ガイド

ベクトル化抽出は、システム/ユーザー/アシスタントの役割と特殊タグを含む構造化キューテンプレートを用いて実行されます。131Kを超えるコンテキストのコレクションでは、1回のフォワードパスで最大64のドキュメントを処理できます。ドキュメントの並べ替えはランダムソートまたは関連度降順ソートが最適な結果をもたらします。比較ランキングタスクには、ドキュメント間のインタラクション機能が活用されます。多言語アプリケーション向けに、このモデルは18言語間で堅牢なゼロショット転送を提供します。大規模なドキュメントセットのバッチ処理により、バッチ間で一貫したクエリベクトル化が保証されます。効率的な類似性計算のために、256次元の出力ベクトル化が考慮されています。ランキング品質と推論効率の両方が求められるアプリケーション、特にマルチホップ推論やファクトチェックタスクに最適です。
このモデルについて言及しているブログ
10月 03, 2025 • 7 読む時間
Jina Reranker v3: SOTA多言語検索向け0.6B Listwise 重排器
クエリとすべての候補ドキュメントを単一のコンテキストウィンドウで考慮する、新しい0.6Bパラメータのリストワイズ重排器。
Jina AI
Light blue background with stylized text in the center, composed of small dots or squares, evoking a modern and minimalistic
1月 22, 2025 • 10 読む時間
ModernBERT から何を学ぶべきか?
より大規模なトレーニングデータ、効率的なパラメータサイジング、そして深くて薄いアーキテクチャを特徴とする ModernBERT は、今後の BERT 系モデルの方向性を示しています。
Nan Wang
Alex C-G
Futuristic illustration with a central white circle surrounded by white dots on a dotted background.
9月 18, 2024 • 10 読む時間
Jina Embeddings v3:最先端の多言語埋め込みモデル
jina-embeddings-v3 は、570M パラメータと 8192 トークン長を持つ最先端の多言語テキスト埋め込みモデルで、MTEB において OpenAI や Cohere の最新の商用埋め込みモデルを上回る性能を発揮します。
Jina AI
Dynamic image showing the characters "V3" formed by bright green dots varying in size on a black background.
検索ベース
読者
ベクトルモデル
並べ替え者
Elastic Inference Service
open_in_new
Jina APIキーを取得する
レート制限
APIステータス
会社
私たちについて
ニュース
Jinaロゴをダウンロード
open_in_new
Elasticロゴをダウンロード
open_in_new
条項
安全性
利用規約
プライバシー
Cookieを管理する
Elastic © 2020-2026.