新聞
模型
API
keyboard_arrow_down
讀取器
讀取URL或搜索為大模型提供更好的依據。
向量模型
世界一流的多模態多語言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相關性。
彈性推理服務
在 Elasticsearch 中原生運行 Jina 模型。
MCP terminal命令行articlellms.txtsmart_toy代理人data_object模式menu_book文檔



登錄
login
向量模型
重排器
copyright CC BY-NC 4.0
open_in_new 發行説明

jina-colbert-v2

最新的多語言ColBERT,在向量化和重排方面具有頂級性能
許可證
copyright CC-BY-NC-4.0
發佈日期
calendar_month
2024-08-31
輸入
abc
文本
arrow_forward
輸出
apps
多向量
支持的俄羅斯套娃維度 help_outline
64
96
128
模型詳細信息
參數: 560M
輸入詞元長度: 8K
輸出維度: 128
底座模型 help_outline
open_in_new
XLM-RoBERTa Large
訓練過的語言 help_outline
89 語言
支持的語言 help_outline
108 語言
相關模型
link
jina-colbert-v1-en
標籤
multilingual
late-interaction
long-context
high-performance
production-ready
retriever
token-level
89-languages
cross-lingual
matryoshka
storage-efficient
可通過以下方式獲取
Jina API亞馬遜雲微軟雲谷歌雲抱抱臉
I/O 圖 1

多個

向量

查詢

jina-colbert-v2

I/O 圖 2

多個

向量

文檔

jina-colbert-v2

選擇要比較的模型
論文 (1)
EMNLP 2024
八月 30, 2024
Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

概述

Jina-ColBERT-v2 是一種突破性的多語言信息檢索模型,解決了跨多種語言進行高效、高質量搜索的關鍵挑戰。作為第一個生成緊湊向量的多語言 ColBERT 類模型,它滿足了全球應用中對可擴展、經濟高效的多語言搜索解決方案日益增長的需求。從電子商務平台到內容管理系統,處理多語言內容的組織可以利用此模型提供 89 種語言的準確搜索結果,同時通過其創新的降維功能顯着降低存儲和計算成本。

方法

該模型以 ColBERT 架構為基礎,引入了一種複雜的後期交互機制,從根本上改變了查詢和文檔的匹配方式。其核心是使用經過修改的 XLM-RoBERTa 主幹,具有 5.6 億個參數,通過旋轉位置向量增強,並通過閃存注意進行優化。訓練過程涉及兩個關鍵階段:使用來自各種語言的各種弱監督數據進行初始預訓練,然後使用詞元三元組數據進行微調和監督蒸餾。這種方法的獨特之處在於實現了 Matryoshka 表示學習,這使模型能夠從單個訓練過程中生成多個維度(128、96 或 64)的向量,從而允許動態存儲優化而無需重新訓練。

性能

在實際測試中,Jina-ColBERT-v2 在多個基準測試中展現出卓越的能力。它在英語任務上的表現比原始的 ColBERT-v2 提高了 6.5%,在 14 個 BEIR 基準測試中的平均得分為 0.521。更令人印象深刻的是,它在 MIRACL 基準測試中在所有測試語言中的表現都優於傳統的基於 BM25 的檢索方法,在跨語言場景中表現出特別的優勢。即使在使用減少的向量維度時,該模型也能保持這種高性能 - 從 128 維降至 64 維僅導致性能下降 1.5%,同時存儲需求減半。這意味着生產成本顯著節省:例如,在 AWS 上存儲 1 億份具有 64 維向量的文檔每月成本為 659.62 美元,而 128 維則為 1,319.24 美元。

最佳實踐

為了有效部署 Jina-ColBERT-v2,團隊應考慮幾個實際方面。該模型需要支持 CUDA 的硬件才能獲得最佳性能,並支持最多 8,192 個詞元(可擴展至 12,288 個)的文檔長度,同時將查詢限制為 32 個詞元。對於生產部署,該模型可通過 Jina Search Foundation API、AWS 市場和 Azure 獲得,非商業版本可通過 Hugging Face 訪問。在實施時,團隊應指定他們是向量查詢還是文檔,因為該模型使用非對稱編碼。該模型並非專為在沒有適當索引的情況下實時處理極大的文檔集合而設計,雖然它在多語言檢索方面表現出色,但與針對這些特定領域進行微調的模型相比,它在專門的特定領域任務上的性能可能會略低。
提及此模型的博客
十月 03, 2025 • 7 分鐘的讀取量
Jina Reranker v3:用於 SOTA 多語檢索的 0.6B Listwise 重排器
全新 0.6B 參數的列表式重排器,可以在單一上下文視窗中考量查詢語句和所有候選文件。
Jina AI
Light blue background with stylized text in the center, composed of small dots or squares, evoking a modern and minimalistic
十二月 16, 2024 • 2 分鐘的讀取量
Re·Search:搜尋基礎進展 2024 年刊
探索 Re·Search,我們精心製作的 2024 年度專刊,匯集了我們最優秀的研究文章和搜尋基礎模型。採用局部 UV 塗層精裝封面,160 頁全彩印刷,處處展現細膩設計。全球發售,含運費 35 美元。
Jina AI
Open red publication "ReSearch" volume 24 displayed on a white surface with a distinctive shadow casting over the pages.
十月 29, 2024 • 11 分鐘的讀取量
超越 CLIP:Jina-CLIP 如何推進多模態搜索
了解 Jina-CLIP 如何透過統一的文字-圖像嵌入,增強 OpenAI 的 CLIP,實現更好的檢索準確度和更多樣化的結果。
Bo Wang
Alex C-G
Abstract digital landscape with wave-like green and pink dunes against a dark background, conveying a tranquil atmosphere.
八月 30, 2024 • 10 分鐘的讀取量
Jina ColBERT v2:用於 Embedding 與重排序的多語言後期互動檢索器
Jina ColBERT v2 支援 89 種語言,具有卓越的檢索效能、使用者可控的輸出維度,以及 8192 的 token 長度。
Jina AI
Dark-themed coding interface displaying English and Japanese characters with "JINA COLBERT V2" highlighted in the center.
二月 20, 2024 • 16 分鐘的讀取量
什麼是 ColBERT 和晚期交互?為什麼它們在搜尋中如此重要?
Jina AI 在 Hugging Face 上推出的 ColBERT 在 Twitter 上引起熱議,其 8192 token 的處理能力為搜尋領域帶來了新視角。本文將深入解析 ColBERT 和 ColBERTv2 的細節,展示其創新設計,以及為何其後期交互特性在搜尋領域中具有革命性的意義。
Han Xiao
Neon theater or concert hall marquee letters lit up at night with city lights and faint "Adobe Sto" visible.
辦公室
location_on
加利福尼亞州桑尼維爾
710 Lakeway Dr, Ste 200, 桑尼維爾, 加州 94085, 美國
location_on
德國柏林
Prinzessinnenstraße 19-20,10969 柏林,德國
搜索底座
讀取器
向量模型
重排器
彈性推理服務
open_in_new
獲取 Jina API 密鑰
速率限制
API 狀態
公司
關於我們
聯繫銷售
新聞
實習生項目
下載 Jina 標誌
open_in_new
下載 Elastic 徽標
open_in_new
條款
安全
條款及條件
隱私
管理 Cookie
email
Elastic Jina AI © 2020-2026.