新聞
模型
API
keyboard_arrow_down
讀取器
讀取URL或搜索為大模型提供更好的依據。
向量模型
世界一流的多模態多語言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相關性。
Elastic Inference Service
在 Elasticsearch 中原生運行 Jina 模型。
MCP terminal命令行articlellms.txtsmart_toy代理人data_object模式menu_book文檔



登錄
login
向量模型
copyright CC BY-NC 4.0
open_in_new 發行説明

jina-embeddings-v5-text-nano

用於邊緣部署的SOTA多語言向量
許可證
copyright CC-BY-NC-4.0
發佈日期
calendar_month
2026-02-18
輸入
abc
文本
arrow_forward
輸出
more_horiz
向量
支持的俄羅斯套娃維度 help_outline
32
64
128
256
512
768
遲分技術 help_outline
cancel
No
模型詳細信息
參數: 239M
輸入詞元長度: 8K
輸出維度: 768
底座模型 help_outline
open_in_new
EuroBERT-210M
訓練過的語言 help_outline
32 語言
支持的語言 help_outline
108 語言
量化版本 help_outline
GGUF
蘋果芯片優化 help_outline
MLX
相關模型
link
jina-embeddings-v3
link
jina-embeddings-v5-text-small
支持的任務
search 檢索
compare_arrows 文本匹配
bubble_chart 聚類
label 分類
標籤
text-embedding
multilingual
long-context
production
matryoshka
last-token-pooling
可通過以下方式獲取
Elastic Inference ServiceJina API抱抱臉
I/O 圖

文本

jina-embeddings-v5-text-nano

任務

向量

選擇要比較的模型
論文 (1)
SIGIR 2026
二月 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation

概述

jina-embeddings-v5-text-nano 是一個基於 EuroBERT-210M 骨幹網構建的多語言文本嵌入模型,擁有 2.39 億個參數。EuroBERT-210M 是一個雙向編碼器,已在 15 種主要的歐洲和全球語言上進行預訓練。該模型通過最後一個詞元池化生成 768 維嵌入,並支持長度高達 3.2 萬個詞元的上下文。模型包含四個特定任務的 LoRA 適配器(每個適配器 670 萬個參數),分別用於檢索、語義相似度、聚類和分類。Matryoshka 表示學習技術支持將嵌入截斷到低至 32 維的維度。該模型使用 Qwen3-Embedding-4B 的嵌入蒸餾技術進行訓練,並結合特定任務的適配器訓練,其性能可與規模超過自身兩倍的模型相媲美,因此非常適合對延遲敏感和邊緣部署的應用場景。

方法

訓練過程與jina-embeddings-v5-text-small相同,採用兩階段流程,但應用於EuroBERT-210M骨幹網絡。第一階段是嵌入蒸餾,它使用餘弦距離損失函數,通過線性投影層將學生模型的768維嵌入映射到教師模型的空間,從而將知識從Qwen3-Embedding-4B遷移過來。訓練使用了來自300多個數據集的多種語言文本對。在第二階段,使用凍結的骨幹網絡權重訓練四個特定任務的LoRA適配器(每個適配器包含670萬個參數):檢索(InfoNCE + 知識蒸餾 + GOR)、文本匹配(CoSENT + 知識蒸餾)、聚類(使用特定任務的教師模型指令進行重蒸餾)和分類(雙向InfoNCE + 關係知識蒸餾)。EuroBERT骨幹網絡對包括英語、法語、德語、西班牙語、中文、日語、阿拉伯語和印地語在內的15種主要歐洲和全球語言提供了強大的多語言覆蓋。

性能

在 MMTEB(多語言)數據集上,jina-embeddings-v5-text-nano 模型僅使用 2.39 億個參數,就達到了任務級平均分 65.5 分和類型級平均分 57.7 分,優於所有參數量低於 5 億的模型,包括 KaLM-mini-v2.5(60.1 分,4.94 億個參數)、voyage-4-nano(58.9 分,4.8 億個參數)和 Gemma-300M(61.1 分,3.08 億個參數)。其分類得分為 69.2 分,聚類得分為 52.7 分,配對分類得分為 81.9 分,重排序得分為 64.6 分,檢索得分為 63.3 分,STS 得分為 78.2 分。在英語 MTEB 數據集上,其平均得分為 71.0 分,幾乎與參數量更大的 jina-embeddings-v5-text-small 模型(71.7 分)持平。在檢索基準測試中,該方法在 MTEB-M 上得分 63.26,在 RTEB 上得分 64.08,在 BEIR 上得分 56.06,在 LongEmbed 上得分 63.65。嵌入在二值量化下依然保持魯棒性,GOR 正則化將 MTEB 檢索的性能下降限制在 2 分以內。

最佳實踐

根據您的任務選擇合適的 LoRA 適配器:'retrieval' 用於非對稱查詢-文檔搜索(在查詢前添加 'Query:',在段落前添加 'Document:'),'text-matching' 用於對稱相似性任務(兩個輸入都使用 'Document:' 前綴),'clustering' 用於對相關文檔進行分組,'classification' 用於分類。該納米模型針對對延遲敏感和資源受限的部署進行了優化,同時保持了與規模超過其兩倍的模型相當的準確率。Matryoshka 截斷允許將嵌入維度從 768 維減少到低至 32 維;為獲得最佳結果,請將維度保持在 256 維以上。支持二進制量化。EuroBERT 骨幹網對包括英語、法語、德語、西班牙語、中文、日語、阿拉伯語和印地語在內的 15 種主要語言提供了強大的覆蓋。使用餘弦相似度進行嵌入比較。可通過 Jina AI API、Hugging Face(Sentence Transformers 和 vLLM)以及 llama.cpp 的量化變體獲得。
提及此模型的博客
五月 12, 2026 • 7 分鐘的讀取量
jina-embeddings-v5-omni:支援文字、圖片、音訊與影片的向量模型
單一模型,四種模態:文字、圖像、音訊、影片。同級最佳的 1.6B 與 0.9B 全能型向量模型。
Han Xiao
三月 06, 2026 • 6 分鐘的讀取量
從原始數值辨識向量模型
一個透過讀取原始數值來對向量模型進行指紋識別的微型 Transformer。無需特徵工程。
Han Xiao
Fingerprint illustration made from numbers, showcasing digital and high-tech design on a light background.
二月 19, 2026 • 7 分鐘的讀取量
jina-embeddings-v5-text:全新的 SOTA 小型多語言向量模型
兩款效能領先的 1B 以下多語言向量模型,現已於 Elastic Inference Service、Llama.cpp 與 MLX 上架。
Han Xiao
Abstract digital artwork in black and white, featuring scattered dots forming letters in a halftone effect. The central lette
搜索底座
讀取器
向量模型
重排器
Elastic Inference Service
open_in_new
獲取 Jina API 密鑰
速率限制
API 狀態
公司
關於我們
新聞
下載 Jina 標誌
open_in_new
下載 Elastic 徽標
open_in_new
條款
安全
條款及條件
隱私
管理 Cookie
Elastic © 2020-2026.