新聞
模型
API
keyboard_arrow_down
讀取器
讀取URL或搜索為大模型提供更好的依據。
向量模型
世界一流的多模態多語言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相關性。
Elastic Inference Service
在 Elasticsearch 中原生運行 Jina 模型。
MCP terminal命令行articlellms.txtsmart_toy代理人data_object模式menu_book文檔



登錄
login
向量模型
copyright CC BY-NC 4.0
open_in_new 發行説明

jina-embeddings-v5-omni-nano

適用於邊緣部署的緊湊型多模態向量
許可證
copyright CC-BY-NC-4.0
發佈日期
calendar_month
2026-05-07
輸入
abc
文本
image
圖片
audiotrack
聲音
videocam
視頻
picture_as_pdf
PDF
arrow_forward
輸出
more_horiz
向量
支持的俄羅斯套娃維度 help_outline
32
64
128
256
512
768
遲分技術 help_outline
cancel
No
模型詳細信息
參數: 1.0B
輸入詞元長度: 8K
輸出維度: 768
底座模型 help_outline
open_in_new
jina-embeddings-v5-text-nano
訓練過的語言 help_outline
32 語言
支持的語言 help_outline
108 語言
量化版本 help_outline
GGUF
蘋果芯片優化 help_outline
MLX
相關模型
link
jina-embeddings-v5-omni-small
link
jina-embeddings-v5-text-nano
link
jina-embeddings-v3
link
jina-clip-v2
支持的任務
search 檢索
compare_arrows 文本匹配
bubble_chart 聚類
label 分類
標籤
multimodal-embedding
embeddings
multilingual
long-context
production
matryoshka
last-token-pooling
visual-document-retrieval
可通過以下方式獲取
Elastic Inference ServiceJina API抱抱臉
I/O 圖 1

文本

jina-embeddings-v5-omni-nano

圖像

任務

向量

I/O 圖 2

文本

jina-embeddings-v5-omni-nano

聲音的

任務

向量

I/O 圖 3

文本

jina-embeddings-v5-omni-nano

視頻

任務

向量

I/O 圖 4

多個

向量

文本

jina-embeddings-v5-omni-nano

PDF

任務

選擇要比較的模型
論文 (1)
arXiv
五月 11, 2026
jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

概述

jina-embeddings-v5-omni-nano(約10.4億參數)是v5-omni系列的精簡版,專為邊緣計算和通用硬件設計。它在jina-embeddings-v5-text-nano的基礎上擴展了多模態功能:在共享的向量空間中支持文本、圖像、視頻和音頻輸入。純文本輸出與jina-embeddings-v5-text-nano在位上完全相同。該模型生成768維嵌入,並可通過Matryoshka截斷法將其降至32維,同時支持8K標記上下文長度。

方法

第三階段訓練與 omni-small 相同,並擴展了 jina-embeddings-v5-text-nano。EuroBERT-210M 文本骨幹網和 LoRA 適配器已凍結。跨模態投影器將 SigLIP2 Base 視覺編碼器和 Whisper-large-v3 音頻編碼器連接到文本骨幹網。訓練數據和目標與 omni-small 相同。

性能

純文本性能與jina-embeddings-v5-text-nano完全相同。由於嵌入空間較窄(768維 vs 1024維)且文本骨幹較小,多模態性能略低於omni-small,但仍保持了良好的跨模態對齊。針對CPU和邊緣硬件進行了優化,因為較大的omni-small模型無法在這些硬件上運行。

最佳實踐

使用模式與 omni-small 相同,LoRA 適配器選擇和多模態輸入處理也完全一致。主要區別在於:768 維輸出空間(Matryoshka 截斷至 32 維)和 8K 上下文窗口。nano 版本可在普通硬件上運行,無需 GPU 加速。純文本嵌入與 jina-embeddings-v5-text-nano 完全兼容。
提及此模型的博客
五月 12, 2026 • 7 分鐘的讀取量
jina-embeddings-v5-omni:支援文字、圖片、音訊與影片的向量模型
單一模型,四種模態:文字、圖像、音訊、影片。同級最佳的 1.6B 與 0.9B 全能型向量模型。
Han Xiao
搜索底座
讀取器
向量模型
重排器
Elastic Inference Service
open_in_new
獲取 Jina API 密鑰
速率限制
API 狀態
公司
關於我們
新聞
下載 Jina 標誌
open_in_new
下載 Elastic 徽標
open_in_new
條款
安全
條款及條件
隱私
管理 Cookie
Elastic © 2020-2026.