新聞
模型
API
keyboard_arrow_down
讀取器
讀取URL或搜索為大模型提供更好的依據。
向量模型
世界一流的多模態多語言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相關性。
MCP terminal命令行articlellms.txtsmart_toy代理人data_object模式menu_book文檔



登錄
login

向量模型

適用於搜索、RAG、智能體應用程序的性能最佳的多模態多語言長上下文向量模型。

向量模型API

用我們世界一流的向量模型來改進您的搜索和 RAG 系統。從免費試用開始!
key密鑰和計費
code用量
more_horiz更多的
chevron_leftchevron_right

home
speed速率限制
bug_report問題反饋
help_outline常見問題
服務狀態
chevron_leftchevron_right


示例輸入
試試改變它們看看響應如何變化!
Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.
Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.
Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.
针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。
新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

upload
請求
curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF


v5-text:最新最先進的小型多語言嵌入

jina-embeddings-v5-text 以兩種高效尺寸(677M 小型模型和 239M 納米模型)提供第五代嵌入質量,並具有特定於任務的 LoRA 適配器、Matryoshka 維度、32K 上下文和用於邊緣部署的 GGUF/MLX 量化,在 MMTEB、MTEB English 和檢索任務中樹立了新的基準。
閲讀新聞發佈稿arrow_forward

v4:多模態多語言檢索的通用向量

jina-embeddings-v4 是我們迄今為止最重要的飛躍——一個 3.8B 模型,通過統一的路徑向量文本和圖像,支持密集和後期交互檢索,同時優於 Google、OpenAI 和 Voyage AI 的專有模型,特別是在視覺豐富的文檔檢索方面。

兩種購買方式

訂閲我們的API或通過雲服務提供商購買。
radio_button_unchecked
cloud
與 3 個雲服務提供商合作
您的公司是否在使用 AWS 或 Azure?那麼請直接在貴公司的這些平台上私有化部署我們的搜索底座模型,這樣您的數據就能保持安全且合規。
AWS SageMaker
向量模型
重排器
Microsoft Azure
向量模型
重排器
Google Cloud
向量模型
radio_button_checked
使用Jina 搜索底座API
訪問我們所有產品的最簡單方法。隨時充值詞元。
為此 API 密鑰充值
根據您所在的位置,您可能需要支付美元、歐元或其他貨幣的費用。可能需繳納税費。
請輸入正確的API密鑰進行充值
瞭解速率限制
速率限制是指每個 IP 地址/API 密鑰 (RPM) 在一分鐘內可以向 API 發出的最大請求數。請在下面詳細瞭解每個產品和層級的速率限制。
keyboard_arrow_down
速率限制
速率限制通過三種方式跟蹤:RPM(每分鐘請求數)和TPM(每分鐘詞元數)。限制按 IP/API 密鑰強制執行,當首先達到 RPM 或 TPM 閾值時,將觸發限制。當您在請求標頭中提供 API 密鑰時,我們會按密鑰而不是 IP 地址跟蹤速率限制。
產品API端口描述arrow_upward無 API 密鑰key_off免費 API 密鑰key使用付費 API 密鑰key帶有高級 API 密鑰key平均延遲詞元使用計數請求類型
讀取器 APIhttps://r.jina.ai將 URL 轉換為大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以輸出響應中的詞元數量為準。GET/POST
讀取器 APIhttps://s.jina.ai搜索網絡並將結果轉換為大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每個請求都需要固定數量的詞元,從 10000 個詞元開始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings將文本/圖片轉為定長向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查詢對文檔進行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
分類器 APIhttps://api.jina.ai/v1/train使用訓練樣本訓練分類器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 × 迭代次數POST
分類器 API (少量樣本)https://api.jina.ai/v1/classify使用經過訓練的少樣本分類器對輸入進行分類block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元POST
分類器 API (零樣本)https://api.jina.ai/v1/classify使用零樣本分類對輸入進行分類block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 加 標籤詞元POST
切分器 APIhttps://api.jina.ai/v1/segment對長文本進行分詞分句20 RPM200 RPM200 RPM1,000 RPM0.3s詞元不計算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s統計整個過程中詞元的總數。POST

私有化部署

在 AWS Sagemaker 和 Microsoft Azure 中部署 Jina Embeddings 模型,並很快在 Google Cloud Services 中部署,或者聯繫我們的銷售團隊,為您的虛擬私有云和本地服務器獲取定製的 Kubernetes 部署。
AWS SageMaker
向量模型
重排器
Microsoft Azure
向量模型
重排器
Google Cloud
向量模型
API集成
在流行數據庫、向量數據庫、RAG 和 LLMOps 框架輕鬆使用我們的向量模型API。首先,只需將您的 API 密鑰複製到以下任意集成中即可快速使用我們的模型。
向量數據庫
LLM框架
RAG應用
可觀察性
open_in_new
MongoDB
open_in_new
DataStax
open_in_new
Qdrant
open_in_new
Pinecone
open_in_new
Chroma
open_in_new
Weaviate
open_in_new
Milvus
open_in_new
Epsilla
open_in_new
MyScale
open_in_new
LlamaIndex
open_in_new
Haystack
open_in_new
Langchain
open_in_new
Dify
open_in_new
SuperDuperDB
open_in_new
DashVector
open_in_new
Portkey
open_in_new
Baseten
open_in_new
TiDB
open_in_new
LanceDB
open_in_new
Carbon

我們的論文

瞭解我們的前沿搜索模型是如何從頭開始訓練的,查看我們的最新論文。在 EMNLP、SIGIR、ICLR、NeurIPS 和 ICML 與我們的團隊見面!
arXiv
二月 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
arXiv
二月 11, 2026
Embedding Inversion via Conditional Masked Diffusion Language Models
ICLR 2026
一月 22, 2026
Embedding Compression via Spherical Coordinates
arXiv
十二月 29, 2025
Vision Encoders in Vision-Language Models: A Survey
ICLR 2026
十二月 04, 2025
Jina-VLM: Small Multilingual Vision Language Model
AAAI 2026
十月 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
NeurIPS 2025
八月 31, 2025
Efficient Code Embeddings from Code Generation Models
EMNLP 2025
六月 24, 2025
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval
ICLR 2025
三月 04, 2025
ReaderLM-v2: Small Language Model for HTML to Markdown and JSON
ACL 2025
十二月 17, 2024
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark
ICLR 2025
十二月 12, 2024
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images
ECIR 2025
九月 18, 2024
jina-embeddings-v3: Multilingual Embeddings With Task LoRA
SIGIR 2025
九月 07, 2024
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models
EMNLP 2024
八月 30, 2024
Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever
WWW 2025
六月 21, 2024
Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models
ICML 2024
五月 30, 2024
Jina CLIP: Your CLIP Model Is Also Your Text Retriever
arXiv
二月 26, 2024
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings
arXiv
十月 30, 2023
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents
EMNLP 2023
七月 20, 2023
Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models
共計 19 篇論文。

學習向量模型

什麼是向量,為什麼要向量化?我們已經為您提供了一些入門文章。通過我們的綜合指南從頭開始瞭解向量模型。
Abstract illustration of a sound wave or heartbeat, formed by blue, orange, and gray dots on a white background.
三月 11, 2026 • 7 分鐘的讀取量
Bootstrapping Audio Embeddings from Multimodal LLMs
Turn any multimodal LLM into a small audio embedding model that beats CLAP with 25x less data.
Han Xiao
Fingerprint illustration made from numbers, showcasing digital and high-tech design on a light background.
三月 06, 2026 • 6 分鐘的讀取量
Identifying Embedding Models from Raw Numerical Values
A tiny transformer that fingerprints embedding models by reading raw numerical digits. No feature engineering.
Han Xiao
Abstract digital artwork in black and white, featuring scattered dots forming letters in a halftone effect. The central lette
二月 19, 2026 • 7 分鐘的讀取量
jina-embeddings-v5-text: New SOTA Small Multilingual Embeddings
Two sub-1B multilingual embeddings with best-in-class performance, available on Elastic Inference Service, Llama.cpp and MLX.
Han Xiao
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
二月 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
Text embedding models are widely used for semantic similarity tasks, including information retrieval, clustering, and classification. General-purpose models are typically trained with single- or multi-stage processes using contrastive loss functions. We introduce a novel training regimen that combines model distillation techniques with task-specific contrastive loss to produce compact, high-performance embedding models. Our findings suggest that this approach is more effective for training small models than purely contrastive or distillation-based training paradigms alone. Benchmark scores for the resulting models, jina-embeddings-v5-text-small and jina-embeddings-v5-text-nano, exceed or match the state-of-the-art for models of similar size. jina-embeddings-v5-text models additionally support long texts (up to 32k tokens) in many languages, and generate embeddings that remain robust under truncation and binary quantization. Model weights are publicly available, hopefully inspiring further advances in embedding model development.

重排器、向量搜索和 BM25 的比較

下表提供了 重排器、向量搜索和 BM25 的全面比較,突出顯示了它們在各個類別中的優缺點。
重排器向量搜索BM25
最適合場景增強的搜索精度和相關性初始、快速過濾跨廣泛查詢的一般文本檢索
粒度詳細:子文檔和查詢段廣泛:整個文檔中級:各種文本片段
查詢時間複雜度高的中等的低的
索引時間複雜度不需要高的低,利用預建索引
訓練時間複雜度高的高的不需要
搜索質量更適合細緻入微的查詢效率與準確性之間的平衡對於廣泛的查詢來説一致且可靠
優勢高度準確,具有深入的上下文理解快速高效,準確度適中高度可擴展,具有既定的功效
免費試用重排器 API免費使用向量模型 API

向量模型70年

在您的辦公空間或起居室內懸掛一張我們精心製作的海報,在1950年以來文本向量模型的進化和演變中尋找下一個靈感。
瞭解海報
shopping_cart購買海報

常見問題

Jina嵌入模型是如何訓練的?
keyboard_arrow_down
有關我們的訓練過程、數據來源和評估的詳細信息,請參閲我們在 arXiv 上發佈的 jina-embeddings-v3 和 jina-embeddings-v4 技術報告。
launcharXiv
你們的多模態嵌入模型是什麼?
keyboard_arrow_down
jina-embeddings-v4 是我們最新的通用多模態模型(38億參數),支持文本和圖像,包含32K上下文信息,支持密集型和延遲交互檢索,並在視覺豐富的文檔上實現了最先進的性能。jina-clip-v2 是一個更輕量級的模型(8.65億參數),支持89種語言,圖像分辨率為512x512,並採用Matryoshka表示法。這兩個模型在文本-文本、文本-圖像和圖像-圖像檢索任務中均表現出色。
launcharXiv
你們的模型支持哪些語言?
keyboard_arrow_down
jina-embeddings-v4 和 jina-embeddings-v3 均支持 89 種語言,並具備強大的多語言性能。排名前 30 的語言包括:阿拉伯語、孟加拉語、中文、丹麥語、荷蘭語、英語、芬蘭語、法語、格魯吉亞語、德語、希臘語、印地語、印尼語、意大利語、日語、韓語、拉脱維亞語、挪威語、波蘭語、葡萄牙語、羅馬尼亞語、俄語、斯洛伐克語、西班牙語、瑞典語、泰語、土耳其語、烏克蘭語、烏爾都語和越南語。jina-clip-v2 也支持 89 種語言,可用於多模態任務。
launcharXiv
單個句子輸入的最大長度是多少?
keyboard_arrow_down
上下文長度因模型而異:jina-embeddings-v4 最多支持 32K 個詞元,而 jina-embeddings-v3 和 jina-clip-v2 最多支持 8192 個詞元。一個詞元可以是一個字符,也可以是一個完整的單詞。這種擴展的上下文能夠對大量文本數據進行更全面的文檔分析,並提高上下文理解的準確性。
單個請求中最多可以包含多少個句子?
keyboard_arrow_down
每次請求包含的項目數量沒有硬性限制。API 會根據令牌數量對輸入進行內部分批處理,以優化 GPU 利用率。您可以在單個請求中發送所需的任意數量的文本或圖像。
如何將圖像發送到多模態嵌入模型?
keyboard_arrow_down
對於 `jina-embeddings-v4`、`jina-clip-v2` 和 `jina-clip-v1`,您可以在 API 請求的 `input` 字段中使用 `url` 或 `bytes`。對於 `url`,請提供您要處理的圖像的 URL。對於 `bytes`,請將圖像編碼為 base64 格式。`jina-embeddings-v4` 還可以通過傳遞 PDF URL 或 base64 編碼的 PDF 字節直接嵌入 PDF 文檔。
Jina Embeddings 模型與 OpenAI 和 Cohere 的最新向量模型相比如何?
keyboard_arrow_down
jina-embeddings-v4 是我們最新的旗艦模型,在視覺豐富的文檔檢索 (ViDoRe) 和多模態基準測試中均達到了 SOTA(最先進水平)。對於純文本任務,jina-embeddings-v3 在 MTEB 英語和多語言基準測試中超越了 OpenAI 和 Cohere,同時體積更小、效率更高。這兩個模型都支持 Matryoshka 表示學習 (MRL),允許在不顯著降低性能的情況下進行維度截斷(v3 可截斷至 32 維,v4 可截斷至 128 維)。
如何從 OpenAI 的 text-embedding-3-large 遷移到 Jina Embeddings 模型?
keyboard_arrow_down
遷移過程十分順暢,因為我們的 API 端點與 OpenAI 的 text-embedding-3-large 模型的輸入和輸出 JSON 架構相匹配。這種兼容性確保用户在使用 OpenAI 端點時可以輕鬆地將 OpenAI 模型替換為我們的模型。
使用 jina-clip 模型時如何計算 token?
keyboard_arrow_down
詞元根據文本長度和圖像大小計算。對於請求中的文本,詞元按標準方式計算。對於圖像,執行以下步驟: 1. 圖塊大小:每幅圖像被劃分為圖塊。對於 jina-embeddings-v4,圖塊尺寸為 28x28 像素;對於 jina-clip-v2,圖塊尺寸為 512x512 像素;對於 jina-clip-v1,圖塊尺寸為 224x224 像素。 2. 覆蓋率:計算覆蓋輸入圖像所需的圖塊數量。即使圖像尺寸不能被圖塊尺寸完全整除,部分圖塊也計為完整圖塊。 3. 圖塊總數:覆蓋圖像的圖塊總數決定了成本。例如,一幅 600x600 像素的圖像在 jina-embeddings-v4 中會被 22x22 個圖塊(484 個圖塊)覆蓋,在 jina-clip-v2 中會被 2x2 個圖塊(4 個圖塊)覆蓋,在 jina-clip-v1 中則會被 3x3 個圖塊(9 個圖塊)覆蓋。 4. 成本計算:對於 jina-embeddings-v4,每個圖塊花費 10 個詞元;對於 jina-clip-v2,每個圖塊花費 4000 個詞元;而對於 jina-clip-v1,每個圖塊花費 1000 個詞元。 示例: 對於一幅 600x600 像素的圖像: • 使用 jina-embeddings-v4 • 圖像被分割成 28x28 像素的圖塊。 • 所需的瓦片總數為 22(水平)x 22(垂直)= 484 個瓦片。 • jina-embeddings-v4 的成本為 484*10 = 4840 個 token。 • 使用 jina-clip-v2 • 圖像被分割成 512x512 像素的瓦片。 • 所需的瓦片總數為 2(水平)x 2(垂直)= 4 個瓦片。 • jina-clip-v2 的成本為 4*4000 = 16000 個 token。 • 使用 jina-clip-v1 • 圖像被分割成 224x224 像素的瓦片。 • 所需的瓷磚總數為 3(水平)x 3(垂直)= 9 塊瓷磚。 • jina-clip-v1 的成本為 9*1000 = 9000 個詞元。
你們提供向量模型圖片或音頻的模型嗎?
keyboard_arrow_down
是的,jina-clip-v2 和 jina-clip-v1 可以支持圖片和文本。更多模態上的向量模型將很快公佈!
Jina 向量模型模型可以使用私人或公司數據進行微調嗎?
keyboard_arrow_down
有關使用特定數據微調我們的模型的疑問,請聯繫我們討論您的要求。我們願意探索如何調整我們的模型來滿足您的需求。
聯繫我們
您的服務可以在 AWS、Azure 或 GCP 上私有化部署嗎?
keyboard_arrow_down
是的,我們的服務在 AWS、Azure 和 GCP 市場上可用。如果您有特定要求,請通過 sales AT jina.ai 聯繫我們。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
“task”參數是什麼?我應該在什麼情況下使用它?
keyboard_arrow_down
在jina-embeddings-v3和jina-embeddings-v4中,task參數用於激活特定任務的LoRA適配器,以獲得最佳性能。使用retrieval.query進行搜索查詢,使用retrieval.passage進行文檔搜索,使用text-matching進行語義相似度計算,使用classification進行文本分類,以及使用separation進行聚類任務。
什麼是延遲交互檢索?哪些模型支持這種檢索方式?
keyboard_arrow_down
jina-embeddings-v4 通過 output_type 參數支持密集(單向量)和延遲交互(多向量)檢索。延遲交互保留了更細粒度的詞級信息,從而在複雜查詢中實現更高的檢索準確率。jina-colbert-v2 是一個專用的延遲交互模型。
什麼是延遲分塊?我應該在什麼情況下使用它?
keyboard_arrow_down
延遲分塊是一種先使用長上下文模型嵌入整個文檔,然後從詞元級表示中提取塊嵌入的技術。與樸素分塊(先分塊後嵌入)不同,延遲分塊保留了跨塊上下文,從而提高了 RAG 應用的檢索性能。可以通過 `jina-embeddings-v3` 中的 `late_chunking` 參數啓用此功能。
為什麼 API 支持的上下文長度與模型的最大容量不同?
keyboard_arrow_down
雖然我們的一些嵌入模型在架構上能夠處理更長的上下文長度,但由於推理基礎架構中 GPU 顯存的限制,API 可能會強制執行較低的限制。處理非常長的序列需要大量的內存,我們針對大多數用例優化了服務配置,以平衡吞吐量、延遲和成本。如果您需要更長的上下文長度支持,請聯繫我們的銷售團隊,討論專門的部署方案。
為什麼jina-embeddings-v4是免費的,但速度卻很慢?
keyboard_arrow_down
jina-embeddings-v4 構建於 Qwen2-VL 基礎模型之上,該模型以 Qwen 研究許可發佈。此許可僅允許研究和非商業用途,這意味着我們無法將 jina-embeddings-v4 作為商業產品提供。因此,我們通過 API 免費提供該模型的訪問權限。jina-embeddings-v4 的速度可能比其他模型慢,原因有二:首先,jina-embeddings-v4 的模型比 jina-embeddings-v3 大得多,因此每次請求所需的計算時間也更長。其次,由於我們無法將此模型商業化,我們有意限制了 API 吞吐量以控制基礎設施成本。用户在使用 jina-embeddings-v4 API 時,不應期望獲得高吞吐量或生產級別的吞吐量。對於需要更高吞吐量的生產工作負載,我們建議使用 jina-embeddings-v3 或通過 Hugging Face 在您自己的基礎架構上部署 jina-embeddings-v4。
Embeddings API 的速率限制是多少?
keyboard_arrow_down
速率限制取決於您的 API 密鑰類型:

免費版: 100 RPM,100K TPM,2 個併發請求
付費版: 500 RPM,2M TPM,50 個併發請求
高級版: 5,000 RPM,50M TPM,500 個併發請求

此外,為了防止濫用,我們還設置了基於 IP 地址的速率限制,每 60 秒最多 10,000 個請求。如果您需要更高的限制,請聯繫我們的銷售團隊。
每個嵌入模型的上下文長度限制是多少?
keyboard_arrow_down
每個模型對每個輸入都有最大上下文長度限制:

jina-embeddings-v4: 32,768 個 token
jina-embeddings-v3: 8,192 個 token
jina-embeddings-v2-*: 8,192 個 token
jina-clip-v1/v2: 8,192 個 token
jina-colbert-v1/v2: 8,192 個 token
jina-code-embeddings-*: 32,768 個 token

除非設置了 truncate: true,否則超出限制的輸入將返回錯誤,設置後會自動截斷到最大長度。
圖片和PDF文件的大小限制是多少?
keyboard_arrow_down
最大文件大小為:圖片: 5 MB,PDF: 8 MB。超過此限制的文件將被拒絕並顯示錯誤信息。

如何獲取我的 API 密鑰?

video_not_supported

速率限制是多少?

速率限制
速率限制通過三種方式跟蹤:RPM(每分鐘請求數)和TPM(每分鐘詞元數)。限制按 IP/API 密鑰強制執行,當首先達到 RPM 或 TPM 閾值時,將觸發限制。當您在請求標頭中提供 API 密鑰時,我們會按密鑰而不是 IP 地址跟蹤速率限制。
產品API端口描述arrow_upward無 API 密鑰key_off免費 API 密鑰key使用付費 API 密鑰key帶有高級 API 密鑰key平均延遲詞元使用計數請求類型
讀取器 APIhttps://r.jina.ai將 URL 轉換為大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以輸出響應中的詞元數量為準。GET/POST
讀取器 APIhttps://s.jina.ai搜索網絡並將結果轉換為大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每個請求都需要固定數量的詞元,從 10000 個詞元開始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings將文本/圖片轉為定長向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查詢對文檔進行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
分類器 APIhttps://api.jina.ai/v1/train使用訓練樣本訓練分類器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 × 迭代次數POST
分類器 API (少量樣本)https://api.jina.ai/v1/classify使用經過訓練的少樣本分類器對輸入進行分類block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元POST
分類器 API (零樣本)https://api.jina.ai/v1/classify使用零樣本分類對輸入進行分類block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 加 標籤詞元POST
切分器 APIhttps://api.jina.ai/v1/segment對長文本進行分詞分句20 RPM200 RPM200 RPM1,000 RPM0.3s詞元不計算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s統計整個過程中詞元的總數。POST

我需要商業許可證嗎?

CC BY-NC 許可證自檢

play_arrow
您使用的是我們在 Azure、AWS 還是 GCP 上的官方 API 或官方鏡像?
play_arrow
是的
沒有任何限制。只需通過我們的網站或雲端市場註冊並付款即可。
play_arrow
不
play_arrow
您是 Elastic 的付費客户嗎?
play_arrow
是的
您的 Elastic 許可證可能已包含商業用途。如有疑問,請聯繫您的 Elastic 銷售代表。
聯繫銷售
play_arrow
不
我們目前無法簽發獨立的商業許可協議。請聯繫 Elastic 銷售部門瞭解更多信息。
聯繫銷售
API相關常見問題
code
我可以對讀取器、向量模型、重排器、分類器和微調模型 API 使用相同的 API 密鑰嗎?
keyboard_arrow_down
是的,同一個 API 密鑰適用於 Jina AI 的所有搜索基礎產品。這包括讀取器、向量模型、重排器、分類器和微調模型 API,所有服務之間共享詞元。
code
我可以查看 API 密鑰的詞元使用情況嗎?
keyboard_arrow_down
是的,您可以在“密鑰和計費”選項卡中輸入您的 API 密鑰來查看最近的使用記錄和剩餘額度。如果您已登錄 API 密鑰控制面板,也可以在“管理 API 密鑰”選項卡中查看這些詳細信息。
code
如果我忘記了 API 密鑰,該怎麼辦?
keyboard_arrow_down
如果您遺失了充值密鑰並希望找回,請使用您的註冊電子郵件聯繫 support AT jina.ai 尋求幫助。建議登錄以便於安全保存和便捷訪問您的 API 密鑰。
聯繫我們
code
API 密鑰會過期嗎?
keyboard_arrow_down
不,我們的 API 密鑰沒有到期日期。但是,如果您懷疑您的密鑰已被泄露並希望停用它,請聯繫我們的支持團隊尋求幫助。您還可以在API 密鑰控制面板中自助銷燬您的密鑰。
聯繫我們
code
我可以在 API 密鑰之間轉移額度嗎?
keyboard_arrow_down
是的,您可以將剩餘的付費額度從一個高級密鑰轉移到另一個密鑰。在API 密鑰控制面板上登錄您的帳户後,在該密鑰的設置界面來轉移所有剩餘的付費額度。
code
我可以銷燬我的 API 密鑰嗎?
keyboard_arrow_down
是的,如果您認為您的 API 密鑰已被泄露,您可以銷燬該密鑰。銷燬密鑰將立即為所有存儲該密鑰的用户禁用該密鑰,並且所有剩餘額度和關聯資產將永久不可用。如果您擁有高級密鑰,您可以選擇在銷燬之前將剩餘的已付款額度轉移到另一個密鑰。請注意,此操作無法撤消。要銷燬密鑰,請前往API 密鑰控制面板中的密鑰設置。
code
為什麼有些機型第一次請求比較慢?
keyboard_arrow_down
這是因為我們的無服務器架構在使用率較低時會卸載某些模型。初始請求會激活或“預熱”模型,這可能需要幾秒鐘。初始激活後,後續請求的處理速度會快得多。
code
我的API數據是否用於訓練你們的模型?
keyboard_arrow_down
不。我們絕不會使用您的 API 請求、輸入或輸出來訓練我們的嵌入模型、重排序模型或任何其他模型。您的數據始終歸您所有。我們符合 SOC 2 I 型和 II 型標準。
code
Jina API 的速率限制是多少?
keyboard_arrow_down
每個 API 密鑰均有速率限制:

免費版: 100 RPM,100K TPM,2 個併發請求
付費版: 500 RPM,2M TPM,50 個併發請求
高級版: 5,000 RPM,50M TPM,500 個併發請求

此外,還有基於 IP 的速率限制,每 60 秒 10,000 個請求。這些限制適用於所有 Jina API(嵌入式 API、重排序 API、讀取器 API 等)。
code
API是否有批量大小限制?
keyboard_arrow_down
Embeddings API 和 Reranker API 均無批次大小限制。您可以根據需要每次請求發送任意數量的項目或文檔。這兩個 API 都會根據 token 數量對輸入進行內部批處理,以實現最佳的 GPU 利用率。
與計費相關的常見問題
attach_money
API是根據句子的數量或請求的數量計費嗎?
keyboard_arrow_down
我們的定價模型基於處理的詞元總數,允許用户靈活地在任意數量的句子中分配這些詞元,為不同的文本分析需求提供經濟高效的解決方案。
attach_money
新用户可以免費試用嗎?
keyboard_arrow_down
我們為新用户提供免費試用,自動生成的 API 密鑰包含一千萬個可用於我們任何模型的詞元。免費額度用完後,用户可以通過"充值"標籤頁輕鬆購買額外的額度。
attach_money
失敗的請求是否會扣除詞元?
keyboard_arrow_down
不,失敗的請求不會扣除詞元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通過 Stripe 處理,支持多種付款方式,包括信用卡、Google Pay 和 PayPal,為您提供方便。
attach_money
充值後可以開具發票嗎?
keyboard_arrow_down
是的,充值後發票將發送到與您的 Stripe 帳户關聯的電子郵件地址。
辦公室
location_on
加利福尼亞州桑尼維爾
710 Lakeway Dr, Ste 200, 桑尼維爾, 加州 94085, 美國
location_on
德國柏林
Prinzessinnenstraße 19-20,10969 柏林,德國
搜索底座
讀取器
向量模型
重排器
獲取 Jina API 密鑰
速率限制
API 狀態
公司
關於我們
聯繫銷售
新聞
實習生項目
下載 Jina 標誌
open_in_new
下載 Elastic 徽標
open_in_new
條款
安全
條款及條件
隱私
管理 Cookie
email
Elastic Jina AI © 2020-2026.