新闻
模型
API
keyboard_arrow_down
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
MCP terminal命令行articlellms.txtsmart_toy代理人data_object模式menu_book文档



登录
login

向量模型

适用于搜索、RAG、智能体应用程序的性能最佳的多模态多语言长上下文向量模型。

向量模型API

用我们世界一流的向量模型来改进您的搜索和 RAG 系统。从免费试用开始!
key密钥和计费
code用量
more_horiz更多的
chevron_leftchevron_right

home
speed速率限制
bug_report问题反馈
help_outline常见问题
服务状态
chevron_leftchevron_right


示例输入
试试改变它们看看响应如何变化!
Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.
Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.
Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.
针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。
新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

upload
请求
curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF


v5-text:最新最先进的小型多语言嵌入

jina-embeddings-v5-text 以两种高效尺寸(677M 小型模型和 239M 纳米模型)提供第五代嵌入质量,并具有特定于任务的 LoRA 适配器、Matryoshka 维度、32K 上下文和用于边缘部署的 GGUF/MLX 量化,在 MMTEB、MTEB English 和检索任务中树立了新的基准。
阅读新闻发布稿arrow_forward

v4:多模态多语言检索的通用向量

jina-embeddings-v4 是我们迄今为止最重要的飞跃——一个 3.8B 模型,通过统一的路径向量文本和图像,支持密集和后期交互检索,同时优于 Google、OpenAI 和 Voyage AI 的专有模型,特别是在视觉丰富的文档检索方面。

两种购买方式

订阅我们的API或通过云服务提供商购买。
radio_button_unchecked
cloud
与 3 个云服务提供商合作
您的公司是否在使用 AWS 或 Azure?那么请直接在贵公司的这些平台上私有化部署我们的搜索底座模型,这样您的数据就能保持安全且合规。
AWS SageMaker
向量模型
重排器
Microsoft Azure
向量模型
重排器
Google Cloud
向量模型
radio_button_checked
使用Jina 搜索底座API
访问我们所有产品的最简单方法。随时充值词元。
为此 API 密钥充值
根据您所在的位置,您可能需要支付美元、欧元或其他货币的费用。可能需缴纳税费。
请输入正确的API密钥进行充值
了解速率限制
速率限制是指每个 IP 地址/API 密钥 (RPM) 在一分钟内可以向 API 发出的最大请求数。请在下面详细了解每个产品和层级的速率限制。
keyboard_arrow_down
速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off免费 API 密钥key使用付费 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s统计整个过程中词元的总数。POST

私有化部署

在 AWS Sagemaker 和 Microsoft Azure 中部署 Jina Embeddings 模型,并很快在 Google Cloud Services 中部署,或者联系我们的销售团队,为您的虚拟私有云和本地服务器获取定制的 Kubernetes 部署。
AWS SageMaker
向量模型
重排器
Microsoft Azure
向量模型
重排器
Google Cloud
向量模型
API集成
在流行数据库、向量数据库、RAG 和 LLMOps 框架轻松使用我们的向量模型API。首先,只需将您的 API 密钥复制到以下任意集成中即可快速使用我们的模型。
向量数据库
LLM框架
RAG应用
可观察性
open_in_new
MongoDB
open_in_new
DataStax
open_in_new
Qdrant
open_in_new
Pinecone
open_in_new
Chroma
open_in_new
Weaviate
open_in_new
Milvus
open_in_new
Epsilla
open_in_new
MyScale
open_in_new
LlamaIndex
open_in_new
Haystack
open_in_new
Langchain
open_in_new
Dify
open_in_new
SuperDuperDB
open_in_new
DashVector
open_in_new
Portkey
open_in_new
Baseten
open_in_new
TiDB
open_in_new
LanceDB
open_in_new
Carbon

我们的论文

了解我们的前沿搜索模型是如何从头开始训练的,查看我们的最新论文。在 EMNLP、SIGIR、ICLR、NeurIPS 和 ICML 与我们的团队见面!
arXiv
二月 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
arXiv
二月 11, 2026
Embedding Inversion via Conditional Masked Diffusion Language Models
ICLR 2026
一月 22, 2026
Embedding Compression via Spherical Coordinates
arXiv
十二月 29, 2025
Vision Encoders in Vision-Language Models: A Survey
ICLR 2026
十二月 04, 2025
Jina-VLM: Small Multilingual Vision Language Model
AAAI 2026
十月 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
NeurIPS 2025
八月 31, 2025
Efficient Code Embeddings from Code Generation Models
EMNLP 2025
六月 24, 2025
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval
ICLR 2025
三月 04, 2025
ReaderLM-v2: Small Language Model for HTML to Markdown and JSON
ACL 2025
十二月 17, 2024
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark
ICLR 2025
十二月 12, 2024
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images
ECIR 2025
九月 18, 2024
jina-embeddings-v3: Multilingual Embeddings With Task LoRA
SIGIR 2025
九月 07, 2024
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models
EMNLP 2024
八月 30, 2024
Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever
WWW 2025
六月 21, 2024
Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models
ICML 2024
五月 30, 2024
Jina CLIP: Your CLIP Model Is Also Your Text Retriever
arXiv
二月 26, 2024
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings
arXiv
十月 30, 2023
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents
EMNLP 2023
七月 20, 2023
Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models
共计 19 篇论文。

学习向量模型

什么是向量,为什么要向量化?我们已经为您提供了一些入门文章。通过我们的综合指南从头开始了解向量模型。
Abstract illustration of a sound wave or heartbeat, formed by blue, orange, and gray dots on a white background.
三月 11, 2026 • 7 分钟的读取量
Bootstrapping Audio Embeddings from Multimodal LLMs
Turn any multimodal LLM into a small audio embedding model that beats CLAP with 25x less data.
Han Xiao
Fingerprint illustration made from numbers, showcasing digital and high-tech design on a light background.
三月 06, 2026 • 6 分钟的读取量
Identifying Embedding Models from Raw Numerical Values
A tiny transformer that fingerprints embedding models by reading raw numerical digits. No feature engineering.
Han Xiao
Abstract digital artwork in black and white, featuring scattered dots forming letters in a halftone effect. The central lette
二月 19, 2026 • 7 分钟的读取量
jina-embeddings-v5-text: New SOTA Small Multilingual Embeddings
Two sub-1B multilingual embeddings with best-in-class performance, available on Elastic Inference Service, Llama.cpp and MLX.
Han Xiao
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
二月 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
Text embedding models are widely used for semantic similarity tasks, including information retrieval, clustering, and classification. General-purpose models are typically trained with single- or multi-stage processes using contrastive loss functions. We introduce a novel training regimen that combines model distillation techniques with task-specific contrastive loss to produce compact, high-performance embedding models. Our findings suggest that this approach is more effective for training small models than purely contrastive or distillation-based training paradigms alone. Benchmark scores for the resulting models, jina-embeddings-v5-text-small and jina-embeddings-v5-text-nano, exceed or match the state-of-the-art for models of similar size. jina-embeddings-v5-text models additionally support long texts (up to 32k tokens) in many languages, and generate embeddings that remain robust under truncation and binary quantization. Model weights are publicly available, hopefully inspiring further advances in embedding model development.

重排器、向量搜索和 BM25 的比较

下表提供了 重排器、向量搜索和 BM25 的全面比较,突出显示了它们在各个类别中的优缺点。
重排器向量搜索BM25
最适合场景增强的搜索精度和相关性初始、快速过滤跨广泛查询的一般文本检索
粒度详细:子文档和查询段广泛:整个文档中级:各种文本片段
查询时间复杂度高的中等的低的
索引时间复杂度不需要高的低,利用预建索引
训练时间复杂度高的高的不需要
搜索质量更适合细致入微的查询效率与准确性之间的平衡对于广泛的查询来说一致且可靠
优势高度准确,具有深入的上下文理解快速高效,准确度适中高度可扩展,具有既定的功效
免费试用重排器 API免费使用向量模型 API

向量模型70年

在您的办公空间或起居室内悬挂一张我们精心制作的海报,在1950年以来文本向量模型的进化和演变中寻找下一个灵感。
了解海报
shopping_cart购买海报

常见问题

Jina嵌入模型是如何训练的?
keyboard_arrow_down
有关我们的训练过程、数据来源和评估的详细信息,请参阅我们在 arXiv 上发布的 jina-embeddings-v3 和 jina-embeddings-v4 技术报告。
launcharXiv
你们的多模态嵌入模型是什么?
keyboard_arrow_down
jina-embeddings-v4 是我们最新的通用多模态模型(38亿参数),支持文本和图像,包含32K上下文信息,支持密集型和延迟交互检索,并在视觉丰富的文档上实现了最先进的性能。jina-clip-v2 是一个更轻量级的模型(8.65亿参数),支持89种语言,图像分辨率为512x512,并采用Matryoshka表示法。这两个模型在文本-文本、文本-图像和图像-图像检索任务中均表现出色。
launcharXiv
你们的模型支持哪些语言?
keyboard_arrow_down
jina-embeddings-v4 和 jina-embeddings-v3 均支持 89 种语言,并具备强大的多语言性能。排名前 30 的语言包括:阿拉伯语、孟加拉语、中文、丹麦语、荷兰语、英语、芬兰语、法语、格鲁吉亚语、德语、希腊语、印地语、印尼语、意大利语、日语、韩语、拉脱维亚语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、斯洛伐克语、西班牙语、瑞典语、泰语、土耳其语、乌克兰语、乌尔都语和越南语。jina-clip-v2 也支持 89 种语言,可用于多模态任务。
launcharXiv
单个句子输入的最大长度是多少?
keyboard_arrow_down
上下文长度因模型而异:jina-embeddings-v4 最多支持 32K 个词元,而 jina-embeddings-v3 和 jina-clip-v2 最多支持 8192 个词元。一个词元可以是一个字符,也可以是一个完整的单词。这种扩展的上下文能够对大量文本数据进行更全面的文档分析,并提高上下文理解的准确性。
单个请求中最多可以包含多少个句子?
keyboard_arrow_down
每次请求包含的项目数量没有硬性限制。API 会根据令牌数量对输入进行内部分批处理,以优化 GPU 利用率。您可以在单个请求中发送所需的任意数量的文本或图像。
如何将图像发送到多模态嵌入模型?
keyboard_arrow_down
对于 `jina-embeddings-v4`、`jina-clip-v2` 和 `jina-clip-v1`,您可以在 API 请求的 `input` 字段中使用 `url` 或 `bytes`。对于 `url`,请提供您要处理的图像的 URL。对于 `bytes`,请将图像编码为 base64 格式。`jina-embeddings-v4` 还可以通过传递 PDF URL 或 base64 编码的 PDF 字节直接嵌入 PDF 文档。
Jina Embeddings 模型与 OpenAI 和 Cohere 的最新向量模型相比如何?
keyboard_arrow_down
jina-embeddings-v4 是我们最新的旗舰模型,在视觉丰富的文档检索 (ViDoRe) 和多模态基准测试中均达到了 SOTA(最先进水平)。对于纯文本任务,jina-embeddings-v3 在 MTEB 英语和多语言基准测试中超越了 OpenAI 和 Cohere,同时体积更小、效率更高。这两个模型都支持 Matryoshka 表示学习 (MRL),允许在不显著降低性能的情况下进行维度截断(v3 可截断至 32 维,v4 可截断至 128 维)。
如何从 OpenAI 的 text-embedding-3-large 迁移到 Jina Embeddings 模型?
keyboard_arrow_down
迁移过程十分顺畅,因为我们的 API 端点与 OpenAI 的 text-embedding-3-large 模型的输入和输出 JSON 架构相匹配。这种兼容性确保用户在使用 OpenAI 端点时可以轻松地将 OpenAI 模型替换为我们的模型。
使用 jina-clip 模型时如何计算 token?
keyboard_arrow_down
词元根据文本长度和图像大小计算。对于请求中的文本,词元按标准方式计算。对于图像,执行以下步骤: 1. 图块大小:每幅图像被划分为图块。对于 jina-embeddings-v4,图块尺寸为 28x28 像素;对于 jina-clip-v2,图块尺寸为 512x512 像素;对于 jina-clip-v1,图块尺寸为 224x224 像素。 2. 覆盖率:计算覆盖输入图像所需的图块数量。即使图像尺寸不能被图块尺寸完全整除,部分图块也计为完整图块。 3. 图块总数:覆盖图像的图块总数决定了成本。例如,一幅 600x600 像素的图像在 jina-embeddings-v4 中会被 22x22 个图块(484 个图块)覆盖,在 jina-clip-v2 中会被 2x2 个图块(4 个图块)覆盖,在 jina-clip-v1 中则会被 3x3 个图块(9 个图块)覆盖。 4. 成本计算:对于 jina-embeddings-v4,每个图块花费 10 个词元;对于 jina-clip-v2,每个图块花费 4000 个词元;而对于 jina-clip-v1,每个图块花费 1000 个词元。 示例: 对于一幅 600x600 像素的图像: • 使用 jina-embeddings-v4 • 图像被分割成 28x28 像素的图块。 • 所需的瓦片总数为 22(水平)x 22(垂直)= 484 个瓦片。 • jina-embeddings-v4 的成本为 484*10 = 4840 个 token。 • 使用 jina-clip-v2 • 图像被分割成 512x512 像素的瓦片。 • 所需的瓦片总数为 2(水平)x 2(垂直)= 4 个瓦片。 • jina-clip-v2 的成本为 4*4000 = 16000 个 token。 • 使用 jina-clip-v1 • 图像被分割成 224x224 像素的瓦片。 • 所需的瓷砖总数为 3(水平)x 3(垂直)= 9 块瓷砖。 • jina-clip-v1 的成本为 9*1000 = 9000 个词元。
你们提供向量模型图片或音频的模型吗?
keyboard_arrow_down
是的,jina-clip-v2 和 jina-clip-v1 可以支持图片和文本。更多模态上的向量模型将很快公布!
Jina 向量模型模型可以使用私人或公司数据进行微调吗?
keyboard_arrow_down
有关使用特定数据微调我们的模型的疑问,请联系我们讨论您的要求。我们愿意探索如何调整我们的模型来满足您的需求。
联系我们
您的服务可以在 AWS、Azure 或 GCP 上私有化部署吗?
keyboard_arrow_down
是的,我们的服务在 AWS、Azure 和 GCP 市场上可用。如果您有特定要求,请通过 sales AT jina.ai 联系我们。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
“task”参数是什么?我应该在什么情况下使用它?
keyboard_arrow_down
在jina-embeddings-v3和jina-embeddings-v4中,task参数用于激活特定任务的LoRA适配器,以获得最佳性能。使用retrieval.query进行搜索查询,使用retrieval.passage进行文档搜索,使用text-matching进行语义相似度计算,使用classification进行文本分类,以及使用separation进行聚类任务。
什么是延迟交互检索?哪些模型支持这种检索方式?
keyboard_arrow_down
jina-embeddings-v4 通过 output_type 参数支持密集(单向量)和延迟交互(多向量)检索。延迟交互保留了更细粒度的词级信息,从而在复杂查询中实现更高的检索准确率。jina-colbert-v2 是一个专用的延迟交互模型。
什么是延迟分块?我应该在什么情况下使用它?
keyboard_arrow_down
延迟分块是一种先使用长上下文模型嵌入整个文档,然后从词元级表示中提取块嵌入的技术。与朴素分块(先分块后嵌入)不同,延迟分块保留了跨块上下文,从而提高了 RAG 应用的检索性能。可以通过 `jina-embeddings-v3` 中的 `late_chunking` 参数启用此功能。
为什么 API 支持的上下文长度与模型的最大容量不同?
keyboard_arrow_down
虽然我们的一些嵌入模型在架构上能够处理更长的上下文长度,但由于推理基础架构中 GPU 显存的限制,API 可能会强制执行较低的限制。处理非常长的序列需要大量的内存,我们针对大多数用例优化了服务配置,以平衡吞吐量、延迟和成本。如果您需要更长的上下文长度支持,请联系我们的销售团队,讨论专门的部署方案。
为什么jina-embeddings-v4是免费的,但速度却很慢?
keyboard_arrow_down
jina-embeddings-v4 构建于 Qwen2-VL 基础模型之上,该模型以 Qwen 研究许可发布。此许可仅允许研究和非商业用途,这意味着我们无法将 jina-embeddings-v4 作为商业产品提供。因此,我们通过 API 免费提供该模型的访问权限。jina-embeddings-v4 的速度可能比其他模型慢,原因有二:首先,jina-embeddings-v4 的模型比 jina-embeddings-v3 大得多,因此每次请求所需的计算时间也更长。其次,由于我们无法将此模型商业化,我们有意限制了 API 吞吐量以控制基础设施成本。用户在使用 jina-embeddings-v4 API 时,不应期望获得高吞吐量或生产级别的吞吐量。对于需要更高吞吐量的生产工作负载,我们建议使用 jina-embeddings-v3 或通过 Hugging Face 在您自己的基础架构上部署 jina-embeddings-v4。
Embeddings API 的速率限制是多少?
keyboard_arrow_down
速率限制取决于您的 API 密钥类型:

免费版: 100 RPM,100K TPM,2 个并发请求
付费版: 500 RPM,2M TPM,50 个并发请求
高级版: 5,000 RPM,50M TPM,500 个并发请求

此外,为了防止滥用,我们还设置了基于 IP 地址的速率限制,每 60 秒最多 10,000 个请求。如果您需要更高的限制,请联系我们的销售团队。
每个嵌入模型的上下文长度限制是多少?
keyboard_arrow_down
每个模型对每个输入都有最大上下文长度限制:

jina-embeddings-v4: 32,768 个 token
jina-embeddings-v3: 8,192 个 token
jina-embeddings-v2-*: 8,192 个 token
jina-clip-v1/v2: 8,192 个 token
jina-colbert-v1/v2: 8,192 个 token
jina-code-embeddings-*: 32,768 个 token

除非设置了 truncate: true,否则超出限制的输入将返回错误,设置后会自动截断到最大长度。
图片和PDF文件的大小限制是多少?
keyboard_arrow_down
最大文件大小为:图片: 5 MB,PDF: 8 MB。超过此限制的文件将被拒绝并显示错误信息。

如何获取我的 API 密钥?

video_not_supported

速率限制是多少?

速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off免费 API 密钥key使用付费 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s统计整个过程中词元的总数。POST

我需要商业许可证吗?

CC BY-NC 许可证自检

play_arrow
您使用的是我们在 Azure、AWS 还是 GCP 上的官方 API 或官方镜像?
play_arrow
是的
没有任何限制。只需通过我们的网站或云端市场注册并付款即可。
play_arrow
不
play_arrow
您是 Elastic 的付费客户吗?
play_arrow
是的
您的 Elastic 许可证可能已包含商业用途。如有疑问,请联系您的 Elastic 销售代表。
联系销售
play_arrow
不
我们目前无法签发独立的商业许可协议。请联系 Elastic 销售部门了解更多信息。
联系销售
API相关常见问题
code
我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗?
keyboard_arrow_down
是的,同一个 API 密钥适用于 Jina AI 的所有搜索基础产品。这包括读取器、向量模型、重排器、分类器和微调模型 API,所有服务之间共享词元。
code
我可以查看 API 密钥的词元使用情况吗?
keyboard_arrow_down
是的,您可以在“密钥和计费”选项卡中输入您的 API 密钥来查看最近的使用记录和剩余额度。如果您已登录 API 密钥控制面板,也可以在“管理 API 密钥”选项卡中查看这些详细信息。
code
如果我忘记了 API 密钥,该怎么办?
keyboard_arrow_down
如果您遗失了充值密钥并希望找回,请使用您的注册电子邮件联系 support AT jina.ai 寻求帮助。建议登录以便于安全保存和便捷访问您的 API 密钥。
联系我们
code
API 密钥会过期吗?
keyboard_arrow_down
不,我们的 API 密钥没有到期日期。但是,如果您怀疑您的密钥已被泄露并希望停用它,请联系我们的支持团队寻求帮助。您还可以在API 密钥控制面板中自助销毁您的密钥。
联系我们
code
我可以在 API 密钥之间转移额度吗?
keyboard_arrow_down
是的,您可以将剩余的付费额度从一个高级密钥转移到另一个密钥。在API 密钥控制面板上登录您的帐户后,在该密钥的设置界面来转移所有剩余的付费额度。
code
我可以销毁我的 API 密钥吗?
keyboard_arrow_down
是的,如果您认为您的 API 密钥已被泄露,您可以销毁该密钥。销毁密钥将立即为所有存储该密钥的用户禁用该密钥,并且所有剩余额度和关联资产将永久不可用。如果您拥有高级密钥,您可以选择在销毁之前将剩余的已付款额度转移到另一个密钥。请注意,此操作无法撤消。要销毁密钥,请前往API 密钥控制面板中的密钥设置。
code
为什么有些机型第一次请求比较慢?
keyboard_arrow_down
这是因为我们的无服务器架构在使用率较低时会卸载某些模型。初始请求会激活或“预热”模型,这可能需要几秒钟。初始激活后,后续请求的处理速度会快得多。
code
我的API数据是否用于训练你们的模型?
keyboard_arrow_down
不。我们绝不会使用您的 API 请求、输入或输出来训练我们的嵌入模型、重排序模型或任何其他模型。您的数据始终归您所有。我们符合 SOC 2 I 型和 II 型标准。
code
Jina API 的速率限制是多少?
keyboard_arrow_down
每个 API 密钥均有速率限制:

免费版: 100 RPM,100K TPM,2 个并发请求
付费版: 500 RPM,2M TPM,50 个并发请求
高级版: 5,000 RPM,50M TPM,500 个并发请求

此外,还有基于 IP 的速率限制,每 60 秒 10,000 个请求。这些限制适用于所有 Jina API(嵌入式 API、重排序 API、读取器 API 等)。
code
API是否有批量大小限制?
keyboard_arrow_down
Embeddings API 和 Reranker API 均无批次大小限制。您可以根据需要每次请求发送任意数量的项目或文档。这两个 API 都会根据 token 数量对输入进行内部批处理,以实现最佳的 GPU 利用率。
与计费相关的常见问题
attach_money
API是根据句子的数量或请求的数量计费吗?
keyboard_arrow_down
我们的定价模型基于处理的词元总数,允许用户灵活地在任意数量的句子中分配这些词元,为不同的文本分析需求提供经济高效的解决方案。
attach_money
新用户可以免费试用吗?
keyboard_arrow_down
我们为新用户提供免费试用,自动生成的 API 密钥包含一千万个可用于我们任何模型的词元。免费额度用完后,用户可以通过"充值"标签页轻松购买额外的额度。
attach_money
失败的请求是否会扣除词元?
keyboard_arrow_down
不,失败的请求不会扣除词元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通过 Stripe 处理,支持多种付款方式,包括信用卡、Google Pay 和 PayPal,为您提供方便。
attach_money
充值后可以开具发票吗?
keyboard_arrow_down
是的,充值后发票将发送到与您的 Stripe 帐户关联的电子邮件地址。
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, 加州 94085, 美国
location_on
德国柏林
Prinzessinnenstraße 19-20,10969 柏林,德国
搜索底座
读取器
向量模型
重排器
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生项目
下载 Jina 标志
open_in_new
下载 Elastic 徽标
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Elastic Jina AI © 2020-2026.