向量模型

Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.

Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.

Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.

针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。

新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

请求

Bash

语言

curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF

API密钥

剩余词元额度

这是您的专属密钥。请安全保存！

v5-omni：一个向量，涵盖所有模态

文本、图像、音频、视频——共享同一个向量空间，两种尺寸。v5-omni-small (16亿) 是参数量为 20 亿时性能最佳的开放权重全向模型。v5-omni-nano (9亿) 在 10 亿以下的参数量下也能提供极具竞争力的检索性能。两者都与 v5-text 完全兼容——无需重新索引。

v5-text：最新最先进的小型多语言向量模型

jina-embeddings-v5-text 以两种高效尺寸（677M 小型模型和 239M 纳米模型）提供第五代向量质量，并具有特定于任务的 LoRA 适配器、Matryoshka 维度、32K 上下文和用于边缘部署的 GGUF/MLX 量化，在 MMTEB、MTEB English 和检索任务中树立了新的基准。

两种购买方式

订阅我们的API或通过云服务提供商购买。

与 3 个云服务提供商合作

您的公司是否在使用 AWS 或 Azure？那么请直接在贵公司的这些平台上私有化部署我们的搜索底座模型，这样您的数据就能保持安全且合规。

使用Jina 搜索底座API

访问我们所有产品的最简单方法。随时充值词元。

输入您要充值的 API 密钥

为此 API 密钥充值

根据您所在的位置，您可能需要支付美元、欧元或其他货币的费用。可能需缴纳税费。

请输入正确的API密钥进行充值

了解速率限制

速率限制是指每个 IP 地址/API 密钥 (RPM) 在一分钟内可以向 API 发出的最大请求数。请在下面详细了解每个产品和层级的速率限制。

速率限制

速率限制通过三种方式跟踪：RPM（每分钟请求数）和TPM（每分钟词元数）。限制按 IP/API 密钥强制执行，当首先达到 RPM 或 TPM 阈值时，将触发限制。当您在请求标头中提供 API 密钥时，我们会按密钥而不是 IP 地址跟踪速率限制。

列

产品	API端口	描述	无 API 密钥	免费 API 密钥	使用付费 API 密钥	带有高级 API 密钥	平均延迟	词元使用计数	请求类型
读取器 API	`https://r.jina.ai`	将 URL 转换为大模型友好文本	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	以输出响应中的词元数量为准。	GET/POST
读取器 API	`https://s.jina.ai`	搜索网络并将结果转换为大模型友好文本		100 RPM	100 RPM	1000 RPM	2.5s	每个请求都需要固定数量的词元，从 10000 个词元开始	GET/POST
向量模型API	`https://api.jina.ai/v1/embeddings`	将文本/图片转为定长向量		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查询对文档进行精排		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
分类器 API	`https://api.jina.ai/v1/train`	使用训练样本训练分类器		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元 × 迭代次数	POST
分类器 API (少量样本)	`https://api.jina.ai/v1/classify`	使用经过训练的少样本分类器对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元	POST
分类器 API (零样本)	`https://api.jina.ai/v1/classify`	使用零样本分类对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元加标签词元	POST
切分器 API	`https://api.jina.ai/v1/segment`	对长文本进行分词分句	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	词元不计算使用量。	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	50 RPM	500 RPM	56.7s	统计整个过程中词元的总数。	POST

余额不足时自动充值

建议用于生产环境不间断的服务。当您的余额低于设定的阈值时，我们将使用您保存的支付方式自动为您充值上次购买的套餐。

我们于 2025 年 5 月 6 日推出了新的定价模式。如果您在此日期之前启用了自动充值，则仍需支付旧价格（即购买时的价格）。新价格仅在您修改自动充值设置或购买新的 API 密钥时适用。

< 1M 词元

当低于此值事充值

私有化部署

在 AWS Sagemaker 和 Microsoft Azure 中部署 Jina Embeddings 模型，并很快在 Google Cloud Services 中部署，或者联系我们的销售团队，为您的虚拟私有云和本地服务器获取定制的 Kubernetes 部署。

AWS SageMaker

向量模型

重排器

Microsoft Azure

向量模型

重排器

Google Cloud

向量模型

API集成

在流行数据库、向量数据库、RAG 和 LLMOps 框架轻松使用我们的向量模型API。首先，只需将您的 API 密钥复制到以下任意集成中即可快速使用我们的模型。

向量数据库

LLM框架

RAG应用

可观察性

MongoDB

DataStax

Qdrant

Pinecone

Chroma

Weaviate

Milvus

Epsilla

MyScale

LlamaIndex

Haystack

Langchain

Dify

SuperDuperDB

DashVector

Portkey

Baseten

TiDB

LanceDB

Carbon

我们的论文

了解我们的前沿搜索模型是如何从头开始训练的，查看我们的最新论文。在 EMNLP、SIGIR、ICLR、NeurIPS 和 ICML 与我们的团队见面！

arXiv

五月 11, 2026

jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

SIGIR 2026

二月 17, 2026

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

ICLR 2026

一月 22, 2026

Embedding Compression via Spherical Coordinates

arXiv

十二月 29, 2025

Vision Encoders in Vision-Language Models: A Survey

ICLR 2026

十二月 04, 2025

Jina-VLM: Small Multilingual Vision Language Model

AAAI 2026

十月 01, 2025

jina-reranker-v3: Last but Not Late Interaction for Document Reranking

NeurIPS 2025

八月 31, 2025

Efficient Code Embeddings from Code Generation Models

EMNLP 2025

六月 24, 2025

jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval

ICLR 2025

三月 04, 2025

ReaderLM-v2: Small Language Model for HTML to Markdown and JSON

ACL 2025

十二月 17, 2024

AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark

ICLR 2025

十二月 12, 2024

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

ECIR 2025

九月 18, 2024

jina-embeddings-v3: Multilingual Embeddings With Task LoRA

SIGIR 2025

九月 07, 2024

Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models

EMNLP 2024

八月 30, 2024

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

WWW 2025

六月 21, 2024

Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models

ICML 2024

五月 30, 2024

Jina CLIP: Your CLIP Model Is Also Your Text Retriever

arXiv

二月 26, 2024

Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings

arXiv

十月 30, 2023

Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents

EMNLP 2023

七月 20, 2023

Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models

共计 19 篇论文。

学习向量模型

什么是向量，为什么要向量化？我们已经为您提供了一些入门文章。通过我们的综合指南从头开始了解向量模型。

重排器、向量搜索和 BM25 的比较

下表提供了重排器、向量搜索和 BM25 的全面比较，突出显示了它们在各个类别中的优缺点。

	重排器	向量搜索	BM25
最适合场景	增强的搜索精度和相关性	初始、快速过滤	跨广泛查询的一般文本检索
粒度	详细：子文档和查询段	广泛：整个文档	中级：各种文本片段
查询时间复杂度	高的	中等的	低的
索引时间复杂度	不需要	高的	低，利用预建索引
训练时间复杂度	高的	高的	不需要
搜索质量	更适合细致入微的查询	效率与准确性之间的平衡	对于广泛的查询来说一致且可靠
优势	高度准确，具有深入的上下文理解	快速高效，准确度适中	高度可扩展，具有既定的功效
	免费试用重排器 API	免费使用向量模型 API

向量模型70年

在您的办公空间或起居室内悬挂一张我们精心制作的海报，在1950年以来文本向量模型的进化和演变中寻找下一个灵感。

了解海报

购买海报

常见问题

Jina嵌入模型是如何训练的？

你们的多模态向量模型是什么？

你们的模型支持哪些语言？

单个句子输入的最大长度是多少？

单个请求中最多可以包含多少个句子？

如何将图像发送到多模态向量模型？

Jina Embeddings 模型与 OpenAI 和 Cohere 的最新向量模型相比如何？

如何从 OpenAI 的 text-embedding-3-large 迁移到 Jina Embeddings 模型？

使用 jina-clip 模型时如何计算 token？

你们提供向量模型图片或音频的模型吗？

Jina 向量模型模型可以使用私人或公司数据进行微调吗？

您的服务可以在 AWS、Azure 或 GCP 上私有化部署吗？

“task”参数是什么？我应该在什么情况下使用它？

什么是延迟交互检索？哪些模型支持这种检索方式？

什么是延迟分块？我应该在什么情况下使用它？

为什么 API 支持的上下文长度与模型的最大容量不同？

为什么jina-embeddings-v4是免费的，但速度却很慢？

Embeddings API 的速率限制是多少？

每个嵌入模型的上下文长度限制是多少？

图片和PDF文件的大小限制是多少？

如何获取我的 API 密钥？

速率限制是多少？

速率限制

列

产品	API端口	描述	无 API 密钥	免费 API 密钥	使用付费 API 密钥	带有高级 API 密钥	平均延迟	词元使用计数	请求类型
读取器 API	`https://r.jina.ai`	将 URL 转换为大模型友好文本	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	以输出响应中的词元数量为准。	GET/POST
读取器 API	`https://s.jina.ai`	搜索网络并将结果转换为大模型友好文本		100 RPM	100 RPM	1000 RPM	2.5s	每个请求都需要固定数量的词元，从 10000 个词元开始	GET/POST
向量模型API	`https://api.jina.ai/v1/embeddings`	将文本/图片转为定长向量		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查询对文档进行精排		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
分类器 API	`https://api.jina.ai/v1/train`	使用训练样本训练分类器		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元 × 迭代次数	POST
分类器 API (少量样本)	`https://api.jina.ai/v1/classify`	使用经过训练的少样本分类器对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元	POST
分类器 API (零样本)	`https://api.jina.ai/v1/classify`	使用零样本分类对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元加标签词元	POST
切分器 API	`https://api.jina.ai/v1/segment`	对长文本进行分词分句	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	词元不计算使用量。	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	50 RPM	500 RPM	56.7s	统计整个过程中词元的总数。	POST

我需要商业许可证吗？

CC BY-NC 许可证自检

您使用的是我们在 Azure、AWS 还是 GCP 上的官方 API 或官方镜像？

是的

不

我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗？

我可以查看 API 密钥的词元使用情况吗？

如果我忘记了 API 密钥，该怎么办？

API 密钥会过期吗？

我可以在 API 密钥之间转移额度吗？

我可以销毁我的 API 密钥吗？

为什么有些机型第一次请求比较慢？

我的API数据是否用于训练你们的模型？

Jina API 的速率限制是多少？

API是否有批量大小限制？

API是根据句子的数量或请求的数量计费吗？

新用户可以免费试用吗？

失败的请求是否会扣除词元？

接受哪些付款方式？

充值后可以开具发票吗？