读取器

将 URL 转换为 LLM 友好的输入格式，方法是在 URL 前添加 r.jina.ai。

Jina VLM：小型多语言视觉语言模型

一个拥有 24 亿参数的视觉语言模型，在开放的 20 亿级视觉语言模型中实现了最先进的多语言视觉问答。

ReaderLM v2：从 HTML 到 Markdown 和 JSON 的小型语言模型

ReaderLM-v2 是一个 1.5B 参数语言模型，专门用于 HTML 到 Markdown 的转换和 HTML 到 JSON 的提取。它支持 29 种语言中多达 512K 个词元的文档，准确率比其前身高 20%。

将网页信息导入LLM系统是基础架构构建的重要步骤，但也可能充满挑战。最简单的方法是抓取网页并导入原始HTML代码。然而，网页抓取可能很复杂且经常被屏蔽，而原始HTML代码又包含大量无关元素，例如标记和脚本。Reader API通过从URL中提取核心内容并将其转换为简洁、适合LLM系统的文本来解决这些问题，从而确保为您的代理和RAG系统提供高质量的输入。Reader API是一个开发者基础架构：它将您提供的URL转换为适合LLM系统的文本，以便您可以构建自己的搜索、RAG和代理系统。它并非面向消费者的搜索引擎，不会代表您索引或排名网页；您可以控制哪些URL会被处理，并负责如何使用输出结果。

输入您的 URL

点击下面直接获取页面源代码

读取器网址

点击下面通过我们的读取器 API 获取内容

原始 HTML

读取器的输出

提出问题

输入问题并将其与获取的大模型内容相结合以生成答案

用于网页搜索和 SERP 的读取器

Reader 可用作 SERP API。它允许您将搜索结果引擎页面背后的内容提供给您的 LLM。只需在您的查询前面添加 https://s.jina.ai/?q=，Reader 就会搜索网络并返回前五个结果及其 URL 和内容，每个结果都以干净、大模型友好的文本显示。这样，您就可以始终让您的大模型保持最新状态，提高其真实性，并减少幻觉。

输入您的查询

输入需要最新信息或世界知识的问题。

读取器网址

如果您在代码中使用此 URL，请不要忘记对该 URL 进行编码。

请注意，与上面的演示不同，在实践中，您不会在网上搜索原始问题来获取基础。人们经常做的是重写原始问题或使用多跳问题。他们读取检索到的结果，然后生成其他查询以根据需要收集更多信息，然后得出最终答案。

读取器也顺便识图！

网页上的图片会使用读取器中的视觉语言模型自动添加标题，并在输出中格式化为图片 alt 标签。这为您的下游大模型提供了足够的提示，以将这些图片纳入其推理和总结过程。这意味着您可以询问有关图片的问题，选择特定的图片，甚至将其 URL 转发到更强大的 VLM 进行更深入的分析！

读取器还可以读取 PDF！

是的，Reader 本身支持 PDF 读取。它兼容大多数 PDF，包括包含大量图片的 PDF，而且速度极快！结合大模型，您可以轻松快速地构建 ChatPDF 或文档分析 AI。

原始 PDF

读取器结果

而且它是竟然是免费的！

Reader API 可免费使用，并提供灵活的速率限制和定价。它建立在可扩展的基础架构上，具有高可访问性、并发性和可靠性。我们努力成为您大模型的首选基础解决方案。

速率限制

速率限制通过三种方式跟踪：RPM（每分钟请求数）和TPM（每分钟词元数）。限制按 IP/API 密钥强制执行，当首先达到 RPM 或 TPM 阈值时，将触发限制。当您在请求标头中提供 API 密钥时，我们会按密钥而不是 IP 地址跟踪速率限制。

列

产品	API端口	描述	无 API 密钥	免费 API 密钥	使用付费 API 密钥	带有高级 API 密钥	平均延迟	词元使用计数	请求类型
读取器 API	`https://r.jina.ai`	将 URL 转换为大模型友好文本	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	以输出响应中的词元数量为准。	GET/POST
读取器 API	`https://s.jina.ai`	搜索网络并将结果转换为大模型友好文本		100 RPM	100 RPM	1000 RPM	2.5s	每个请求都需要固定数量的词元，从 10000 个词元开始	GET/POST
向量模型API	`https://api.jina.ai/v1/embeddings`	将文本/图片转为定长向量		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查询对文档进行精排		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
分类器 API	`https://api.jina.ai/v1/train`	使用训练样本训练分类器		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元 × 迭代次数	POST
分类器 API (少量样本)	`https://api.jina.ai/v1/classify`	使用经过训练的少样本分类器对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元	POST
分类器 API (零样本)	`https://api.jina.ai/v1/classify`	使用零样本分类对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元加标签词元	POST
切分器 API	`https://api.jina.ai/v1/segment`	对长文本进行分词分句	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	词元不计算使用量。	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	50 RPM	500 RPM	56.7s	统计整个过程中词元的总数。	POST

别慌！每个新的 API 密钥都包含一千万个免费词元！

API价格表

API 定价基于词元使用情况。一个 API 密钥即可访问所有搜索基础产品。

使用Jina 搜索底座API

访问我们所有产品的最简单方法。随时充值词元。

输入您要充值的 API 密钥

为此 API 密钥充值

根据您所在的位置，您可能需要支付美元、欧元或其他货币的费用。可能需缴纳税费。

请输入正确的API密钥进行充值

了解速率限制

速率限制是指每个 IP 地址/API 密钥 (RPM) 在一分钟内可以向 API 发出的最大请求数。请在下面详细了解每个产品和层级的速率限制。

速率限制

列

产品	API端口	描述	无 API 密钥	免费 API 密钥	使用付费 API 密钥	带有高级 API 密钥	平均延迟	词元使用计数	请求类型
读取器 API	`https://r.jina.ai`	将 URL 转换为大模型友好文本	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	以输出响应中的词元数量为准。	GET/POST
读取器 API	`https://s.jina.ai`	搜索网络并将结果转换为大模型友好文本		100 RPM	100 RPM	1000 RPM	2.5s	每个请求都需要固定数量的词元，从 10000 个词元开始	GET/POST
向量模型API	`https://api.jina.ai/v1/embeddings`	将文本/图片转为定长向量		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查询对文档进行精排		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
分类器 API	`https://api.jina.ai/v1/train`	使用训练样本训练分类器		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元 × 迭代次数	POST
分类器 API (少量样本)	`https://api.jina.ai/v1/classify`	使用经过训练的少样本分类器对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元	POST
分类器 API (零样本)	`https://api.jina.ai/v1/classify`	使用零样本分类对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元加标签词元	POST
切分器 API	`https://api.jina.ai/v1/segment`	对长文本进行分词分句	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	词元不计算使用量。	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	50 RPM	500 RPM	56.7s	统计整个过程中词元的总数。	POST

余额不足时自动充值

建议用于生产环境不间断的服务。当您的余额低于设定的阈值时，我们将使用您保存的支付方式自动为您充值上次购买的套餐。

我们于 2025 年 5 月 6 日推出了新的定价模式。如果您在此日期之前启用了自动充值，则仍需支付旧价格（即购买时的价格）。新价格仅在您修改自动充值设置或购买新的 API 密钥时适用。

< 1M 词元

当低于此值事充值

常见问题

使用读取器 API 的相关费用是多少？

读取器 API 如何发挥作用？

读取器 API 是开源的吗？

读取器 API 的典型延迟是多少？

为什么我应该使用读取器 API 而不是自己抓取页面？

读取器 API 是否支持多种语言？

Reader API 是否遵循网站访问控制？

读取器 API 可以从 PDF 文件中提取内容吗？

读取器 API 可以处理来自网页的媒体内容吗？

是否可以在本地 HTML 文件上使用读取器 API？

读取器 API 是否缓存内容？

我可以使用读取器API 来访问登录后的内容吗？

我可以使用读取器 API 访问 arXiv 上的 PDF 吗？

图片标注在读取器中如何发挥作用？

读取器的可扩展性如何？我可以在生产中使用它吗？

Reader API 的速率限制是多少？

什么是 Reader-LM？如何使用它？

如何从网页中提取结构化数据？

Reader 是否会主动绕过网站的反机器人保护？

从免费 API 密钥升级到付费 API 密钥后，我能访问更多网站吗？

如何获取我的 API 密钥？

速率限制是多少？

速率限制

列

产品	API端口	描述	无 API 密钥	免费 API 密钥	使用付费 API 密钥	带有高级 API 密钥	平均延迟	词元使用计数	请求类型
读取器 API	`https://r.jina.ai`	将 URL 转换为大模型友好文本	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	以输出响应中的词元数量为准。	GET/POST
读取器 API	`https://s.jina.ai`	搜索网络并将结果转换为大模型友好文本		100 RPM	100 RPM	1000 RPM	2.5s	每个请求都需要固定数量的词元，从 10000 个词元开始	GET/POST
向量模型API	`https://api.jina.ai/v1/embeddings`	将文本/图片转为定长向量		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查询对文档进行精排		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
分类器 API	`https://api.jina.ai/v1/train`	使用训练样本训练分类器		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元 × 迭代次数	POST
分类器 API (少量样本)	`https://api.jina.ai/v1/classify`	使用经过训练的少样本分类器对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元	POST
分类器 API (零样本)	`https://api.jina.ai/v1/classify`	使用零样本分类对输入进行分类		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取决于输入大小	词元计数为：输入词元加标签词元	POST
切分器 API	`https://api.jina.ai/v1/segment`	对长文本进行分词分句	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	词元不计算使用量。	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	50 RPM	500 RPM	56.7s	统计整个过程中词元的总数。	POST

我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗？

我可以查看 API 密钥的词元使用情况吗？

如果我忘记了 API 密钥，该怎么办？

API 密钥会过期吗？

我可以在 API 密钥之间转移额度吗？

我可以销毁我的 API 密钥吗？

为什么有些机型第一次请求比较慢？

我的API数据是否用于训练你们的模型？

Jina API 的速率限制是多少？

API是否有批量大小限制？

API是根据句子的数量或请求的数量计费吗？

新用户可以免费试用吗？

失败的请求是否会扣除词元？

接受哪些付款方式？

充值后可以开具发票吗？