新闻
模型
API
keyboard_arrow_down
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
MCP terminal命令行articlellms.txtsmart_toy代理人data_object模式menu_book文档



登录
login

读取器

将 URL 转换为大模型友好输入,只需在前面添加 r.jina.ai 即可。


读取器 API

将 URL 转换为大模型友好输入,只需在前面添加 r.jina.ai 即可。
key密钥和计费
code用法
more_horiz更多的
chevron_leftchevron_right

home
speed速率限制
bug_report问题反馈
help_outline常见问题
服务状态
chevron_leftchevron_right

globe_book
使用 r.jina.ai 读取 URL 并获取其内容
travel_explore
使用 s.jina.ai 搜索网络并获取 SERP
添加 mcp.jina.ai 到您的MCP工具箱,让大模型学用我们的API


upload
请求
GET
curl "https://r.jina.ai/https://www.example.com"


Jina VLM:小型多语言视觉语言模型

一个拥有 24 亿参数的视觉语言模型,在开放的 20 亿级视觉语言模型中实现了最先进的多语言视觉问答。
阅读新闻发布稿arrow_forward

ReaderLM v2:从 HTML 到 Markdown 和 JSON 的小型语言模型

ReaderLM-v2 是一个 1.5B 参数语言模型,专门用于 HTML 到 Markdown 的转换和 HTML 到 JSON 的提取。它支持 29 种语言中多达 512K 个词元的文档,准确率比其前身高 20%。
阅读新闻发布稿arrow_forward

什么是读取器?

将网络信息输入大模型是打好基础的重要一步,但这可能很有挑战性。最简单的方法是抓取网页并输入原始 HTML。但是,抓取可能很复杂且经常受阻,而且原始 HTML 中充斥着标记和脚本等无关元素。读取器 API 通过从 URL 中提取核心内容并将其转换为干净的、大模型友好的文本来解决这些问题,从而确保为您的Agent和 RAG 系统提供高质量的输入。



原始 HTML

读取器的输出

用于网页搜索和 SERP 的读取器

Reader 可用作 SERP API。它允许您将搜索结果引擎页面背后的内容提供给您的 LLM。只需在您的查询前面添加 https://s.jina.ai/?q=,Reader 就会搜索网络并返回前五个结果及其 URL 和内容,每个结果都以干净、大模型友好的文本显示。这样,您就可以始终让您的大模型保持最新状态,提高其真实性,并减少幻觉。



info 请注意,与上面的演示不同,在实践中,您不会在网上搜索原始问题来获取基础。人们经常做的是重写原始问题或使用多跳问题。他们读取检索到的结果,然后生成其他查询以根据需要收集更多信息,然后得出最终答案。

读取器也顺便识图!

网页上的图片会使用读取器中的视觉语言模型自动添加标题,并在输出中格式化为图片 alt 标签。这为您的下游大模型提供了足够的提示,以将这些图片纳入其推理和总结过程。这意味着您可以询问有关图片的问题,选择特定的图片,甚至将其 URL 转发到更强大的 VLM 进行更深入的分析!

读取器还可以读取 PDF!

是的,Reader 本身支持 PDF 读取。它兼容大多数 PDF,包括包含大量图片的 PDF,而且速度极快!结合大模型,您可以轻松快速地构建 ChatPDF 或文档分析 AI。
open_in_new原始 PDF
open_in_new读取器结果

而且它是竟然是免费的!

Reader API 可免费使用,并提供灵活的速率限制和定价。它建立在可扩展的基础架构上,具有高可访问性、并发性和可靠性。我们努力成为您大模型的首选基础解决方案。
速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off免费 API 密钥key使用付费 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
别慌!每个新的 API 密钥都包含一千万个免费词元!

API价格表

API 定价基于词元使用情况。一个 API 密钥即可访问所有搜索基础产品。
使用Jina 搜索底座API
访问我们所有产品的最简单方法。随时充值词元。
为此 API 密钥充值
根据您所在的位置,您可能需要支付美元、欧元或其他货币的费用。可能需缴纳税费。
请输入正确的API密钥进行充值
了解速率限制
速率限制是指每个 IP 地址/API 密钥 (RPM) 在一分钟内可以向 API 发出的最大请求数。请在下面详细了解每个产品和层级的速率限制。
keyboard_arrow_down
速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off免费 API 密钥key使用付费 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s统计整个过程中词元的总数。POST

常见问题

使用 读取器 API 的相关费用是多少?
keyboard_arrow_down
阅读器 API 的基本功能免费,只需在 URL 前添加“https://r.jina.ai/”即可。如需更高的速率限制,您可以提供 API 密钥,密钥会根据内容长度收取费用。有关速率限制的详细信息,请参阅问题 16。
读取器 API 如何发挥作用?
keyboard_arrow_down
读取器 API 使用代理来获取任何 URL,并在浏览器中呈现其内容以提取高质量的主要内容。
读取器 API 是开源的吗?
keyboard_arrow_down
是的,读取器 API 是开源的,可以在 Jina AI GitHub 存储库中找到。
读取器 API 的典型延迟是多少?
keyboard_arrow_down
读取器 API 通常会在 2 秒内处理 URL 并返回内容,但复杂或动态的页面可能需要更多时间。
为什么我应该使用 读取器 API 而不是自己抓取页面?
keyboard_arrow_down
抓取可能很复杂且不可靠,尤其是复杂或动态页面。读取器 API 提供简洁、可靠的干净大模型级文本输出。
读取器 API 是否支持多种语言?
keyboard_arrow_down
读取器 API 返回 URL 原始语言的内容。它不提供翻译服务。
如果某个网站屏蔽了 读取器 API,我该怎么办?
keyboard_arrow_down
如果您遇到阻止问题,请联系我们的支持团队寻求帮助和解决方案。
读取器 API 可以从 PDF 文件中提取内容吗?
keyboard_arrow_down
虽然 读取器 API 主要用于网页,但它可以从 arXiv 等网站上以 HTML 格式查看的 PDF 中提取内容,但它并未针对一般 PDF 提取进行优化。
读取器 API 可以处理来自网页的媒体内容吗?
keyboard_arrow_down
是的,Reader 可以使用 `x-with-generated-alt` 头部为网页上的图片添加描述性文字。这会为缺少 alt 标签的图片添加描述性文字,使语言学习者能够理解视觉内容。视频摘要功能计划在未来的版本中推出。
是否可以在本地 HTML 文件上使用 读取器 API?
keyboard_arrow_down
不可以,读取器 API 只能处理来自可公开访问的 URL 的内容。
读取器 API 是否缓存内容?
keyboard_arrow_down
如果您在 5 分钟内请求相同的 URL,读取器 API 将返回缓存的内容。
我可以使用 读取器API 来访问登录后的内容吗?
keyboard_arrow_down
不幸的是没有。
我可以使用读取器 API 访问 arXiv 上的 PDF 吗?
keyboard_arrow_down
是的,您可以使用读取器中的原生 PDF 支持(https://r.jina.ai/https://arxiv.org/pdf/2310.19923v4)或使用 arXiv 中的 HTML 版本(https://r.jina.ai/https://arxiv.org/html/2310.19923v4)
图片标注在读取器中如何发挥作用?
keyboard_arrow_down
Reader 为指定 URL 上的所有图片添加标题,并添加 `Image [idx]: [caption]` 作为 alt 标签(如果最初没有)。这使得下游大模型能够与图片进行推理、总结等交互。
读取器的可扩展性如何?我可以在生产中使用它吗?
keyboard_arrow_down
Reader API 的设计具有高度可扩展性。它根据实时流量自动扩展,最大并发请求数现在约为 4000。我们正在积极维护它,将其作为 Jina AI 的核心产品之一。因此,请放心在生产中使用它。
Reader API 的速率限制是多少?
keyboard_arrow_down
请在下表中查找最新的速率限制信息。请注意,我们正在积极致力于改进 Reader API 的速率限制和性能,因此该表将进行相应更新。
speed速率限制
什么是 Reader-LM?如何使用它?
keyboard_arrow_down
ReaderLM-v2 是我们最新的小型语言模型 (SLM),用于将原始 HTML 转换为简洁的 Markdown 或 JSON。与 v1 相比,它的质量提升了 3 倍,并且可以使用 JSON 模式或自然语言指令提取结构化数据。您可以通过 Reader API 直接使用它,只需添加 x-respond-with: readerlm-v2 标头即可,或者也可以从云市场(AWS、Azure、GCP)部署它。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
如何从网页中提取结构化数据?
keyboard_arrow_down
使用带有 JSON 模式定义的 `x-json-schema` 标头,或使用带有自然语言指令的 `x-instruction` 标头。这两个功能都与 ReaderLM-v2 配合使用,可将任何网页中的特定字段(例如价格、标题、日期等)提取为结构化的 JSON 格式。
Reader 是否会主动绕过网站的反机器人保护?
keyboard_arrow_down
不。Reader 不会主动绕过任何网站的防御机制、反机器人系统或访问控制。如果网站将我们的服务检测为机器人并阻止了请求,我们会尊重这一结果。我们以标准网络客户端的形式运行,不会采用任何旨在规避检测系统的技术。
从免费 API 密钥升级到付费 API 密钥后,我能访问更多网站吗?
keyboard_arrow_down
不。从免费套餐升级到付费 API 密钥并不会授予您访问其他网站的权限或绕过任何网站限制。不同套餐之间的主要区别在于速率限制和性能优化。付费 API 密钥提供更高的请求吞吐量和更快的处理速度,但并不能让您访问屏蔽我们服务的网站。

如何获取我的 API 密钥?

video_not_supported

速率限制是多少?

速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off免费 API 密钥key使用付费 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
API相关常见问题
code
我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗?
keyboard_arrow_down
是的,同一个 API 密钥适用于 Jina AI 的所有搜索基础产品。这包括读取器、向量模型、重排器、分类器和微调模型 API,所有服务之间共享词元。
code
我可以查看 API 密钥的词元使用情况吗?
keyboard_arrow_down
是的,您可以在“密钥和计费”选项卡中输入您的 API 密钥来查看最近的使用记录和剩余额度。如果您已登录 API 密钥控制面板,也可以在“管理 API 密钥”选项卡中查看这些详细信息。
code
如果我忘记了 API 密钥,该怎么办?
keyboard_arrow_down
如果您遗失了充值密钥并希望找回,请使用您的注册电子邮件联系 support AT jina.ai 寻求帮助。建议登录以便于安全保存和便捷访问您的 API 密钥。
联系我们
code
API 密钥会过期吗?
keyboard_arrow_down
不,我们的 API 密钥没有到期日期。但是,如果您怀疑您的密钥已被泄露并希望停用它,请联系我们的支持团队寻求帮助。您还可以在API 密钥控制面板中自助销毁您的密钥。
联系我们
code
我可以在 API 密钥之间转移额度吗?
keyboard_arrow_down
是的,您可以将剩余的付费额度从一个高级密钥转移到另一个密钥。在API 密钥控制面板上登录您的帐户后,在该密钥的设置界面来转移所有剩余的付费额度。
code
我可以销毁我的 API 密钥吗?
keyboard_arrow_down
是的,如果您认为您的 API 密钥已被泄露,您可以销毁该密钥。销毁密钥将立即为所有存储该密钥的用户禁用该密钥,并且所有剩余额度和关联资产将永久不可用。如果您拥有高级密钥,您可以选择在销毁之前将剩余的已付款额度转移到另一个密钥。请注意,此操作无法撤消。要销毁密钥,请前往API 密钥控制面板中的密钥设置。
code
为什么有些机型第一次请求比较慢?
keyboard_arrow_down
这是因为我们的无服务器架构在使用率较低时会卸载某些模型。初始请求会激活或“预热”模型,这可能需要几秒钟。初始激活后,后续请求的处理速度会快得多。
code
我的API数据是否用于训练你们的模型?
keyboard_arrow_down
不。我们绝不会使用您的 API 请求、输入或输出来训练我们的嵌入模型、重排序模型或任何其他模型。您的数据始终归您所有。我们符合 SOC 2 I 型和 II 型标准。
code
Jina API 的速率限制是多少?
keyboard_arrow_down
每个 API 密钥均有速率限制:

免费版: 100 RPM,100K TPM,2 个并发请求
付费版: 500 RPM,2M TPM,50 个并发请求
高级版: 5,000 RPM,50M TPM,500 个并发请求

此外,还有基于 IP 的速率限制,每 60 秒 10,000 个请求。这些限制适用于所有 Jina API(嵌入式 API、重排序 API、读取器 API 等)。
code
API是否有批量大小限制?
keyboard_arrow_down
Embeddings API 和 Reranker API 均无批次大小限制。您可以根据需要每次请求发送任意数量的项目或文档。这两个 API 都会根据 token 数量对输入进行内部批处理,以实现最佳的 GPU 利用率。
与计费相关的常见问题
attach_money
API是根据句子的数量或请求的数量计费吗?
keyboard_arrow_down
我们的定价模型基于处理的词元总数,允许用户灵活地在任意数量的句子中分配这些词元,为不同的文本分析需求提供经济高效的解决方案。
attach_money
新用户可以免费试用吗?
keyboard_arrow_down
我们为新用户提供免费试用,自动生成的 API 密钥包含一千万个可用于我们任何模型的词元。免费额度用完后,用户可以通过"充值"标签页轻松购买额外的额度。
attach_money
失败的请求是否会扣除词元?
keyboard_arrow_down
不,失败的请求不会扣除词元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通过 Stripe 处理,支持多种付款方式,包括信用卡、Google Pay 和 PayPal,为您提供方便。
attach_money
充值后可以开具发票吗?
keyboard_arrow_down
是的,充值后发票将发送到与您的 Stripe 帐户关联的电子邮件地址。
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, 加州 94085, 美国
location_on
德国柏林
Prinzessinnenstraße 19-20,10969 柏林,德国
搜索底座
读取器
向量模型
重排器
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生项目
下载 Jina 标志
open_in_new
下载 Elastic 徽标
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Elastic Jina AI © 2020-2026.