新闻
模型
产品
keyboard_arrow_down
深度搜索
搜索、读取并推理直到找到最佳答案。
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
更多的
keyboard_arrow_down
分类器
图片和文本的零样本和少样本分类。
切分器
将长文本切分成块或词元。

API 文档
为您的AI 编程助手 IDE 或大模型自动生成代码
open_in_new


公司
keyboard_arrow_down
关于我们
联系销售
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款及条件


登录
login

读取器

将 URL 转换为大模型友好输入,只需在前面添加 r.jina.ai 即可。


读取器 API

将 URL 转换为大模型友好输入,只需在前面添加 r.jina.ai 即可。
key
密钥和计费
code
用法
more_horiz
更多的
chevron_leftchevron_right

home
speed速率限制
bug_report 问题反馈
help_outline常见问题
服务状态
chevron_leftchevron_right

globe_book
使用 r.jina.ai 读取 URL 并获取其内容
travel_explore
使用 s.jina.ai 搜索网络并获取 SERP


upload
请求
GET
curl "https://r.jina.ai/https://example.com"


ReaderLM v2:从 HTML 到 Markdown 和 JSON 的小型语言模型

ReaderLM-v2 是一个 1.5B 参数语言模型,专门用于 HTML 到 Markdown 的转换和 HTML 到 JSON 的提取。它支持 29 种语言中多达 512K 个词元的文档,准确率比其前身高 20%。
读取发行说明arrow_forward

什么是读取器?

将网络信息输入大模型是打好基础的重要一步,但这可能很有挑战性。最简单的方法是抓取网页并输入原始 HTML。但是,抓取可能很复杂且经常受阻,而且原始 HTML 中充斥着标记和脚本等无关元素。读取器 API 通过从 URL 中提取核心内容并将其转换为干净的、大模型友好的文本来解决这些问题,从而确保为您的Agent和 RAG 系统提供高质量的输入。



原始 HTML

读取器的输出

用于网页搜索和 SERP 的读取器

Reader 可用作 SERP API。它允许您将搜索结果引擎页面背后的内容提供给您的 LLM。只需在您的查询前面添加 https://s.jina.ai/?q=,Reader 就会搜索网络并返回前五个结果及其 URL 和内容,每个结果都以干净、LLM 友好的文本显示。这样,您就可以始终让您的 LLM 保持最新状态,提高其真实性,并减少幻觉。



info 请注意,与上面的演示不同,在实践中,您不会在网上搜索原始问题来获取基础。人们经常做的是重写原始问题或使用多跳问题。他们读取检索到的结果,然后生成其他查询以根据需要收集更多信息,然后得出最终答案。

读取器也顺便识图!

网页上的图片会使用读取器中的视觉语言模型自动添加标题,并在输出中格式化为图片 alt 标签。这为您的下游大模型提供了足够的提示,以将这些图片纳入其推理和总结过程。这意味着您可以询问有关图片的问题,选择特定的图片,甚至将其 URL 转发到更强大的 VLM 进行更深入的分析!

读取器还可以读取 PDF!

是的,Reader 本身支持 PDF 读取。它兼容大多数 PDF,包括包含大量图片的 PDF,而且速度极快!结合大模型,您可以轻松快速地构建 ChatPDF 或文档分析 AI。
open_in_new原始 PDF
open_in_new读取器结果

而且它是竟然是免费的!

Reader API 可免费使用,并提供灵活的速率限制和定价。它建立在可扩展的基础架构上,具有高可访问性、并发性和可靠性。我们努力成为您大模型的首选基础解决方案。
速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
别慌!每个新的 API 密钥都包含一千万个免费词元!

API价格表

API 定价基于词元使用情况。一个 API 密钥即可访问所有搜索基础产品。
使用Jina 搜索底座API
访问我们所有产品的最简单方法。随时充值词元。
使用更多词元充值此 API 密钥
根据您所在的位置,您可能需要支付美元、欧元或其他货币的费用。可能需缴纳税费。
请输入正确的API密钥进行充值
了解速率限制
速率限制是指每个 IP 地址/API 密钥 (RPM) 在一分钟内可以向 API 发出的最大请求数。请在下面详细了解每个产品和层级的速率限制。
keyboard_arrow_down
速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST

常见问题

使用 读取器 API 的相关费用是多少?
keyboard_arrow_down
读取器 API 是免费的,不需要 API 密钥。只需在您的 URL 前面添加“https://r.jina.ai/”即可。
读取器 API 如何发挥作用?
keyboard_arrow_down
读取器 API 使用代理来获取任何 URL,并在浏览器中呈现其内容以提取高质量的主要内容。
读取器 API 是开源的吗?
keyboard_arrow_down
是的,读取器 API 是开源的,可以在 Jina AI GitHub 存储库中找到。
读取器 API 的典型延迟是多少?
keyboard_arrow_down
读取器 API 通常会在 2 秒内处理 URL 并返回内容,但复杂或动态的页面可能需要更多时间。
为什么我应该使用 读取器 API 而不是自己抓取页面?
keyboard_arrow_down
抓取可能很复杂且不可靠,尤其是复杂或动态页面。读取器 API 提供简洁、可靠的干净大模型级文本输出。
读取器 API 是否支持多种语言?
keyboard_arrow_down
读取器 API 返回 URL 原始语言的内容。它不提供翻译服务。
如果某个网站屏蔽了 读取器 API,我该怎么办?
keyboard_arrow_down
如果您遇到阻止问题,请联系我们的支持团队寻求帮助和解决方案。
读取器 API 可以从 PDF 文件中提取内容吗?
keyboard_arrow_down
虽然 读取器 API 主要用于网页,但它可以从 arXiv 等网站上以 HTML 格式查看的 PDF 中提取内容,但它并未针对一般 PDF 提取进行优化。
读取器 API 可以处理来自网页的媒体内容吗?
keyboard_arrow_down
目前,读取器 API 不处理媒体内容,但未来的增强功能将包括图片字幕和视频摘要。
是否可以在本地 HTML 文件上使用 读取器 API?
keyboard_arrow_down
不可以,读取器 API 只能处理来自可公开访问的 URL 的内容。
读取器 API 是否缓存内容?
keyboard_arrow_down
如果您在 5 分钟内请求相同的 URL,读取器 API 将返回缓存的内容。
我可以使用 读取器API 来访问登录后的内容吗?
keyboard_arrow_down
不幸的是没有。
我可以使用读取器 API 访问 arXiv 上的 PDF 吗?
keyboard_arrow_down
是的,您可以使用读取器中的原生 PDF 支持(https://r.jina.ai/https://arxiv.org/pdf/2310.19923v4)或使用 arXiv 中的 HTML 版本(https://r.jina.ai/https://arxiv.org/html/2310.19923v4)
图片标注在读取器中如何发挥作用?
keyboard_arrow_down
Reader 为指定 URL 上的所有图片添加标题,并添加 `Image [idx]: [caption]` 作为 alt 标签(如果最初没有)。这使得下游大模型能够与图片进行推理、总结等交互。
读取器的可扩展性如何?我可以在生产中使用它吗?
keyboard_arrow_down
Reader API 的设计具有高度可扩展性。它根据实时流量自动扩展,最大并发请求数现在约为 4000。我们正在积极维护它,将其作为 Jina AI 的核心产品之一。因此,请放心在生产中使用它。
Reader API 的速率限制是多少?
keyboard_arrow_down
请在下表中查找最新的速率限制信息。请注意,我们正在积极致力于改进 Reader API 的速率限制和性能,因此该表将进行相应更新。
speed速率限制
什么是 Reader-LM?如何使用它?
keyboard_arrow_down
Reader-LM 是一种新型小型语言模型 (SLM),专为从开放网络中提取和清理数据而设计。它将原始、嘈杂的 HTML 转换为干净的 markdown,灵感来自 Jina Reader。Reader-LM 注重成本效益和小模型尺寸,既实用又强大。它目前在 AWS、Azure 和 GCP 市场上可用。如果您有特定要求,请通过 sales AT jina.ai 联系我们。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure

如何获取我的 API 密钥?

video_not_supported

速率限制是多少?

速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
API相关常见问题
code
我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗?
keyboard_arrow_down
是的,同一个 API 密钥适用于 Jina AI 的所有搜索基础产品。这包括读取器、向量模型、重排器、分类器和微调模型 API,所有服务之间共享词元。
code
我可以查看 API 密钥的词元使用情况吗?
keyboard_arrow_down
是的,您可以在“密钥和计费”选项卡中输入您的 API 密钥来查看词元最近的使用记录和剩余词元余额。如果您已登录 API 密钥控制面板,也可以在“管理 API 密钥”选项卡中查看这些详细信息。
code
如果我忘记了 API 密钥,该怎么办?
keyboard_arrow_down
如果您遗失了充值密钥并希望找回,请使用您的注册电子邮件联系 support AT jina.ai 寻求帮助。建议登录以便于安全保存和便捷访问您的 API 密钥。
联系我们
code
API 密钥会过期吗?
keyboard_arrow_down
不,我们的 API 密钥没有到期日期。但是,如果您怀疑您的密钥已被泄露并希望停用它,请联系我们的支持团队寻求帮助。您还可以在API 密钥控制面板中自助销毁您的密钥。
联系我们
code
我可以在 API 密钥之间转移词元余额吗?
keyboard_arrow_down
是的,您可以将剩余的付费词元余额从一个高级密钥转移到另一个密钥。在API 密钥控制面板上登录您的帐户后,在该密钥的设置界面来转移所有剩余的付费词元余额。
code
我可以销毁我的 API 密钥吗?
keyboard_arrow_down
是的,如果您认为您的 API 密钥已被泄露,您可以销毁该密钥。销毁密钥将立即为所有存储该密钥的用户禁用该密钥,并且所有剩余词元余额和关联资产将永久不可用。如果您拥有高级密钥,您可以选择在销毁之前将剩余的已付款词元余额转移到另一个密钥。请注意,此操作无法撤消。要销毁密钥,请前往API 密钥控制面板中的密钥设置。
code
为什么有些机型第一次请求比较慢?
keyboard_arrow_down
这是因为我们的无服务器架构在使用率较低时会卸载某些模型。初始请求会激活或“预热”模型,这可能需要几秒钟。初始激活后,后续请求的处理速度会快得多。
code
用户输入数据是否用于训练您的模型?
keyboard_arrow_down
我们遵守严格的隐私政策,不会使用用户输入数据来训练我们的模型。我们还符合 SOC 2 类型 I 和类型 II 标准,确保高标准的安全性和隐私性。
与计费相关的常见问题
attach_money
API是根据句子的数量或请求的数量计费吗?
keyboard_arrow_down
我们的定价模型基于处理的词元总数,允许用户灵活地在任意数量的句子中分配这些词元,为不同的文本分析需求提供经济高效的解决方案。
attach_money
新用户可以免费试用吗?
keyboard_arrow_down
我们为新用户提供免费试用,其中包含一千万个可用于我们任何模型的词元,并通过自动生成的 API 密钥进行兑换。免费词元用完后,用户可以通过“购买词元”标签页轻松购买额外的词元,用于 API 密钥。
attach_money
失败的请求是否会扣除词元?
keyboard_arrow_down
不,失败的请求不会扣除词元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通过 Stripe 处理,支持多种付款方式,包括信用卡、Google Pay 和 PayPal,为您提供方便。
attach_money
词元购买后可以开具发票吗?
keyboard_arrow_down
是的,购买词元后,发票将发送到与您的 Stripe 帐户关联的电子邮件地址。
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, CA 94085, 美国
location_on
德国柏林(总部)
Prinzessinnenstraße 19-20,10969 柏林,德国
location_on
中国北京
中国北京市海淀区西大街48号6号楼5层
location_on
中国深圳
中国深圳市赋安科技大厦4楼402
搜索底座
深度搜索
读取器
向量模型
重排器
分类器
切分器
API 文档
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Jina AI © 2020-2025.