深度搜索

搜索、读取并推理直到找到最佳答案。

质量控制

在深度搜索中，通常存在一个权衡：系统执行的步骤越多，获得的结果质量就越高，但同时也会消耗更多词元。这种质量的提升源于更广泛、更详尽的搜索和更深入的反思。四个主要参数控制深度搜索的质量：budget_tokens、max_attempts、team_size 和 reasoning_effort。reasoning_effort 参数本质上是 budget_tokens 和 max_attempts 的预设组合，并经过了精心调整。对于大多数用户来说，调整 reasoning_effort 是最简单的方法。

预算词元

budget_tokens 设置整个深度搜索过程中允许的最大词元数量。这涵盖了所有操作，包括网页搜索、读取网页、反思、摘要和编码。预算越大，响应质量自然也就越好。当预算耗尽或找到满意答案时（以先到者为准），深度搜索过程将停止。如果预算先耗尽，您仍然会得到答案，但这可能不是最终的、完全优化的响应，因为它尚未通过max_attempts定义的所有质量检查。

最大尝试次数

max_attempts决定了系统在深度搜索过程中重试解决问题的次数。每次深度搜索生成答案时，它都必须通过内部评估器定义的某些质量测试。如果答案未通过这些测试，评估器会提供反馈，系统会使用此反馈继续搜索和优化答案。将max_attempts设置得太低意味着您可以快速获得结果，但质量可能会受到影响，因为答案可能无法通过所有质量检查。将其设置得太高可能会使流程陷入无休止的重试循环，不断尝试并失败。

当budget_tokens或max_attempts超出（以先发生者为准），或者答案通过所有测试且仍有剩余预算和尝试次数时，系统会返回最终答案。

团队规模

team_size对质量的影响方式与max_attempts和budget_tokens截然不同。当team_size设置为大于1时，系统会将原始问题分解为子问题，并分别进行研究。可以将其想象成Map-Reduce模式，将大型作业分解为并行运行的较小任务。最终答案是每个工作者结果的综合。我们称之为team_size，因为它模拟了一个研究团队，其中多个智能体调查同一问题的不同方面并协作完成最终报告。

请记住，所有智能体的词元消耗都会计入您的budget_tokens总数，但每个智能体都有独立的max_attempts。这意味着，如果team_size较大，但budget_tokens相同，由于预算限制，智能体可能会比预期更快地返回答案。我们建议同时增加team_size和budget_tokens，以便为每个智能体提供足够的资源来完成全面的工作。

最后，您可以将team_size视为控制搜索广度的因素——它决定了要研究的不同方面的数量。同时，budget_tokens和max_attempts控制搜索的深度——即对每个方面的探索程度。

信息来源控制

深度搜索高度依赖基础信息——它所使用的信息来源。质量不仅仅关乎算法的深度和广度；深度搜索获取信息的来源也同样重要，而且往往是决定性因素。让我们来探索一下控制这一点的关键参数。

不直接回答

no_direct_answer 是一个简单的开关，它可以阻止系统在步骤 1 返回答案。启用后，它会禁用系统使用内部知识的能力，并强制其始终首先搜索网页。启用此功能会使系统“过度思考”，即使是像“今天星期几”、“你好吗”这样的简单问题，或者像“谁是美国第 40 任总统”这样的基本事实知识，这些知识肯定存在于模型的训练数据中。

域名控制

三个参数——boost_hostnames、bad_hostnames 和 only_hostnames——告诉深度搜索哪些网页需要优先处理、避免或专门使用。要理解这些机制的工作原理，请回顾一下深度搜索中的搜索和读取流程：

搜索阶段：系统搜索网络并检索包含其摘要的网站 URL 列表
选择阶段：系统决定实际访问哪些 URL（由于时间和成本限制，系统不会访问所有 URL）

boost_hostnames：此处列出的域名优先级更高，更有可能被访问
bad_hostnames：这些域名永远不会被访问
only_hostnames：定义后，只有与这些域名匹配的 URL 才会被访问

以下是一些关于域名参数的重要说明。首先，系统始终使用搜索引擎返回的摘要作为构建推理链的初始线索。这些域名参数仅影响系统访问的网页，而不会影响其如何制定搜索查询。

其次，如果收集到的 URL 不包含 only_hostnames 中指定的域名，系统可能会完全停止读取网页。我们建议仅在您熟悉研究问题并了解潜在答案可能出现的位置（或绝对不应该出现的位置）时才使用这些参数。

特殊情况：学术研究

对于学术研究，您可能希望将搜索和读取限制在 arxiv.org 上。在这种情况下，只需设置 "search_provider": "arxiv"，所有内容都将以 arxiv 作为唯一来源。但是，对于一般性或琐碎的问题，此限制可能无法获得有效的答案，因此仅将 "search_provider": "arxiv" 用于严肃的学术研究。

搜索语言代码

search_language_code 是另一个影响网络资源的参数，它会强制系统以特定语言生成查询，而不管原始输入或中间推理步骤如何。通常，系统会自动确定查询语言以获得最佳搜索覆盖率，但有时手动控制也很有用。

语言控制用例

国际市场调研：在研究本地品牌或公司在国际市场的影响力时，您可以强制查询始终使用英语（使用 "search_language_code": "en" 来实现全球覆盖），或者使用本地语言来获取更具针对性的地区信息。

使用非英语提示进行全球调研：如果您的输入始终使用中文或日语（因为您的最终用户主要使用这些语言），但您的调研范围是全球性的，而不仅仅是本地的中文或日语网站，则系统可能会自动倾向于使用您提示的语言。使用此参数可以强制使用英语查询，以实现更广泛的国际覆盖率。

与深度搜索聊天

在简单的聊天界面里看看深度搜索地不地道。深度搜索最适合需要迭代推理、世界知识或最新信息的复杂问题。

我们刚刚推出了一款全新的深度搜索UI，它速度快、简洁且免费。请访问 https://search.jina.ai 查看或单击下面的按钮尝试一下！访问新 UI

聊天客户端

为了获得最佳体验，我们建议使用专业的聊天客户端。深度搜索与 OpenAI 的聊天 API 架构完全兼容，因此可以轻松与任何兼容 OpenAI 的客户端一起使用。

API 端口

模型名称

API 密钥

Chatwise

Cherry Studio

Chatbox

LobeChat

NextChat

什么是深度搜索？

深度搜索结合了网络搜索、读取和推理，可进行全面调查。您可以将其视为一个智能体，接受您的研究任务 - 它会进行广泛搜索并经过多次迭代，然后给出答案。

大模型

约 1000 个词元

约1秒

常识问题的快速答案

无法获取实时或训练后的信息

答案完全由预先训练的知识生成，具有固定的截止日期

RAG范式和带搜索的大模型

约 10,000 个词元

约 3 秒

需要当前或特定领域信息的问题

解决需要多跳推理的复杂问题

通过汇总单次搜索结果生成的答案

能够获取训练截止时间以外的当前信息

深度搜索

约 500,000 个词元

约50秒

需要深入研究和推理的复杂问题

比简单的大模型或 RAG 方法花费的时间更长

自主智能体，可反复搜索、读取和推理

根据当前发现动态决定下一步行动

在返回结果之前自我评估答案质量

可以通过多次搜索和推理循环深入研究主题

API价格表

API 定价基于词元使用情况。一个 API 密钥即可访问所有搜索基础产品。

使用Jina 搜索底座API

访问我们所有产品的最简单方法。随时充值词元。

输入您要充值的 API 密钥

使用更多词元充值此 API 密钥

根据您所在的位置，您可能需要支付美元、欧元或其他货币的费用。可能需缴纳税费。

请输入正确的API密钥进行充值

了解速率限制

速率限制是指每个 IP 地址/API 密钥 (RPM) 在一分钟内可以向 API 发出的最大请求数。请在下面详细了解每个产品和层级的速率限制。

速率限制

速率限制通过三种方式跟踪：RPM（每分钟请求数）和TPM（每分钟词元数）。限制按 IP/API 密钥强制执行，当首先达到 RPM 或 TPM 阈值时，将触发限制。当您在请求标头中提供 API 密钥时，我们会按密钥而不是 IP 地址跟踪速率限制。

列

产品	API端口	描述	无 API 密钥	使用 API 密钥	带有高级 API 密钥	平均延迟	词元使用计数	请求类型
读取器 API	`https://r.jina.ai`	将 URL 转换为大模型友好文本	20 RPM	500 RPM	5000 RPM	7.9s	以输出响应中的词元数量为准。	GET/POST
读取器 API	`https://s.jina.ai`	搜索网络并将结果转换为大模型友好文本		100 RPM	1000 RPM	2.5s	每个请求都需要固定数量的词元，从 10000 个词元开始	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	500 RPM	56.7s	统计整个过程中词元的总数。	POST
向量模型API	`https://api.jina.ai/v1/embeddings`	将文本/图片转为定长向量		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查询对文档进行精排		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
分类器 API	`https://api.jina.ai/v1/train`	使用训练样本训练分类器		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	取决于输入大小	词元计数为：输入词元 × 迭代次数	POST
分类器 API (少量样本)	`https://api.jina.ai/v1/classify`	使用经过训练的少样本分类器对输入进行分类		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	取决于输入大小	词元计数为：输入词元	POST
分类器 API (零样本)	`https://api.jina.ai/v1/classify`	使用零样本分类对输入进行分类		200 RPM & 500,000 TPM	1,000 RPM & 3,000,000 TPM	取决于输入大小	词元计数为：输入词元加标签词元	POST
切分器 API	`https://api.jina.ai/v1/segment`	对长文本进行分词分句	20 RPM	200 RPM	1,000 RPM	0.3s	词元不计算使用量。	GET/POST

当词元余额低时自动充值低

建议用于生产环境不间断的服务。当您的词元余额低于设定的阈值时，我们将使用您保存的支付方式自动为您充值上次购买的套餐，直到达到阈值。

我们于 2025 年 5 月 6 日推出了新的定价模式。如果您在此日期之前启用了自动充值，则仍需支付旧价格（即购买时的价格）。新价格仅在您修改自动充值设置或购买新的 API 密钥时适用。

< 1M 词元

当低于此值事充值

常见问题

什么是深度搜索？

深度搜索与 OpenAI 和 Gemini 的深度研究能力有何不同？

我需要什么 API 密钥来使用 DeepResearch？

当深度搜索达到其词元预算时会发生什么？它会返回不完整的答案吗？

深度搜索能保证答案的准确性吗？

一次典型的深度搜索查询需要多长时间？

深度搜索可以与任何与 OpenAI 兼容的客户端（如 Chatwise、CherryStudio 或 ChatBox）配合使用吗？

API 的速率限制是多少？

<think>标签里面的内容是什么？

深度搜索是否使用 Jina Reader 进行网页搜索和读取？

为什么深度搜索对我的查询使用这么多标记？

有没有办法控制或限制步数？

答案中的参考文献有多可靠？

深度搜索能处理有关未来事件的问题吗？

如何获取我的 API 密钥？

速率限制是多少？

速率限制

列

产品	API端口	描述	无 API 密钥	使用 API 密钥	带有高级 API 密钥	平均延迟	词元使用计数	请求类型
读取器 API	`https://r.jina.ai`	将 URL 转换为大模型友好文本	20 RPM	500 RPM	5000 RPM	7.9s	以输出响应中的词元数量为准。	GET/POST
读取器 API	`https://s.jina.ai`	搜索网络并将结果转换为大模型友好文本		100 RPM	1000 RPM	2.5s	每个请求都需要固定数量的词元，从 10000 个词元开始	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	500 RPM	56.7s	统计整个过程中词元的总数。	POST
向量模型API	`https://api.jina.ai/v1/embeddings`	将文本/图片转为定长向量		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查询对文档进行精排		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	取决于输入大小	以输入请求中的词元数量为准。	POST
分类器 API	`https://api.jina.ai/v1/train`	使用训练样本训练分类器		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	取决于输入大小	词元计数为：输入词元 × 迭代次数	POST
分类器 API (少量样本)	`https://api.jina.ai/v1/classify`	使用经过训练的少样本分类器对输入进行分类		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	取决于输入大小	词元计数为：输入词元	POST
分类器 API (零样本)	`https://api.jina.ai/v1/classify`	使用零样本分类对输入进行分类		200 RPM & 500,000 TPM	1,000 RPM & 3,000,000 TPM	取决于输入大小	词元计数为：输入词元加标签词元	POST
切分器 API	`https://api.jina.ai/v1/segment`	对长文本进行分词分句	20 RPM	200 RPM	1,000 RPM	0.3s	词元不计算使用量。	GET/POST

我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗？

我可以查看 API 密钥的词元使用情况吗？

如果我忘记了 API 密钥，该怎么办？

API 密钥会过期吗？

我可以在 API 密钥之间转移词元余额吗？

我可以销毁我的 API 密钥吗？

为什么有些机型第一次请求比较慢？

用户输入数据是否用于训练您的模型？

API是根据句子的数量或请求的数量计费吗？

新用户可以免费试用吗？

失败的请求是否会扣除词元？

接受哪些付款方式？

词元购买后可以开具发票吗？

深度搜索

深度搜索 API

深度搜索参数指南

质量控制

预算词元

最大尝试次数

团队规模

信息来源控制

不直接回答

域名控制

特殊情况：学术研究

搜索语言代码

语言控制用例

与深度搜索聊天

什么是深度搜索？

大模型

RAG范式和带搜索的大模型

深度搜索

API价格表

常见问题

如何获取我的 API 密钥？

速率限制是多少？