新闻
模型
产品
keyboard_arrow_down
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
深度搜索
搜索、读取并推理直到找到最佳答案。
更多的
keyboard_arrow_down
分类器
图片和文本的零样本和少样本分类。
切分器
将长文本切分成块或词元。

API 文档
为您的AI 编程助手 IDE 或大模型自动生成代码
open_in_new


公司
keyboard_arrow_down
关于我们
联系销售
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款及条件


登录
login

深度搜索

搜索、读取并推理直到找到最佳答案。

play_arrow演示

深度搜索 API

与 OpenAI 的聊天 API 模式完全兼容,只需将 api.openai.com 与 deepsearch.jina.ai 交换即可开始。
key
密钥和计费
code
用量
more_horiz
更多的
chevron_leftchevron_right

home
speed速率限制
bug_report 问题反馈
help_outline常见问题
api
服务状态
chevron_leftchevron_right

与深度搜索聊天
在简单的聊天界面里看看深度搜索地不地道。深度搜索最适合需要迭代推理、世界知识或最新信息的复杂问题。
open_in_new
消息
用户和助手之间迄今为止的对话的消息列表。
附加图片/文档
支持不同的消息类型(模态),如文本(.txt、.pdf)、图片(.png、.webp、.jpeg)。支持的文件最大为 10MB,并且必须预先编码为数据 URI。
{
  "role": "user",
  "content": "hi"
}

upload
请求
curl https://deepsearch.jina.ai/v1/chat/completions \
  -H "Content-Type: application/json"\
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "model": "jina-deepsearch-v1",
    "messages": [
        {
            "role": "user",
            "content": "Hi!"
        },
        {
            "role": "assistant",
            "content": "Hi, how can I help you?"
        },
        {
            "role": "user",
            "content": "what's the latest blog post from jina ai?"
        }
    ],
    "stream": true,
    "reasoning_effort": "medium"
  }
EOFEOF


info
这是流的最后一部分,其中包含最终答案、访问过的 URL 和词元使用情况。单击上面的按钮可获取实时响应。
download
响应
fiber_manual_record 200 OK
timer
0.0 s
straighten
196,526 词元
{
  "id": "1742181758589",
  "object": "chat.completion.chunk",
  "created": 1742181758,
  "model": "jina-deepsearch-v1",
  "system_fingerprint": "fp_1742181758589",
  "choices": [
    {
      "index": 0,
      "delta": {
        "content": "The latest blog post from Jina AI is titled \"Snippet Selection and URL Ranking in DeepSearch/DeepResearch,\" published on March 12, 2025 [^1]. This post discusses how to improve the quality of DeepSearch by using late-chunking embeddings for snippet selection and rerankers to prioritize URLs before crawling. You can read the full post here: https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch\n\n[^1]: Since our DeepSearch release on February 2nd 2025 we ve discovered two implementation details that greatly improved quality In both cases multilingual embeddings and rerankers are used in an in context manner operating at a much smaller scale than the traditional pre computed indices these models typically require  [jina.ai](https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch)",
        "type": "text",
        "annotations": [
          {
            "type": "url_citation",
            "url_citation": {
              "title": "Snippet Selection and URL Ranking in DeepSearch/DeepResearch",
              "exactQuote": "Since our DeepSearch release on February 2nd 2025, we've discovered two implementation details that greatly improved quality. In both cases, multilingual embeddings and rerankers are used in an _\"in-context\"_ manner - operating at a much smaller scale than the traditional pre-computed indices these models typically require.",
              "url": "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
              "dateTime": "2025-03-13 06:48:01"
            }
          }
        ]
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 169670,
    "completion_tokens": 27285,
    "total_tokens": 196526
  },
  "visitedURLs": [
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/utils/url-tools.ts",
    "https://huggingface.co/jinaai/jina-embeddings-v3",
    "https://github.com/jina-ai/reader",
    "https://zilliz.com/blog/training-text-embeddings-with-jina-ai",
    "https://threads.net/@unwind_ai/post/DGmhWCVswbe/media",
    "https://twitter.com/JinaAI_/status/1899840196507820173",
    "https://jina.ai/news?tag=tech-blog",
    "https://docs.llamaindex.ai/en/stable/examples/embeddings/jinaai_embeddings",
    "https://x.com/jinaai_",
    "https://x.com/JinaAI_/status/1899840202358784170",
    "https://tracxn.com/d/companies/jina-ai/__IQ81fOnU0FsDpagFjG-LrG0DMWHELqI6znTumZBQF-A/funding-and-investors",
    "https://jina.ai/models",
    "https://linkedin.com/posts/imohitmayank_jinaai-has-unveiled-the-ultimate-developer-activity-7300401711242711040-VD64",
    "https://medium.com/@tossy21/trying-out-jina-ais-node-deepresearch-c5b55d630ea6",
    "https://huggingface.co/jinaai/jina-clip-v2",
    "https://arxiv.org/abs/2409.10173",
    "https://milvus.io/docs/embed-with-jina.md",
    "https://seedtable.com/best-startups-in-china",
    "https://threads.net/@sung.kim.mw/post/DGhG-J_vREu/jina-ais-a-practical-guide-to-implementing-deepsearchdeepresearchthey-cover-desi",
    "https://elastic.co/search-labs/blog/jina-ai-embeddings-rerank-model-open-inference-api",
    "http://status.jina.ai/",
    "https://apidog.com/blog/recreate-openai-deep-research",
    "https://youtube.com/watch?v=QxHE4af5BQE",
    "https://sdxcentral.com/articles/news/cisco-engages-businesses-on-ai-strategies-at-greater-bay-area-2025/2025/02",
    "https://aws.amazon.com/blogs/machine-learning/build-rag-applications-using-jina-embeddings-v2-on-amazon-sagemaker-jumpstart",
    "https://reddit.com/r/perplexity_ai/comments/1ejbdqa/fastest_open_source_ai_search_engine",
    "https://search.jina.ai/",
    "https://sebastian-petrus.medium.com/build-openais-deep-research-open-source-alternative-4f21aed6d9f0",
    "https://medium.com/@elmo92/jina-reader-transforming-web-content-to-feed-llms-d238e827cc27",
    "https://openai.com/index/introducing-deep-research",
    "https://python.langchain.com/docs/integrations/tools/jina_search",
    "https://varindia.com/news/meta-is-in-talks-for-usd200-billion-ai-data-center-project",
    "https://varindia.com/news/Mira-Murati%E2%80%99s-new-AI-venture-eyes-$9-billion-valuation",
    "https://53ai.com/news/RAG/2025031401342.html",
    "https://arxiv.org/abs/2409.04701",
    "https://bigdatawire.com/this-just-in/together-ai-raises-305m-series-b-to-power-ai-model-training-and-inference",
    "https://github.blog/",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/MvwT9enRT7gOESHA_tpRj.jpeg",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/JNs_DrpFbr6ok_pSRUK4j.jpeg",
    "https://app.dealroom.co/lists/33530",
    "https://api-docs.deepseek.com/news/news250120",
    "https://sdxcentral.com/articles/news/ninjaone-raises-500-million-valued-at-5-billion/2025/02",
    "https://linkedin.com/sharing/share-offsite?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://twitter.com/intent/tweet?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://platform.openai.com/docs/api-reference/chat/create",
    "https://mp.weixin.qq.com/s/-pPhHDi2nz8hp5R3Lm_mww",
    "https://huggingface.us17.list-manage.com/subscribe?id=9ed45a3ef6&u=7f57e683fa28b51bfc493d048",
    "https://automatio.ai/",
    "https://sdk.vercel.ai/docs/introduction",
    "https://app.eu.vanta.com/jinaai/trust/vz7f4mohp0847aho84lmva",
    "https://apply.workable.com/huggingface/j/AF1D4E3FEB",
    "https://facebook.com/sharer/sharer.php?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://facebook.com/sharer/sharer.php?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://reddit.com/submit?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://apply.workable.com/huggingface",
    "https://news.ycombinator.com/submitlink?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://news.ycombinator.com/submitlink?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://docs.github.com/site-policy/privacy-policies/github-privacy-statement",
    "https://discord.jina.ai/",
    "https://docs.github.com/site-policy/github-terms/github-terms-of-service",
    "https://bigdatawire.com/this-just-in/qumulo-announces-30-million-funding",
    "https://x.ai/blog/grok-3",
    "https://m-ric-open-deep-research.hf.space/",
    "https://youtu.be/sal78ACtGTc?feature=shared&t=52",
    "https://mp.weixin.qq.com/s/apnorBj4TZs3-Mo23xUReQ",
    "https://perplexity.ai/hub/blog/introducing-perplexity-deep-research",
    "https://githubstatus.com/",
    "https://github.blog/changelog/2021-09-30-footnotes-now-supported-in-markdown-fields",
    "https://openai.com/index/introducing-operator",
    "mailto:[email protected]",
    "https://resources.github.com/learn/pathways",
    "https://status.jina.ai/",
    "https://reuters.com/technology/artificial-intelligence/tencents-messaging-app-weixin-launches-beta-testing-with-deepseek-2025-02-16",
    "https://scmp.com/tech/big-tech/article/3298981/baidu-adopts-deepseek-ai-models-chasing-tencent-race-embrace-hot-start",
    "https://microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks",
    "javascript:UC_UI.showSecondLayer();",
    "https://resources.github.com/",
    "https://storm-project.stanford.edu/research/storm",
    "https://blog.google/products/gemini/google-gemini-deep-research",
    "https://youtu.be/vrpraFiPUyA",
    "https://chat.baidu.com/search?extParamsJson=%7B%22enter_type%22%3A%22ai_explore_home%22%7D&isShowHello=1&pd=csaitab&setype=csaitab&usedModel=%7B%22modelName%22%3A%22DeepSeek-R1%22%7D",
    "https://app.dover.com/jobs/jinaai",
    "http://localhost:3000/",
    "https://docs.cherry-ai.com/",
    "https://en.wikipedia.org/wiki/Delayed_gratification",
    "https://support.github.com/?tags=dotcom-footer",
    "https://docs.jina.ai/",
    "https://skills.github.com/",
    "https://partner.github.com/",
    "https://help.x.com/resources/accessibility",
    "https://business.twitter.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://business.x.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://support.twitter.com/articles/20170514",
    "https://support.x.com/articles/20170514",
    "https://t.co/jnxcxPzndy",
    "https://t.co/6EtEMa9P05",
    "https://help.x.com/using-x/x-supported-browsers",
    "https://legal.twitter.com/imprint.html"
  ],
  "readURLs": [
    "https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch",
    "https://github.com/jina-ai/node-DeepResearch",
    "https://huggingface.co/blog/open-deep-research",
    "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
    "https://x.com/jinaai_?lang=en",
    "https://jina.ai/news",
    "https://x.com/joedevon/status/1896984525210837081",
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/tools/jina-latechunk.ts"
  ],
  "numURLs": 98
}

深度搜索参数指南

了解如何设置正确的参数并获得最佳结果。

质量控制

在深度搜索中,通常存在一个权衡:系统执行的步骤越多,获得的结果质量就越高,但同时也会消耗更多词元。这种质量的提升源于更广泛、更详尽的搜索和更深入的反思。四个主要参数控制深度搜索的质量:budget_tokens、max_attempts、team_size 和 reasoning_effort。reasoning_effort 参数本质上是 budget_tokens 和 max_attempts 的预设组合,并经过了精心调整。对于大多数用户来说,调整 reasoning_effort 是最简单的方法。

预算词元

budget_tokens 设置整个深度搜索过程中允许的最大词元数量。这涵盖了所有操作,包括网页搜索、读取网页、反思、摘要和编码。预算越大,响应质量自然也就越好。当预算耗尽或找到满意答案时(以先到者为准),深度搜索过程将停止。如果预算先耗尽,您仍然会得到答案,但这可能不是最终的、完全优化的响应,因为它尚未通过max_attempts定义的所有质量检查。

最大尝试次数

max_attempts决定了系统在深度搜索过程中重试解决问题的次数。每次深度搜索生成答案时,它都必须通过内部评估器定义的某些质量测试。如果答案未通过这些测试,评估器会提供反馈,系统会使用此反馈继续搜索和优化答案。将max_attempts设置得太低意味着您可以快速获得结果,但质量可能会受到影响,因为答案可能无法通过所有质量检查。将其设置得太高可能会使流程陷入无休止的重试循环,不断尝试并失败。

当budget_tokens或max_attempts超出(以先发生者为准),或者答案通过所有测试且仍有剩余预算和尝试次数时,系统会返回最终答案。

团队规模

team_size对质量的影响方式与max_attempts和budget_tokens截然不同。当team_size设置为大于1时,系统会将原始问题分解为子问题,并分别进行研究。可以将其想象成Map-Reduce模式,将大型作业分解为并行运行的较小任务。最终答案是每个工作者结果的综合。我们称之为team_size,因为它模拟了一个研究团队,其中多个智能体调查同一问题的不同方面并协作完成最终报告。

请记住,所有智能体的词元消耗都会计入您的budget_tokens总数,但每个智能体都有独立的max_attempts。这意味着,如果team_size较大,但budget_tokens相同,由于预算限制,智能体可能会比预期更快地返回答案。我们建议同时增加team_size和budget_tokens,以便为每个智能体提供足够的资源来完成全面的工作。

最后,您可以将team_size视为控制搜索广度的因素——它决定了要研究的不同方面的数量。同时,budget_tokens和max_attempts控制搜索的深度——即对每个方面的探索程度。

信息来源控制

深度搜索高度依赖基础信息——它所使用的信息来源。质量不仅仅关乎算法的深度和广度;深度搜索获取信息的来源也同样重要,而且往往是决定性因素。让我们来探索一下控制这一点的关键参数。

不直接回答

no_direct_answer 是一个简单的开关,它可以阻止系统在步骤 1 返回答案。启用后,它会禁用系统使用内部知识的能力,并强制其始终首先搜索网页。启用此功能会使系统“过度思考”,即使是像“今天星期几”、“你好吗”这样的简单问题,或者像“谁是美国第 40 任总统”这样的基本事实知识,这些知识肯定存在于模型的训练数据中。

域名控制

三个参数——boost_hostnames、bad_hostnames 和 only_hostnames——告诉 深度搜索哪些网页需要优先处理、避免或专门使用。要理解这些机制的工作原理,请回顾一下深度搜索中的搜索和读取流程:

  1. 搜索阶段:系统搜索网络并检索包含其摘要的网站 URL 列表
  2. 选择阶段:系统决定实际访问哪些 URL(由于时间和成本限制,系统不会访问所有 URL)
  • boost_hostnames:此处列出的域名优先级更高,更有可能被访问
  • bad_hostnames:这些域名永远不会被访问
  • only_hostnames:定义后,只有与这些域名匹配的 URL 才会被访问

以下是一些关于域名参数的重要说明。首先,系统始终使用搜索引擎返回的摘要作为构建推理链的初始线索。这些域名参数仅影响系统访问的网页,而不会影响其如何制定搜索查询。

其次,如果收集到的 URL 不包含 only_hostnames 中指定的域名,系统可能会完全停止读取网页。我们建议仅在您熟悉研究问题并了解潜在答案可能出现的位置(或绝对不应该出现的位置)时才使用这些参数。

特殊情况:学术研究

对于学术研究,您可能希望将搜索和读取限制在 arxiv.org 上。在这种情况下,只需设置 "search_provider": "arxiv",所有内容都将以 arxiv 作为唯一来源。但是,对于一般性或琐碎的问题,此限制可能无法获得有效的答案,因此仅将 "search_provider": "arxiv" 用于严肃的学术研究。

搜索语言代码

search_language_code 是另一个影响网络资源的参数,它会强制系统以特定语言生成查询,而不管原始输入或中间推理步骤如何。通常,系统会自动确定查询语言以获得最佳搜索覆盖率,但有时手动控制也很有用。

语言控制用例

国际市场调研:在研究本地品牌或公司在国际市场的影响力时,您可以强制查询始终使用英语(使用 "search_language_code": "en" 来实现全球覆盖),或者使用本地语言来获取更具针对性的地区信息。

使用非英语提示进行全球调研:如果您的输入始终使用中文或日语(因为您的最终用户主要使用这些语言),但您的调研范围是全球性的,而不仅仅是本地的中文或日语网站,则系统可能会自动倾向于使用您提示的语言。使用此参数可以强制使用英语查询,以实现更广泛的国际覆盖率。

与深度搜索聊天

在简单的聊天界面里看看深度搜索地不地道。深度搜索最适合需要迭代推理、世界知识或最新信息的复杂问题。
我们刚刚推出了一款全新的深度搜索UI,它速度快、简洁且免费。请访问 https://search.jina.ai 查看或单击下面的按钮尝试一下!open_in_new访问新 UI
聊天客户端
为了获得最佳体验,我们建议使用专业的聊天客户端。深度搜索 与 OpenAI 的聊天 API 架构完全兼容,因此可以轻松与任何兼容 OpenAI 的客户端一起使用。
open_in_new
Chatwise
open_in_new
Cherry Studio
open_in_new
Chatbox
open_in_new
LobeChat
open_in_new
NextChat

什么是深度搜索?

深度搜索结合了网络搜索、读取和推理,可进行全面调查。您可以将其视为一个智能体,接受您的研究任务 - 它会进行广泛搜索并经过多次迭代,然后给出答案。

大模型

attach_money
约 1000 个词元
access_time
约1秒
check
常识问题的快速答案
close
无法获取实时或训练后的信息

答案完全由预先训练的知识生成,具有固定的截止日期

RAG范式和带搜索的大模型

attach_money
约 10,000 个词元
access_time
约 3 秒
check
需要当前或特定领域信息的问题
close
解决需要多跳推理的复杂问题

通过汇总单次搜索结果生成的答案
能够获取训练截止时间以外的当前信息

深度搜索

attach_money
约 500,000 个词元
access_time
约50秒
check
需要深入研究和推理的复杂问题
info
比简单的大模型或 RAG 方法花费的时间更长

自主智能体,可反复搜索、读取和推理
根据当前发现动态决定下一步行动
在返回结果之前自我评估答案质量
可以通过多次搜索和推理循环深入研究主题

API价格表

API 定价基于词元使用情况。一个 API 密钥即可访问所有搜索基础产品。
使用Jina 搜索底座API
访问我们所有产品的最简单方法。随时充值词元。
使用更多词元充值此 API 密钥
根据您所在的位置,您可能需要支付美元、欧元或其他货币的费用。可能需缴纳税费。
请输入正确的API密钥进行充值
了解速率限制
速率限制是指每个 IP 地址/API 密钥 (RPM) 在一分钟内可以向 API 发出的最大请求数。请在下面详细了解每个产品和层级的速率限制。
keyboard_arrow_down
速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST

常见问题

什么是深度搜索?
keyboard_arrow_down
深度搜索是一个大模型API,它执行迭代搜索、读取和推理,直到找到查询的准确答案或达到其词元预算限制。
深度搜索与 OpenAI 和 Gemini 的深度研究能力有何不同?
keyboard_arrow_down
与 OpenAI 和 Gemini 不同,深度搜索专注于通过迭代提供准确的答案,而不是生成长篇文章。它针对深度网络搜索的快速、精确答案进行了优化,而不是创建全面的报告。
我需要什么 API 密钥来使用 DeepResearch?
keyboard_arrow_down
您需要 Jina API 密钥。我们为新 API 密钥提供 1000 万个免费词元。
当深度搜索达到其词元预算时会发生什么?它会返回不完整的答案吗?
keyboard_arrow_down
它根据所有积累的知识生成最终答案,而不是仅仅放弃或返回不完整的答案。
深度搜索能保证答案的准确性吗?
keyboard_arrow_down
不是。虽然它使用迭代搜索过程来提高准确性,但评估显示它在测试题目上的通过率达到了 75%,明显优于 0% 的基线(gemini-2.0-flash),但并不完美。
一次典型的深度搜索查询需要多长时间?
keyboard_arrow_down
它差别很大 - 根据评估数据,查询可能需要 1 到 42 步,平均需要 4 步。也就是 20 秒。简单的查询可能很快得到解决,而复杂的研究问题可能涉及多次迭代,最多需要 120 秒。
深度搜索可以与任何与 OpenAI 兼容的客户端(如 Chatwise、CherryStudio 或 ChatBox)配合使用吗?
keyboard_arrow_down
是的,deepsearch.jina.ai/v1/chat/completions 上的官方深度搜索API 与 OpenAI API 架构完全兼容,使用“jina-deepsearch-v1”作为模型名称。因此,从 OpenAI 切换到深度搜索并与本地客户端或任何兼容 OpenAI 的客户端一起使用非常容易。我们强烈推荐 Chatwise 以获得无缝体验。
API 的速率限制是多少?
keyboard_arrow_down
速率限制因 API 密钥层而异,范围从 10 RPM 到 30 RPM。对于查询量大的应用程序来说,这一点很重要。
<think>标签里面的内容是什么?
keyboard_arrow_down
深度搜索将思考步骤包装在 XML 标签 ... 中,然后提供最终答案,遵循 OpenAI 流格式,但使用这些特殊标记来表示思路链。
深度搜索是否使用 Jina Reader 进行网页搜索和读取?
keyboard_arrow_down
是的。Jina Reader 用于网页搜索和读取,为系统提供高效访问和处理网页内容的能力。
为什么深度搜索对我的查询使用这么多标记?
keyboard_arrow_down
是的,深度搜索在复杂查询中的词元使用量可以说很高 - 平均为 70,000 个词元,而基本大模型响应为 500 个词元。这显示了研究的深度,但也影响了成本。
有没有办法控制或限制步数?
keyboard_arrow_down
该系统主要由词元预算而非步数控制。一旦超出词元预算,系统就会进入 Beast 模式以生成最终答案。查看 reasoning_effort 了解更多详情。
答案中的参考文献有多可靠?
keyboard_arrow_down
参考文献非常重要,如果一个答案被认为是明确的,但缺乏参考文献,系统会继续搜索而不是接受该答案。
深度搜索能处理有关未来事件的问题吗?
keyboard_arrow_down
是的,但需要进行大量的研究。“谁将在 2028 年成为总统”的例子表明,它可以通过多次研究迭代来处理推测性问题,尽管这种预测的准确性无法得到保证。

如何获取我的 API 密钥?

video_not_supported

速率限制是多少?

速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
API相关常见问题
code
我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗?
keyboard_arrow_down
是的,同一个 API 密钥适用于 Jina AI 的所有搜索基础产品。这包括读取器、向量模型、重排器、分类器和微调模型 API,所有服务之间共享词元。
code
我可以查看 API 密钥的词元使用情况吗?
keyboard_arrow_down
是的,您可以在“密钥和计费”选项卡中输入您的 API 密钥来查看词元最近的使用记录和剩余词元余额。如果您已登录 API 密钥控制面板,也可以在“管理 API 密钥”选项卡中查看这些详细信息。
code
如果我忘记了 API 密钥,该怎么办?
keyboard_arrow_down
如果您遗失了充值密钥并希望找回,请使用您的注册电子邮件联系 support AT jina.ai 寻求帮助。建议登录以便于安全保存和便捷访问您的 API 密钥。
联系我们
code
API 密钥会过期吗?
keyboard_arrow_down
不,我们的 API 密钥没有到期日期。但是,如果您怀疑您的密钥已被泄露并希望停用它,请联系我们的支持团队寻求帮助。您还可以在API 密钥控制面板中自助销毁您的密钥。
联系我们
code
我可以在 API 密钥之间转移词元余额吗?
keyboard_arrow_down
是的,您可以将剩余的付费词元余额从一个高级密钥转移到另一个密钥。在API 密钥控制面板上登录您的帐户后,在该密钥的设置界面来转移所有剩余的付费词元余额。
code
我可以销毁我的 API 密钥吗?
keyboard_arrow_down
是的,如果您认为您的 API 密钥已被泄露,您可以销毁该密钥。销毁密钥将立即为所有存储该密钥的用户禁用该密钥,并且所有剩余词元余额和关联资产将永久不可用。如果您拥有高级密钥,您可以选择在销毁之前将剩余的已付款词元余额转移到另一个密钥。请注意,此操作无法撤消。要销毁密钥,请前往API 密钥控制面板中的密钥设置。
code
为什么有些机型第一次请求比较慢?
keyboard_arrow_down
这是因为我们的无服务器架构在使用率较低时会卸载某些模型。初始请求会激活或“预热”模型,这可能需要几秒钟。初始激活后,后续请求的处理速度会快得多。
code
用户输入数据是否用于训练您的模型?
keyboard_arrow_down
我们遵守严格的隐私政策,不会使用用户输入数据来训练我们的模型。我们还符合 SOC 2 类型 I 和类型 II 标准,确保高标准的安全性和隐私性。
与计费相关的常见问题
attach_money
API是根据句子的数量或请求的数量计费吗?
keyboard_arrow_down
我们的定价模型基于处理的词元总数,允许用户灵活地在任意数量的句子中分配这些词元,为不同的文本分析需求提供经济高效的解决方案。
attach_money
新用户可以免费试用吗?
keyboard_arrow_down
我们为新用户提供免费试用,其中包含一千万个可用于我们任何模型的词元,并通过自动生成的 API 密钥进行兑换。免费词元用完后,用户可以通过“购买词元”标签页轻松购买额外的词元,用于 API 密钥。
attach_money
失败的请求是否会扣除词元?
keyboard_arrow_down
不,失败的请求不会扣除词元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通过 Stripe 处理,支持多种付款方式,包括信用卡、Google Pay 和 PayPal,为您提供方便。
attach_money
词元购买后可以开具发票吗?
keyboard_arrow_down
是的,购买词元后,发票将发送到与您的 Stripe 帐户关联的电子邮件地址。
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, CA 94085, 美国
location_on
德国柏林(总部)
Prinzessinnenstraße 19-20,10969 柏林,德国
location_on
中国北京
中国北京市海淀区西大街48号6号楼5层
location_on
中国深圳
中国深圳市赋安科技大厦4楼402
搜索底座
读取器
向量模型
重排器
深度搜索
分类器
切分器
API 文档
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Jina AI © 2020-2025.