深度搜索

搜索、讀取並推理直到找到最佳答案。

質量控制

在深度搜索中，通常存在一個權衡：系統執行的步驟越多，獲得的結果質量就越高，但同時也會消耗更多詞元。這種質量的提升源於更廣泛、更詳盡的搜索和更深入的反思。四個主要參數控制深度搜索的質量：budget_tokens、max_attempts、team_size 和 reasoning_effort。reasoning_effort 參數本質上是 budget_tokens 和 max_attempts 的預設組合，並經過了精心調整。對於大多數用户來説，調整 reasoning_effort 是最簡單的方法。

預算詞元

budget_tokens 設置整個深度搜索過程中允許的最大詞元數量。這涵蓋了所有操作，包括網頁搜索、讀取網頁、反思、摘要和編碼。預算越大，響應質量自然也就越好。當預算耗盡或找到滿意答案時（以先到者為準），深度搜索過程將停止。如果預算先耗盡，您仍然會得到答案，但這可能不是最終的、完全優化的響應，因為它尚未通過max_attempts定義的所有質量檢查。

最大嘗試次數

max_attempts決定了系統在深度搜索過程中重試解決問題的次數。每次深度搜索生成答案時，它都必須通過內部評估器定義的某些質量測試。如果答案未通過這些測試，評估器會提供反饋，系統會使用此反饋繼續搜索和優化答案。將max_attempts設置得太低意味着您可以快速獲得結果，但質量可能會受到影響，因為答案可能無法通過所有質量檢查。將其設置得太高可能會使流程陷入無休止的重試循環，不斷嘗試並失敗。

當budget_tokens或max_attempts超出（以先發生者為準），或者答案通過所有測試且仍有剩餘預算和嘗試次數時，系統會返回最終答案。

團隊規模

team_size對質量的影響方式與max_attempts和budget_tokens截然不同。當team_size設置為大於1時，系統會將原始問題分解為子問題，並分別進行研究。可以將其想象成Map-Reduce模式，將大型作業分解為並行運行的較小任務。最終答案是每個工作者結果的綜合。我們稱之為team_size，因為它模擬了一個研究團隊，其中多個智能體調查同一問題的不同方面並協作完成最終報告。

請記住，所有智能體的詞元消耗都會計入您的budget_tokens總數，但每個智能體都有獨立的max_attempts。這意味着，如果team_size較大，但budget_tokens相同，由於預算限制，智能體可能會比預期更快地返回答案。我們建議同時增加team_size和budget_tokens，以便為每個智能體提供足夠的資源來完成全面的工作。

最後，您可以將team_size視為控制搜索廣度的因素——它決定了要研究的不同方面的數量。同時，budget_tokens和max_attempts控制搜索的深度——即對每個方面的探索程度。

信息來源控制

深度搜索高度依賴基礎信息——它所使用的信息來源。質量不僅僅關乎算法的深度和廣度；深度搜索獲取信息的來源也同樣重要，而且往往是決定性因素。讓我們來探索一下控制這一點的關鍵參數。

不直接回答

no_direct_answer 是一個簡單的開關，它可以阻止系統在步驟 1 返回答案。啓用後，它會禁用系統使用內部知識的能力，並強制其始終首先搜索網頁。啓用此功能會使系統“過度思考”，即使是像“今天星期幾”、“你好嗎”這樣的簡單問題，或者像“誰是美國第 40 任總統”這樣的基本事實知識，這些知識肯定存在於模型的訓練數據中。

域名控制

三個參數——boost_hostnames、bad_hostnames 和 only_hostnames——告訴深度搜索哪些網頁需要優先處理、避免或專門使用。要理解這些機制的工作原理，請回顧一下深度搜索中的搜索和讀取流程：

搜索階段：系統搜索網絡並檢索包含其摘要的網站 URL 列表
選擇階段：系統決定實際訪問哪些 URL（由於時間和成本限制，系統不會訪問所有 URL）

boost_hostnames：此處列出的域名優先級更高，更有可能被訪問
bad_hostnames：這些域名永遠不會被訪問
only_hostnames：定義後，只有與這些域名匹配的 URL 才會被訪問

以下是一些關於域名參數的重要説明。首先，系統始終使用搜索引擎返回的摘要作為構建推理鏈的初始線索。這些域名參數僅影響系統訪問的網頁，而不會影響其如何制定搜索查詢。

其次，如果收集到的 URL 不包含 only_hostnames 中指定的域名，系統可能會完全停止讀取網頁。我們建議僅在您熟悉研究問題並瞭解潛在答案可能出現的位置（或絕對不應該出現的位置）時才使用這些參數。

特殊情況：學術研究

對於學術研究，您可能希望將搜索和讀取限制在 arxiv.org 上。在這種情況下，只需設置 "search_provider": "arxiv"，所有內容都將以 arxiv 作為唯一來源。但是，對於一般性或瑣碎的問題，此限制可能無法獲得有效的答案，因此僅將 "search_provider": "arxiv" 用於嚴肅的學術研究。

搜索語言代碼

search_language_code 是另一個影響網絡資源的參數，它會強制系統以特定語言生成查詢，而不管原始輸入或中間推理步驟如何。通常，系統會自動確定查詢語言以獲得最佳搜索覆蓋率，但有時手動控制也很有用。

語言控制用例

國際市場調研：在研究本地品牌或公司在國際市場的影響力時，您可以強制查詢始終使用英語（使用 "search_language_code": "en" 來實現全球覆蓋），或者使用本地語言來獲取更具針對性的地區信息。

使用非英語提示進行全球調研：如果您的輸入始終使用中文或日語（因為您的最終用户主要使用這些語言），但您的調研範圍是全球性的，而不僅僅是本地的中文或日語網站，則系統可能會自動傾向於使用您提示的語言。使用此參數可以強制使用英語查詢，以實現更廣泛的國際覆蓋率。

與深度搜索聊天

在簡單的聊天界面裏看看深度搜索地不地道。深度搜索最適合需要迭代推理、世界知識或最新信息的複雜問題。

我們剛剛推出了一款全新的深度搜索UI，它速度快、簡潔且免費。請訪問 https://search.jina.ai 查看或單擊下面的按鈕嘗試一下！訪問新 UI

聊天客户端

為了獲得最佳體驗，我們建議使用專業的聊天客户端。深度搜索與 OpenAI 的聊天 API 架構完全兼容，因此可以輕鬆與任何兼容 OpenAI 的客户端一起使用。

API 端口

模型名稱

API 密鑰

TypingMind

Chatwise

Cherry Studio

Chatbox

LobeChat

NextChat

什麼是深度搜索？

深度搜索結合了網絡搜索、讀取和推理，可進行全面調查。您可以將其視為一個智能體，接受您的研究任務 - 它會進行廣泛搜索並經過多次迭代，然後給出答案。

大模型

約 1000 個詞元

約1秒

常識問題的快速答案

無法獲取實時或訓練後的信息

答案完全由預先訓練的知識生成，具有固定的截止日期

RAG範式和帶搜索的大模型

約 10,000 個詞元

約 3 秒

需要當前或特定領域信息的問題

解決需要多跳推理的複雜問題

通過彙總單次搜索結果生成的答案

能夠獲取訓練截止時間以外的當前信息

深度搜索

約 500,000 個詞元

約50秒

需要深入研究和推理的複雜問題

比簡單的大模型或 RAG 方法花費的時間更長

自主智能體，可反覆搜索、讀取和推理

根據當前發現動態決定下一步行動

在返回結果之前自我評估答案質量

可以通過多次搜索和推理循環深入研究主題

API價格表

API 定價基於詞元使用情況。一個 API 密鑰即可訪問所有搜索基礎產品。

使用Jina 搜索底座API

訪問我們所有產品的最簡單方法。隨時充值詞元。

輸入您要充值的 API 密鑰

為此 API 密鑰充值

根據您所在的位置，您可能需要支付美元、歐元或其他貨幣的費用。可能需繳納税費。

請輸入正確的API密鑰進行充值

瞭解速率限制

速率限制是指每個 IP 地址/API 密鑰 (RPM) 在一分鐘內可以向 API 發出的最大請求數。請在下面詳細瞭解每個產品和層級的速率限制。

速率限制

速率限制通過三種方式跟蹤：RPM（每分鐘請求數）和TPM（每分鐘詞元數）。限制按 IP/API 密鑰強制執行，當首先達到 RPM 或 TPM 閾值時，將觸發限制。當您在請求標頭中提供 API 密鑰時，我們會按密鑰而不是 IP 地址跟蹤速率限制。

欄位

產品	API端口	描述	無 API 密鑰	免費 API 密鑰	使用付費 API 密鑰	帶有高級 API 密鑰	平均延遲	詞元使用計數	請求類型
讀取器 API	`https://r.jina.ai`	將 URL 轉換為大模型友好文本	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	以輸出響應中的詞元數量為準。	GET/POST
讀取器 API	`https://s.jina.ai`	搜索網絡並將結果轉換為大模型友好文本		100 RPM	100 RPM	1000 RPM	2.5s	每個請求都需要固定數量的詞元，從 10000 個詞元開始	GET/POST
向量模型API	`https://api.jina.ai/v1/embeddings`	將文本/圖片轉為定長向量		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取決於輸入大小	以輸入請求中的詞元數量為準。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查詢對文檔進行精排		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取決於輸入大小	以輸入請求中的詞元數量為準。	POST
分類器 API	`https://api.jina.ai/v1/train`	使用訓練樣本訓練分類器		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取決於輸入大小	詞元計數為：輸入詞元 × 迭代次數	POST
分類器 API (少量樣本)	`https://api.jina.ai/v1/classify`	使用經過訓練的少樣本分類器對輸入進行分類		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取決於輸入大小	詞元計數為：輸入詞元	POST
分類器 API (零樣本)	`https://api.jina.ai/v1/classify`	使用零樣本分類對輸入進行分類		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取決於輸入大小	詞元計數為：輸入詞元加標籤詞元	POST
切分器 API	`https://api.jina.ai/v1/segment`	對長文本進行分詞分句	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	詞元不計算使用量。	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	50 RPM	500 RPM	56.7s	統計整個過程中詞元的總數。	POST

餘額不足時自動充值

建議用於生產環境不間斷的服務。當您的餘額低於設定的閾值時，我們將使用您保存的支付方式自動為您充值上次購買的套餐。

我們於 2025 年 5 月 6 日推出了新的定價模式。如果您在此日期之前啓用了自動充值，則仍需支付舊價格（即購買時的價格）。新價格僅在您修改自動充值設置或購買新的 API 密鑰時適用。

< 1M 詞元

當低於此值事充值

常見問題

什麼是深度搜索？

深度搜索與 OpenAI 和 Gemini 的深度研究能力有何不同？

我需要什麼 API 密鑰來使用 DeepResearch？

當深度搜索達到其詞元預算時會發生什麼？它會返回不完整的答案嗎？

深度搜索能保證答案的準確性嗎？

一次典型的深度搜索查詢需要多長時間？

深度搜索可以與任何與 OpenAI 兼容的客户端（如 Chatwise、CherryStudio 或 ChatBox）配合使用嗎？

API 的速率限制是多少？

標籤裏面的內容是什麼？

深度搜索是否使用 Jina Reader 進行網頁搜索和讀取？

為什麼深度搜索對我的查詢使用這麼多標記？

有沒有辦法控制或限制步數？

答案中的參考文獻有多可靠？

深度搜索能處理有關未來事件的問題嗎？

如何獲取我的 API 密鑰？

速率限制是多少？

速率限制

欄位

產品	API端口	描述	無 API 密鑰	免費 API 密鑰	使用付費 API 密鑰	帶有高級 API 密鑰	平均延遲	詞元使用計數	請求類型
讀取器 API	`https://r.jina.ai`	將 URL 轉換為大模型友好文本	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	以輸出響應中的詞元數量為準。	GET/POST
讀取器 API	`https://s.jina.ai`	搜索網絡並將結果轉換為大模型友好文本		100 RPM	100 RPM	1000 RPM	2.5s	每個請求都需要固定數量的詞元，從 10000 個詞元開始	GET/POST
向量模型API	`https://api.jina.ai/v1/embeddings`	將文本/圖片轉為定長向量		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取決於輸入大小	以輸入請求中的詞元數量為準。	POST
重排器 API	`https://api.jina.ai/v1/rerank`	按查詢對文檔進行精排		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	取決於輸入大小	以輸入請求中的詞元數量為準。	POST
分類器 API	`https://api.jina.ai/v1/train`	使用訓練樣本訓練分類器		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取決於輸入大小	詞元計數為：輸入詞元 × 迭代次數	POST
分類器 API (少量樣本)	`https://api.jina.ai/v1/classify`	使用經過訓練的少樣本分類器對輸入進行分類		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取決於輸入大小	詞元計數為：輸入詞元	POST
分類器 API (零樣本)	`https://api.jina.ai/v1/classify`	使用零樣本分類對輸入進行分類		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	取決於輸入大小	詞元計數為：輸入詞元加標籤詞元	POST
切分器 API	`https://api.jina.ai/v1/segment`	對長文本進行分詞分句	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	詞元不計算使用量。	GET/POST
深度搜索	`https://deepsearch.jina.ai/v1/chat/completions`	推理、搜索和迭代以找到最佳答案		50 RPM	50 RPM	500 RPM	56.7s	統計整個過程中詞元的總數。	POST

我可以對讀取器、向量模型、重排器、分類器和微調模型 API 使用相同的 API 密鑰嗎？

我可以查看 API 密鑰的詞元使用情況嗎？

如果我忘記了 API 密鑰，該怎麼辦？

API 密鑰會過期嗎？

我可以在 API 密鑰之間轉移額度嗎？

我可以銷燬我的 API 密鑰嗎？

為什麼有些機型第一次請求比較慢？

我的API數據是否用於訓練你們的模型？

Jina API 的速率限制是多少？

API是否有批量大小限制？

API是根據句子的數量或請求的數量計費嗎？

新用户可以免費試用嗎？

失敗的請求是否會扣除詞元？

接受哪些付款方式？

充值後可以開具發票嗎？

深度搜索

深度搜索 API

深度搜索參數指南

質量控制

預算詞元

最大嘗試次數

團隊規模

信息來源控制

不直接回答

域名控制

特殊情況：學術研究

搜索語言代碼

語言控制用例

與深度搜索聊天

什麼是深度搜索？

大模型

RAG範式和帶搜索的大模型

深度搜索

API價格表

常見問題

如何獲取我的 API 密鑰？

速率限制是多少？