ディープサーチAPI
api.openai.com
を deepsearch.jina.ai
に置き換えるだけです。reasoning_effort
パラメータをオーバーライドします。reasoning_effort
パラメータをオーバーライドします。{
"role": "user",
"content": "hi"
}
curl https://deepsearch.jina.ai/v1/chat/completions \
-H "Content-Type: application/json"\
-H "Authorization: Bearer " \
-d @- <<EOFEOF
{
"model": "jina-deepsearch-v1",
"messages": [
{
"role": "user",
"content": "Hi!"
},
{
"role": "assistant",
"content": "Hi, how can I help you?"
},
{
"role": "user",
"content": "what's the latest blog post from jina ai?"
}
],
"stream": true,
"reasoning_effort": "medium"
}
EOFEOF
{
"id": "1742181758589",
"object": "chat.completion.chunk",
"created": 1742181758,
"model": "jina-deepsearch-v1",
"system_fingerprint": "fp_1742181758589",
"choices": [
{
"index": 0,
"delta": {
"content": "The latest blog post from Jina AI is titled \"Snippet Selection and URL Ranking in DeepSearch/DeepResearch,\" published on March 12, 2025 [^1]. This post discusses how to improve the quality of DeepSearch by using late-chunking embeddings for snippet selection and rerankers to prioritize URLs before crawling. You can read the full post here: https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch\n\n[^1]: Since our DeepSearch release on February 2nd 2025 we ve discovered two implementation details that greatly improved quality In both cases multilingual embeddings and rerankers are used in an in context manner operating at a much smaller scale than the traditional pre computed indices these models typically require [jina.ai](https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch)",
"type": "text",
"annotations": [
{
"type": "url_citation",
"url_citation": {
"title": "Snippet Selection and URL Ranking in DeepSearch/DeepResearch",
"exactQuote": "Since our DeepSearch release on February 2nd 2025, we've discovered two implementation details that greatly improved quality. In both cases, multilingual embeddings and rerankers are used in an _\"in-context\"_ manner - operating at a much smaller scale than the traditional pre-computed indices these models typically require.",
"url": "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
"dateTime": "2025-03-13 06:48:01"
}
}
]
},
"logprobs": null,
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 169670,
"completion_tokens": 27285,
"total_tokens": 196526
},
"visitedURLs": [
"https://github.com/jina-ai/node-DeepResearch/blob/main/src/utils/url-tools.ts",
"https://huggingface.co/jinaai/jina-embeddings-v3",
"https://github.com/jina-ai/reader",
"https://zilliz.com/blog/training-text-embeddings-with-jina-ai",
"https://threads.net/@unwind_ai/post/DGmhWCVswbe/media",
"https://twitter.com/JinaAI_/status/1899840196507820173",
"https://jina.ai/news?tag=tech-blog",
"https://docs.llamaindex.ai/en/stable/examples/embeddings/jinaai_embeddings",
"https://x.com/jinaai_",
"https://x.com/JinaAI_/status/1899840202358784170",
"https://tracxn.com/d/companies/jina-ai/__IQ81fOnU0FsDpagFjG-LrG0DMWHELqI6znTumZBQF-A/funding-and-investors",
"https://jina.ai/models",
"https://linkedin.com/posts/imohitmayank_jinaai-has-unveiled-the-ultimate-developer-activity-7300401711242711040-VD64",
"https://medium.com/@tossy21/trying-out-jina-ais-node-deepresearch-c5b55d630ea6",
"https://huggingface.co/jinaai/jina-clip-v2",
"https://arxiv.org/abs/2409.10173",
"https://milvus.io/docs/embed-with-jina.md",
"https://seedtable.com/best-startups-in-china",
"https://threads.net/@sung.kim.mw/post/DGhG-J_vREu/jina-ais-a-practical-guide-to-implementing-deepsearchdeepresearchthey-cover-desi",
"https://elastic.co/search-labs/blog/jina-ai-embeddings-rerank-model-open-inference-api",
"http://status.jina.ai/",
"https://apidog.com/blog/recreate-openai-deep-research",
"https://youtube.com/watch?v=QxHE4af5BQE",
"https://sdxcentral.com/articles/news/cisco-engages-businesses-on-ai-strategies-at-greater-bay-area-2025/2025/02",
"https://aws.amazon.com/blogs/machine-learning/build-rag-applications-using-jina-embeddings-v2-on-amazon-sagemaker-jumpstart",
"https://reddit.com/r/perplexity_ai/comments/1ejbdqa/fastest_open_source_ai_search_engine",
"https://search.jina.ai/",
"https://sebastian-petrus.medium.com/build-openais-deep-research-open-source-alternative-4f21aed6d9f0",
"https://medium.com/@elmo92/jina-reader-transforming-web-content-to-feed-llms-d238e827cc27",
"https://openai.com/index/introducing-deep-research",
"https://python.langchain.com/docs/integrations/tools/jina_search",
"https://varindia.com/news/meta-is-in-talks-for-usd200-billion-ai-data-center-project",
"https://varindia.com/news/Mira-Murati%E2%80%99s-new-AI-venture-eyes-$9-billion-valuation",
"https://53ai.com/news/RAG/2025031401342.html",
"https://arxiv.org/abs/2409.04701",
"https://bigdatawire.com/this-just-in/together-ai-raises-305m-series-b-to-power-ai-model-training-and-inference",
"https://github.blog/",
"https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/MvwT9enRT7gOESHA_tpRj.jpeg",
"https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/JNs_DrpFbr6ok_pSRUK4j.jpeg",
"https://app.dealroom.co/lists/33530",
"https://api-docs.deepseek.com/news/news250120",
"https://sdxcentral.com/articles/news/ninjaone-raises-500-million-valued-at-5-billion/2025/02",
"https://linkedin.com/sharing/share-offsite?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://twitter.com/intent/tweet?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://platform.openai.com/docs/api-reference/chat/create",
"https://mp.weixin.qq.com/s/-pPhHDi2nz8hp5R3Lm_mww",
"https://huggingface.us17.list-manage.com/subscribe?id=9ed45a3ef6&u=7f57e683fa28b51bfc493d048",
"https://automatio.ai/",
"https://sdk.vercel.ai/docs/introduction",
"https://app.eu.vanta.com/jinaai/trust/vz7f4mohp0847aho84lmva",
"https://apply.workable.com/huggingface/j/AF1D4E3FEB",
"https://facebook.com/sharer/sharer.php?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://facebook.com/sharer/sharer.php?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
"https://reddit.com/submit?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://apply.workable.com/huggingface",
"https://news.ycombinator.com/submitlink?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://news.ycombinator.com/submitlink?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
"https://docs.github.com/site-policy/privacy-policies/github-privacy-statement",
"https://discord.jina.ai/",
"https://docs.github.com/site-policy/github-terms/github-terms-of-service",
"https://bigdatawire.com/this-just-in/qumulo-announces-30-million-funding",
"https://x.ai/blog/grok-3",
"https://m-ric-open-deep-research.hf.space/",
"https://youtu.be/sal78ACtGTc?feature=shared&t=52",
"https://mp.weixin.qq.com/s/apnorBj4TZs3-Mo23xUReQ",
"https://perplexity.ai/hub/blog/introducing-perplexity-deep-research",
"https://githubstatus.com/",
"https://github.blog/changelog/2021-09-30-footnotes-now-supported-in-markdown-fields",
"https://openai.com/index/introducing-operator",
"mailto:[email protected]",
"https://resources.github.com/learn/pathways",
"https://status.jina.ai/",
"https://reuters.com/technology/artificial-intelligence/tencents-messaging-app-weixin-launches-beta-testing-with-deepseek-2025-02-16",
"https://scmp.com/tech/big-tech/article/3298981/baidu-adopts-deepseek-ai-models-chasing-tencent-race-embrace-hot-start",
"https://microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks",
"javascript:UC_UI.showSecondLayer();",
"https://resources.github.com/",
"https://storm-project.stanford.edu/research/storm",
"https://blog.google/products/gemini/google-gemini-deep-research",
"https://youtu.be/vrpraFiPUyA",
"https://chat.baidu.com/search?extParamsJson=%7B%22enter_type%22%3A%22ai_explore_home%22%7D&isShowHello=1&pd=csaitab&setype=csaitab&usedModel=%7B%22modelName%22%3A%22DeepSeek-R1%22%7D",
"https://app.dover.com/jobs/jinaai",
"http://localhost:3000/",
"https://docs.cherry-ai.com/",
"https://en.wikipedia.org/wiki/Delayed_gratification",
"https://support.github.com/?tags=dotcom-footer",
"https://docs.jina.ai/",
"https://skills.github.com/",
"https://partner.github.com/",
"https://help.x.com/resources/accessibility",
"https://business.twitter.com/en/help/troubleshooting/how-twitter-ads-work.html",
"https://business.x.com/en/help/troubleshooting/how-twitter-ads-work.html",
"https://support.twitter.com/articles/20170514",
"https://support.x.com/articles/20170514",
"https://t.co/jnxcxPzndy",
"https://t.co/6EtEMa9P05",
"https://help.x.com/using-x/x-supported-browsers",
"https://legal.twitter.com/imprint.html"
],
"readURLs": [
"https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch",
"https://github.com/jina-ai/node-DeepResearch",
"https://huggingface.co/blog/open-deep-research",
"https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
"https://x.com/jinaai_?lang=en",
"https://jina.ai/news",
"https://x.com/joedevon/status/1896984525210837081",
"https://github.com/jina-ai/node-DeepResearch/blob/main/src/tools/jina-latechunk.ts"
],
"numURLs": 98
}
DeepSearchパラメータガイド
品質管理
ディープサーチには通常、トレードオフが存在します。システムが実行するステップ数が多いほど、結果の品質は向上しますが、消費するトークンも増加します。この品質向上は、より広範かつ網羅的な検索と、より深いリフレクションによって実現されます。ディープサーチの品質は、主に4つのパラメータ、budget_tokens
、max_attempts
、team_size
、reasoning_effort
によって制御されます。reasoning_effort
パラメータは、基本的に budget_tokens
と max_attempts
のプリセット値を組み合わせたもので、これらは慎重に調整されています。ほとんどのユーザーにとって、reasoning_effort
を調整するのが最も簡単な方法です。
予算トークン
budget_tokens
は、ディープサーチプロセス全体で許可されるトークンの最大数を設定します。これは、Web検索、Webページの読み取り、リフレクション、要約、エンコードなど、すべての操作に適用されます。予算が大きいほど、レスポンスの品質は向上します。ディープサーチプロセスは、予算が使い果たされるか、満足のいく回答が見つかるかのいずれか早い方で停止します。予算が先に使い果たされた場合でも回答は得られますが、max_attempts
で定義されたすべての品質チェックに合格していないため、最終的な完全に最適化された回答ではない可能性があります。
最大試行回数
max_attempts
は、ディープサーチ中にシステムが問題を解くために再試行する回数を決定します。ディープサーチによって回答が生成されるたびに、内部評価者によって定義された特定の品質テストに合格する必要があります。回答がこれらのテストに合格しなかった場合、評価者はフィードバックを提供し、システムはこのフィードバックを使用して、回答の探索と改良を継続します。max_attempts
を低く設定しすぎると、結果は早く得られますが、回答がすべての品質チェックに合格しない可能性があるため、品質が低下する可能性があります。高く設定しすぎると、プロセスが無限の再試行ループに陥り、試行と失敗を繰り返すことになります。
システムは、budget_tokens
または max_attempts
のいずれか早い方を超えた場合、または回答がすべてのテストに合格し、予算と試行回数が残っている場合に、最終的な回答を返します。
チームサイズ
team_size
は、max_attempts
や budget_tokens
とはまったく異なる方法で品質に影響します。team_size
が 1 より大きい値に設定されている場合、システムは元の問題をサブ問題に分割し、それぞれを個別に調査します。これは、大きなジョブを並列実行される小さなタスクに分割する Map-Reduce パターンに似ています。最終的な回答は、各ワーカーの結果を組み合わせたものになります。これを team_size
と呼ぶのは、複数のエージェントが同じ問題のさまざまな側面を調査し、最終レポートを共同で作成する研究チームをシミュレートするためです。
すべてのエージェントによるトークン消費は合計 budget_tokens
にカウントされますが、各エージェントには独立した max_attempts
があることに注意してください。つまり、team_size
が大きくても budget_tokens
が同じ場合、予算の制約により、エージェントが予想よりも早く回答を返す可能性があります。各エージェントが包括的な作業を完了するのに十分なリソースを確保するために、team_size
と budget_tokens
の両方を増やすことをお勧めします。
最後に、team_size は検索の幅を制御するもの、つまり探索するファセットの数を決定するものと考えることができます。一方、budget_tokens と max_attempts は検索の深さ、つまり各ファセットをどれだけ探索するかを制御します。
情報源制御
DeepSearch は、グラウンドトゥルース(使用する情報源)に大きく依存しています。品質とは、アルゴリズムの深さや広さだけではありません。DeepSearch が情報を取得する情報源も同様に重要であり、決定的な要素となることがよくあります。これを制御する主要なパラメータを見ていきましょう。
直接回答なし
no_direct_answer
は、システムがステップ 1 で回答を返さないようにするシンプルなスイッチです。有効にすると、システムの内部知識の利用が無効になり、常に最初に Web 検索が実行されます。この機能を有効にすると、システムは「今日は何曜日ですか」「お元気ですか」といった簡単な質問や、「アメリカ合衆国の第 40 代大統領は誰ですか」といった基本的な事実知識(これらはモデルのトレーニングデータに確実に含まれています)に対しても「過剰に考え」てしまいます。
ドメイン名制御
3 つのパラメータ(boost_hostnames
、bad_hostnames
、only_hostnames
)は、DeepSearch がどのウェブページを優先するか、回避するか、または排他的に使用するかを指定します。これらのメカニズムの仕組みを理解するには、DeepSearch の検索と読み取りのプロセスについて考えてみましょう。
-
検索フェーズ: システムはウェブを検索し、スニペットを含むウェブサイトの URL のリストを取得します。
-
選択フェーズ: システムは実際にアクセスする URL を決定します(時間とコストの制約により、すべての URL にアクセスするわけではありません)。
-
boost_hostnames
: ここでリストされているドメインは優先され、アクセスされる可能性が高くなります。 -
bad_hostnames
: これらのドメインはアクセスされません。 -
only_hostnames
: 定義後は、これらのドメインに一致する URL のみがアクセスされます。
ドメインパラメータに関する重要な注意事項を以下に示します。まず、システムは常に検索エンジンから返されるスニペットを推論チェーン構築の最初の手がかりとして使用します。これらのドメインパラメータは、システムがアクセスするウェブページにのみ影響し、検索クエリの作成方法には影響しません。
次に、収集されたURLにonly_hostnames
で指定されたドメインが含まれていない場合、システムはウェブページの読み取りを完全に停止する可能性があります。これらのパラメータは、研究課題に精通しており、潜在的な回答がどこに現れる可能性があるか(または絶対に現れてはいけない場所)を理解している場合にのみ使用することをお勧めします。
特殊なケース:学術研究
学術研究では、検索と閲覧をarxiv.orgに限定したい場合があります。この場合、"search_provider": "arxiv"
と設定するだけで、すべてのコンテンツはarxivのみから取得されます。ただし、この制限では一般的な質問や些細な質問に対して有効な回答が得られない可能性があるため、"search_provider": "arxiv"
は本格的な学術研究にのみ使用してください。
検索言語コード
search_language_code
は、Web リソースに影響を与えるもう 1 つのパラメータです。このパラメータは、元の入力や中間推論ステップに関係なく、特定の言語でクエリを生成するようにシステムに強制します。通常、システムは検索範囲を最大化するためにクエリ言語を自動的に決定しますが、手動で制御することが有用な場合もあります。
言語制御のユースケース
国際市場調査: ローカルブランドや企業の国際市場における影響力を調査する場合、クエリを常に英語(グローバル範囲の場合は "search_language_code": "en"
を使用)にするか、よりターゲットを絞った地域情報の場合はローカル言語にすることができます。
グローバル調査には英語以外のプロンプトを使用する: エンドユーザーが主にこれらの言語を話すため、入力は常に中国語または日本語であるものの、調査対象がローカルな中国語または日本語のサイトだけでなくグローバルである場合、システムはプロンプトの言語を自動的に優先することがあります。このパラメータを使用すると、より広範な国際範囲をカバーするためにクエリを英語に強制できます。
Deep Searchとチャット
ディープサーチとは何ですか?
大型モデル
RAGパラダイムと検索機能を備えた大規模モデル
ディープサーチ
API価格表
製品 | APIポート | 説明するarrow_upward | APIキーがありませんkey_off | APIキーを使用するkey | プレミアムAPIキー付属key | 平均遅延 | 単語の使用数 | リクエストの種類 | |
---|---|---|---|---|---|---|---|---|---|
リーダーAPI | https://r.jina.ai | URLをモデルに適した大きなテキストに変換する | 20 RPM | 500 RPM | trending_up5000 RPM | 7.9s | 出力応答内のトークンの数に基づきます。 | GET/POST | |
リーダーAPI | https://s.jina.ai | ウェブを検索し、結果をモデルに適した大きなテキストに変換します | block | 100 RPM | trending_up1000 RPM | 2.5s | 各リクエストには、10000 トークンから始まる固定数のトークンが必要です。 | GET/POST | |
ディープサーチ | https://deepsearch.jina.ai/v1/chat/completions | 推論し、検索し、繰り返して最善の答えを見つける | block | 50 RPM | 500 RPM | 56.7s | プロセス全体のトークンの総数をカウントします。 | POST | |
ベクトルモデルAPI | https://api.jina.ai/v1/embeddings | テキスト/画像を固定長ベクトルに変換する | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 入力サイズに依存 help | 入力リクエスト内のトークンの数に基づきます。 | POST | |
リオーダラー API | https://api.jina.ai/v1/rerank | クエリによるドキュメントの絞り込み | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 入力サイズに依存 help | 入力リクエスト内のトークンの数に基づきます。 | POST | |
分類子 API | https://api.jina.ai/v1/train | トレーニング サンプルを使用して分類器をトレーニングする | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 入力サイズに依存 | 単語数は、入力単語×反復回数で表されます。 | POST | |
分類子 API (ゼロサンプル) | https://api.jina.ai/v1/classify | ゼロショット分類を使用して入力を分類する | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart 入力サイズに依存 | 単語数は、入力単語とタグ単語の合計です。 | POST | |
分類子 API (小さなサンプル) | https://api.jina.ai/v1/classify | トレーニングされた少数ショット分類器を使用して入力を分類する | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 入力サイズに依存 | トークン数: 入力トークン | POST | |
セグメンタ API | https://api.jina.ai/v1/segment | 長いテキストを単語や文に分割する | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | トークンの使用量はカウントされません。 | GET/POST |