ディープサーチ

最善の答えが見つかるまで、検索し、読み、推論してください。

品質管理

ディープサーチには通常、トレードオフが存在します。システムが実行するステップ数が多いほど、結果の品質は向上しますが、消費するトークンも増加します。この品質向上は、より広範かつ網羅的な検索と、より深いリフレクションによって実現されます。ディープサーチの品質は、主に4つのパラメータ、budget_tokens、max_attempts、team_size、reasoning_effort によって制御されます。reasoning_effort パラメータは、基本的に budget_tokens と max_attempts のプリセット値を組み合わせたもので、これらは慎重に調整されています。ほとんどのユーザーにとって、reasoning_effort を調整するのが最も簡単な方法です。

予算トークン

budget_tokens は、ディープサーチプロセス全体で許可されるトークンの最大数を設定します。これは、Web検索、Webページの読み取り、リフレクション、要約、エンコードなど、すべての操作に適用されます。予算が大きいほど、レスポンスの品質は向上します。ディープサーチプロセスは、予算が使い果たされるか、満足のいく回答が見つかるかのいずれか早い方で停止します。予算が先に使い果たされた場合でも回答は得られますが、max_attempts で定義されたすべての品質チェックに合格していないため、最終的な完全に最適化された回答ではない可能性があります。

最大試行回数

max_attempts は、ディープサーチ中にシステムが問題を解くために再試行する回数を決定します。ディープサーチによって回答が生成されるたびに、内部評価者によって定義された特定の品質テストに合格する必要があります。回答がこれらのテストに合格しなかった場合、評価者はフィードバックを提供し、システムはこのフィードバックを使用して、回答の探索と改良を継続します。max_attempts を低く設定しすぎると、結果は早く得られますが、回答がすべての品質チェックに合格しない可能性があるため、品質が低下する可能性があります。高く設定しすぎると、プロセスが無限の再試行ループに陥り、試行と失敗を繰り返すことになります。

システムは、budget_tokens または max_attempts のいずれか早い方を超えた場合、または回答がすべてのテストに合格し、予算と試行回数が残っている場合に、最終的な回答を返します。

チームサイズ

team_size は、max_attempts や budget_tokens とはまったく異なる方法で品質に影響します。team_size が 1 より大きい値に設定されている場合、システムは元の問題をサブ問題に分割し、それぞれを個別に調査します。これは、大きなジョブを並列実行される小さなタスクに分割する Map-Reduce パターンに似ています。最終的な回答は、各ワーカーの結果を組み合わせたものになります。これを team_size と呼ぶのは、複数のエージェントが同じ問題のさまざまな側面を調査し、最終レポートを共同で作成する研究チームをシミュレートするためです。

すべてのエージェントによるトークン消費は合計 budget_tokens にカウントされますが、各エージェントには独立した max_attempts があることに注意してください。つまり、team_size が大きくても budget_tokens が同じ場合、予算の制約により、エージェントが予想よりも早く回答を返す可能性があります。各エージェントが包括的な作業を完了するのに十分なリソースを確保するために、team_size と budget_tokens の両方を増やすことをお勧めします。

最後に、team_size は検索の幅を制御するもの、つまり探索するファセットの数を決定するものと考えることができます。一方、budget_tokens と max_attempts は検索の深さ、つまり各ファセットをどれだけ探索するかを制御します。

情報源制御

DeepSearch は、グラウンドトゥルース（使用する情報源）に大きく依存しています。品質とは、アルゴリズムの深さや広さだけではありません。DeepSearch が情報を取得する情報源も同様に重要であり、決定的な要素となることがよくあります。これを制御する主要なパラメータを見ていきましょう。

直接回答なし

no_direct_answer は、システムがステップ 1 で回答を返さないようにするシンプルなスイッチです。有効にすると、システムの内部知識の利用が無効になり、常に最初に Web 検索が実行されます。この機能を有効にすると、システムは「今日は何曜日ですか」「お元気ですか」といった簡単な質問や、「アメリカ合衆国の第 40 代大統領は誰ですか」といった基本的な事実知識（これらはモデルのトレーニングデータに確実に含まれています）に対しても「過剰に考え」てしまいます。

ドメイン名制御

3 つのパラメータ（boost_hostnames、bad_hostnames、only_hostnames）は、DeepSearch がどのウェブページを優先するか、回避するか、または排他的に使用するかを指定します。これらのメカニズムの仕組みを理解するには、DeepSearch の検索と読み取りのプロセスについて考えてみましょう。

検索フェーズ: システムはウェブを検索し、スニペットを含むウェブサイトの URL のリストを取得します。
選択フェーズ: システムは実際にアクセスする URL を決定します（時間とコストの制約により、すべての URL にアクセスするわけではありません）。

boost_hostnames: ここでリストされているドメインは優先され、アクセスされる可能性が高くなります。
bad_hostnames: これらのドメインはアクセスされません。
only_hostnames: 定義後は、これらのドメインに一致する URL のみがアクセスされます。

ドメインパラメータに関する重要な注意事項を以下に示します。まず、システムは常に検索エンジンから返されるスニペットを推論チェーン構築の最初の手がかりとして使用します。これらのドメインパラメータは、システムがアクセスするウェブページにのみ影響し、検索クエリの作成方法には影響しません。

次に、収集されたURLにonly_hostnamesで指定されたドメインが含まれていない場合、システムはウェブページの読み取りを完全に停止する可能性があります。これらのパラメータは、研究課題に精通しており、潜在的な回答がどこに現れる可能性があるか（または絶対に現れてはいけない場所）を理解している場合にのみ使用することをお勧めします。

特殊なケース：学術研究

学術研究では、検索と閲覧をarxiv.orgに限定したい場合があります。この場合、"search_provider": "arxiv"と設定するだけで、すべてのコンテンツはarxivのみから取得されます。ただし、この制限では一般的な質問や些細な質問に対して有効な回答が得られない可能性があるため、"search_provider": "arxiv"は本格的な学術研究にのみ使用してください。

検索言語コード

search_language_code は、Web リソースに影響を与えるもう 1 つのパラメータです。このパラメータは、元の入力や中間推論ステップに関係なく、特定の言語でクエリを生成するようにシステムに強制します。通常、システムは検索範囲を最大化するためにクエリ言語を自動的に決定しますが、手動で制御することが有用な場合もあります。

言語制御のユースケース

国際市場調査: ローカルブランドや企業の国際市場における影響力を調査する場合、クエリを常に英語（グローバル範囲の場合は "search_language_code": "en" を使用）にするか、よりターゲットを絞った地域情報の場合はローカル言語にすることができます。

グローバル調査には英語以外のプロンプトを使用する: エンドユーザーが主にこれらの言語を話すため、入力は常に中国語または日本語であるものの、調査対象がローカルな中国語または日本語のサイトだけでなくグローバルである場合、システムはプロンプトの言語を自動的に優先することがあります。このパラメータを使用すると、より広範な国際範囲をカバーするためにクエリを英語に強制できます。

Deep Searchとチャット

高速、シンプル、無料の新しい Deep Search UI をリリースしました。 https://search.jina.ai で確認するか、下のボタンをクリックして試してみてください。新しいUIにアクセスする

チャットクライアント

最高のエクスペリエンスを得るには、プロフェッショナルなチャットクライアントを使用することをお勧めします。 DeepSearch は OpenAI のチャット API アーキテクチャと完全に互換性があるため、OpenAI 互換のクライアントであれば簡単に使用できます。

APIポート

モデル名

APIキー

Chatwise

Cherry Studio

Chatbox

LobeChat

NextChat

ディープサーチとは何ですか?

Deep Searchは、Web検索、読み取り、推論を組み合わせて包括的な調査を実施します。これは、調査タスクを受け取るエージェントのようなもので、広範囲に検索し、複数の反復処理を経て答えを導き出します。

大型モデル

約1000語

約1秒

一般知識の質問への簡単な回答

リアルタイムまたは訓練された情報にアクセスできない

回答は、期限が決まっている事前トレーニング済みの知識から完全に生成されます。

RAGパラダイムと検索機能を備えた大規模モデル

約10,000語

約3秒

最新情報や分野固有の情報を必要とする質問

マルチホップ推論を必要とする複雑な問題を解決する

個々の検索結果を集約して生成された回答

研修期限を超えて最新情報を入手できる能力

ディープサーチ

約50万語

約50秒

徹底的な調査と推論を必要とする複雑な問題

単純な大規模モデルやRAG法よりも時間がかかる

繰り返し検索、読み取り、推論できる自律エージェント

現在の調査結果に基づいて次のアクションを動的に決定する

結果を返す前に回答の質を自己評価する

複数の検索と推論のサイクルを通じてトピックをより深く掘り下げることができる

API価格表

API の価格はトークンの使用量に基づいて決まります。すべての Search Essentials 製品にアクセスするための 1 つの API キー。

Jinaを使用した検索ベースAPI

すべての製品にアクセスする最も簡単な方法。いつでもトークンをリチャージできます。

トップアップしたいAPIキーを入力してください

この API キーにさらにトークンを追加します

お住まいの地域によっては、米ドル、ユーロ、またはその他の通貨で請求される場合があります。税金が適用される場合があります。

リチャージするには正しい API キーを入力してください

レート制限について学ぶ

レート制限とは、1 分間に IP アドレス/API キー (RPM) ごとに API に対して実行できるリクエストの最大数です。各製品およびティアのレート制限の詳細については、以下をご覧ください。

レート制限

レート制限は、RPM (1 分あたりのリクエスト数) と TPM (1 分あたりの単語数) の 3 つの方法で追跡されます。制限は IP/API キーごとに適用され、RPM または TPM のしきい値に最初に達したときにトリガーされます。リクエストヘッダーに API キーを指定すると、IP アドレスではなくキーによってレート制限が追跡されます。

列

製品	APIポート	説明する	APIキーがありません	APIキーを使用する	プレミアムAPIキー付属	平均遅延	単語の使用数	リクエストの種類
リーダーAPI	`https://r.jina.ai`	URLをモデルに適した大きなテキストに変換する	20 RPM	500 RPM	5000 RPM	7.9s	出力応答内のトークンの数に基づきます。	GET/POST
リーダーAPI	`https://s.jina.ai`	ウェブを検索し、結果をモデルに適した大きなテキストに変換します		100 RPM	1000 RPM	2.5s	各リクエストには、10000 トークンから始まる固定数のトークンが必要です。	GET/POST
ディープサーチ	`https://deepsearch.jina.ai/v1/chat/completions`	推論し、検索し、繰り返して最善の答えを見つける		50 RPM	500 RPM	56.7s	プロセス全体のトークンの総数をカウントします。	POST
ベクトルモデルAPI	`https://api.jina.ai/v1/embeddings`	テキスト/画像を固定長ベクトルに変換する		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	入力サイズに依存	入力リクエスト内のトークンの数に基づきます。	POST
リオーダラー API	`https://api.jina.ai/v1/rerank`	クエリによるドキュメントの絞り込み		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	入力サイズに依存	入力リクエスト内のトークンの数に基づきます。	POST
分類子 API	`https://api.jina.ai/v1/train`	トレーニングサンプルを使用して分類器をトレーニングする		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	入力サイズに依存	単語数は、入力単語×反復回数で表されます。	POST
分類子 API (ゼロサンプル)	`https://api.jina.ai/v1/classify`	ゼロショット分類を使用して入力を分類する		200 RPM & 500,000 TPM	1,000 RPM & 3,000,000 TPM	入力サイズに依存	単語数は、入力単語とタグ単語の合計です。	POST
分類子 API (小さなサンプル)	`https://api.jina.ai/v1/classify`	トレーニングされた少数ショット分類器を使用して入力を分類する		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	入力サイズに依存	トークン数: 入力トークン	POST
セグメンタ API	`https://api.jina.ai/v1/segment`	長いテキストを単語や文に分割する	20 RPM	200 RPM	1,000 RPM	0.3s	トークンの使用量はカウントされません。	GET/POST

残高が少なくなると自動的にチャージする

実稼働環境での中断のないサービスに推奨されます。ワード残高が設定されたしきい値を下回ると、しきい値に達するまで、保存されている支払い方法を使用して、最後に購入したパッケージが自動的にリチャージされます。

新しい価格モデルは 2025 年 5 月 6 日に開始されました。この日付より前に自動リチャージを有効にしていた場合、以前の価格 (つまり購入時の価格) が引き続き請求されます。新しい価格は、自動再チャージ設定を変更した場合、または新しい API キーを購入した場合にのみ適用されます。

< 1M 単語要素

この値より低い場合は充電してください

よくある質問

ディープサーチとは何ですか?

Deep Search は、OpenAI や Gemini のディープリサーチ機能とどう違うのでしょうか?

DeepResearch を使用するにはどのような API キーが必要ですか?

ディープサーチがトークン予算に達すると何が起こりますか?不完全な回答が返されますか?

ディープサーチは回答の正確性を保証できますか?

典型的なディープ検索クエリにはどれくらいの時間がかかりますか?

Deep Search は、Chatwise、CherryStudio、ChatBox などの OpenAI 互換クライアントで動作しますか?

API のレート制限は何ですか?

<think> タグ内には何がありますか?

Deep Search は Web 検索と閲覧に Jina Reader を使用していますか?

ディープサーチではクエリになぜこれほど多くのタグが使用されるのでしょうか?

ステップ数を制御または制限する方法はありますか?

回答内の参照はどの程度信頼できるのでしょうか?

ディープサーチは将来のイベントに関する質問を処理できますか?

API キーを取得するにはどうすればよいですか?

レート制限とは何ですか?

レート制限

列

製品	APIポート	説明する	APIキーがありません	APIキーを使用する	プレミアムAPIキー付属	平均遅延	単語の使用数	リクエストの種類
リーダーAPI	`https://r.jina.ai`	URLをモデルに適した大きなテキストに変換する	20 RPM	500 RPM	5000 RPM	7.9s	出力応答内のトークンの数に基づきます。	GET/POST
リーダーAPI	`https://s.jina.ai`	ウェブを検索し、結果をモデルに適した大きなテキストに変換します		100 RPM	1000 RPM	2.5s	各リクエストには、10000 トークンから始まる固定数のトークンが必要です。	GET/POST
ディープサーチ	`https://deepsearch.jina.ai/v1/chat/completions`	推論し、検索し、繰り返して最善の答えを見つける		50 RPM	500 RPM	56.7s	プロセス全体のトークンの総数をカウントします。	POST
ベクトルモデルAPI	`https://api.jina.ai/v1/embeddings`	テキスト/画像を固定長ベクトルに変換する		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	入力サイズに依存	入力リクエスト内のトークンの数に基づきます。	POST
リオーダラー API	`https://api.jina.ai/v1/rerank`	クエリによるドキュメントの絞り込み		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	入力サイズに依存	入力リクエスト内のトークンの数に基づきます。	POST
分類子 API	`https://api.jina.ai/v1/train`	トレーニングサンプルを使用して分類器をトレーニングする		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	入力サイズに依存	単語数は、入力単語×反復回数で表されます。	POST
分類子 API (ゼロサンプル)	`https://api.jina.ai/v1/classify`	ゼロショット分類を使用して入力を分類する		200 RPM & 500,000 TPM	1,000 RPM & 3,000,000 TPM	入力サイズに依存	単語数は、入力単語とタグ単語の合計です。	POST
分類子 API (小さなサンプル)	`https://api.jina.ai/v1/classify`	トレーニングされた少数ショット分類器を使用して入力を分類する		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	入力サイズに依存	トークン数: 入力トークン	POST
セグメンタ API	`https://api.jina.ai/v1/segment`	長いテキストを単語や文に分割する	20 RPM	200 RPM	1,000 RPM	0.3s	トークンの使用量はカウントされません。	GET/POST

Reader、Embedding、Reranker、Classifier、Fine-Tuned Model API に同じ API キーを使用できますか?

API キーのトークンの使用状況を表示できますか?

API キーを忘れた場合はどうすればよいですか?

API キーには有効期限がありますか?

API キー間でトークン残高を転送できますか?

API キーを破棄してもいいですか?

一部のモデルの初回リクエストに時間がかかるのはなぜですか?

ユーザー入力データはモデルのトレーニングに使用されますか?

API の料金は文の数またはリクエストの数に基づいて課金されますか?

新規ユーザーは無料トライアルを利用できますか?

失敗したリクエストに対してトークンは差し引かれますか?

どのような支払い方法が利用できますか?

Ci Yuanを購入した後に請求書を発行できますか?

ディープサーチ

ディープサーチAPI

DeepSearchパラメータガイド

品質管理

予算トークン

最大試行回数

チームサイズ

情報源制御

直接回答なし

ドメイン名制御

特殊なケース：学術研究

検索言語コード

言語制御のユースケース

Deep Searchとチャット

ディープサーチとは何ですか?

大型モデル

RAGパラダイムと検索機能を備えた大規模モデル

ディープサーチ

API価格表

よくある質問

API キーを取得するにはどうすればよいですか?

レート制限とは何ですか?