あなたの検索基盤 ぐんぐん加速!
私たちの顧客
より良い検索のために
当社の最先端のモデルは、高品質のエンタープライズ検索および RAG システムの検索基盤を形成します。
今すぐ始めましょう - クレジット カードや登録は必要ありません。
verified_user 当社は、米国公認会計士協会 (AICPA) SOC 2 タイプ 1 およびタイプ 2 基準に準拠しています。 open_in_new
chevron_leftchevron_right
globe_book
r.jina.ai を使用して URL を読み取り、その内容を取得します。travel_explore
s.jina.ai でウェブを検索し、SERP を取得します大規模なモデルで API を使用できるようにするには、MCP ツールボックスに
mcp.jina.ai を追加します。コンテンツ形式
過剰なフィルタリングを防ぐために、応答の詳細レベルを制御できます。デフォルトのパイプラインは、ほとんどのサイトと大規模なモデル入力に対して最適化されています。
デフォルト
arrow_drop_down
JSON応答
応答は JSON 形式で、URL、ヘッダー、コンテンツ、およびタイムスタンプ (利用可能な場合) が含まれます。検索モードでは、記述された JSON 構造にそれぞれ従う 5 つのエントリのリストが返されます。
タイムアウト(秒)
ページの読み込みに要する最大待機時間です。ページの読み込みが遅い場合はこの値を増やし、シンプルで静的なページの場合はこの値を下げてください。
トークンの予算
このリクエストで使用されるトークンの最大数を制限します。この制限を超えると、リクエストは失敗します。
ReaderLM-v2の使用
実験
ReaderLM-v2 を使用して HTML を Markdown に変換し、複雑な構造とコンテンツを持つ Web サイトに高品質の結果を提供します。他のエンジンよりも3倍多くのトークンを消費します!open_in_newもっと詳しく知る
抽出のみ(CSSセレクター)
これらのCSSセレクタに一致するコンテンツのみを抽出します。例: article、.main-content、#post-body
待機中(CSSセレクター)
これらの要素が出現した後にのみコンテンツを抽出します。これは、動的に読み込まれるコンテンツに非常に便利です。
除外(CSSセレクター)
抽出する前に、ナビゲーション バー、フッター、サイドバー、#広告などの要素を削除してください。
すべての写真を削除
出力からすべての画像を削除します。これにより、画像が不要な場合のトークンの使用量を削減できます。
OpenAI引用フォーマット
OpenAIのウェブブラウジングツール用のリンクをフォーマットします。GPTモデルと互換性のある特別な参照タグを使用してください。open_in_newもっと詳しく知る
リンク概要セクション
最後に、「ボタンとリンク」セクションを作成します。これは、下流の大規模モデルやWebエージェントがページ内を移動したり、さらなるアクションを実行したりするのに役立ちます。
なし
arrow_drop_down
画像概要セクション
最後に、「写真」セクションが作成されます。これにより、下流の大規模モデルはページ上のすべてのビジュアルを概観できるようになり、推論機能が向上します。
なし
arrow_drop_down
ブラウザのビューポートサイズ
POST
ブラウザウィンドウのサイズを設定します。レスポンシブレイアウトとコンテンツの表示に影響します。open_in_newもっと詳しく知る
転送クッキー
弊社の API サーバーは、URL にアクセスするときにカスタム Cookie 設定を転送できます。これは、追加の認証が必要なページに役立ちます。 Cookie を含むリクエストはキャッシュされないことに注意してください。open_in_newもっと詳しく知る
説明する
指定された URL にあるすべての画像にキャプションを追加し、キャプションのない画像には alt タグとして「Image [idx]: [caption]」を追加します。これにより、大規模な下流モデルは推論や要約などのアクティビティ中に画像を操作できるようになります。
プロキシサーバーを使用する
API サーバーはプロキシを利用して URL にアクセスできます。これは、特定のプロキシ経由でのみアクセスできるページに役立ちます。open_in_newもっと詳しく知る
国別のプロキシサーバーを使用する
ロケーションベースのプロキシ サーバーの国コードを設定します。最適な選択には「自動」を使用し、無効にするには「なし」を使用します。
キャッシュのバイパス
当社の API サーバーは、読み取りモードと検索モードのコンテンツを一定期間キャッシュします。このキャッシュをバイパスするには、このヘッダーを true に設定します。
キャッシュ許容値(秒)
キャッシュされたコンテンツがN秒以内に公開された場合、キャッシュされたコンテンツが受け入れられます。0に設定すると最新のコンテンツが受け入れられます(「キャッシュをバイパスする」のと同じ)。一方、値を大きくすると、キャッシュからのレスポンスの取得速度が向上します。
ページ準備時間
ページが完全に読み込まれたとみなされるのはいつですか? 後のタイミング方法では待機時間が長くなりますが、より動的なコンテンツをキャプチャします。
デフォルト
arrow_drop_down
カスタムユーザーエージェント
ブラウザのユーザーエージェント文字列を上書きします。これは、特定のブラウザを必要とするウェブサイトや、ウェブクローラーをブロックするウェブサイトにアクセスする場合に非常に便利です。
カスタムレコメンダー
HTTP Referer ヘッダーを設定します。一部のウェブサイトでは、トラフィックが想定されたソースから来ているかどうかを確認するためにこのヘッダーをチェックします。
Base64画像を保存
インライン base64 でエンコードされた画像を外部 URL に変換する代わりに、Markdown 出力に保持します。
キャッシュや追跡はしないでください。
このリクエストがキャッシュされたり、サーバーに記録されたりしないようにします。機密性の高いURLのみ対象です。
Github スタイルのマークダウン
GFM (Github Flavored Markdown) 機能のオプトイン/アウト。
有効
arrow_drop_down
ストリーミングモード
ストリーミング モードでは、ターゲット ページを大きくすることが容易になり、ページが完全にレンダリングされるまでにより多くの時間を費やすことができます。標準モードでコンテンツが不完全になる場合は、ストリーミング モードの使用を検討してください。open_in_newもっと詳しく知る
ブラウザのロケールをカスタマイズする
ページをレンダリングするためのブラウザーのロケール設定を制御します。多くの Web サイトは、ロケール設定に基づいて異なるコンテンツを提供します。open_in_newもっと詳しく知る
Robots.txtを尊重する
リソースをスクレイピングする前に、robots.txtファイルのルールを確認してください。チェックするロボットの名前を指定してください。
iframeコンテンツを含む
埋め込まれたiframeからコンテンツを抽出します。この機能は、ページコンテンツがiframe内に読み込まれている場合にのみ有効になります。
Shadow DOMを含む
Shadow DOMコンポーネントからコンテンツを抽出します。Webコンポーネントを使用するページに適しています。
最終 URL をベンチマークとして使用します。
相対 URL を解決するには、元の URL ではなく、リダイレクト後の最終的なターゲット URL を使用します。
ローカル PDF/HTML ファイル
POST
ローカルの PDF および HTML ファイルをアップロードして、リーダーを使用して読み取ります。 pdf および html ファイルのみがサポートされます。
upload
抽出前にJavaScriptを実行する
POST
コンテンツを抽出する前に、カスタムJavaScriptコードを実行してページを変更します。これは、インラインコードまたはスクリプトファイルを指すURLのいずれかです。open_in_newもっと詳しく知る
見出しスタイル
マークダウンのタイトル形式を設定します (Turndown に渡されます)。
ハッシュスタイル
arrow_drop_down
水平線スタイル
マークダウンの水平罫線形式を定義します (Turndown に渡されます)。
箇条書きスタイル
箇条書きリストのマーク文字を設定します (Turndown に渡されます)。
*
arrow_drop_down
スタイルを重視
マークダウン強調区切り文字を定義します (Turndown に渡されます)。
_
arrow_drop_down
スタイルを重視
マークダウンの強い強調区切り文字を設定します (Turndown に渡されます)。
**
arrow_drop_down
リンクスタイル
マークダウン リンク形式を決定します (Turndown に渡されます)。
列をなして
arrow_drop_down
EU規制に準拠
実験
すべてのインフラストラクチャとデータ処理操作は完全に EU の管轄下にあります。
upload
聞く
GET
Bash
言語
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
APIキー
visibility_off
トークン残量
0
私たちの論文
最先端の検索モデルがどのようにゼロから学習されているかを学び、最新の論文をご覧ください。EMNLP、SIGIR、ICLR、NeurIPS、ICMLで私たちのチームに会ってください!
12月 29, 2025
12月 04, 2025
AAAI 2026
10月 01, 2025
NeurIPS 2025
8月 31, 2025
EMNLP 2025
6月 24, 2025
ICLR 2025
3月 04, 2025
ACL 2025
12月 17, 2024
ICLR 2025
12月 12, 2024
ECIR 2025
9月 18, 2024
SIGIR 2025
9月 07, 2024
EMNLP 2024
8月 30, 2024
WWW 2025
6月 21, 2024
ICML 2024
5月 30, 2024
2月 26, 2024
10月 30, 2023
EMNLP 2023
7月 20, 2023
合計で 16 件の論文があります。





































