あなたの検索基盤 ぐんぐん加速!
私たちの顧客
より良い検索のために
当社の最先端のモデルは、高品質のエンタープライズ検索および RAG システムの検索基盤を形成します。
今すぐ始めましょう - クレジット カードや登録は必要ありません。
verified_user 当社は、米国公認会計士協会 (AICPA) SOC 2 タイプ 1 およびタイプ 2 基準に準拠しています。 open_in_new
chevron_leftchevron_right
globe_book
r.jina.ai を使用して URL を読み取り、その内容を取得します。travel_explore
s.jina.ai でウェブを検索し、SERP を取得します大規模なモデルで API を使用できるようにするには、MCP ツールボックスに
mcp.jina.ai を追加します。コンテンツ形式
過剰なフィルタリングを防ぐために、応答の詳細レベルを制御できます。デフォルトのパイプラインは、ほとんどのサイトと大規模なモデル入力に対して最適化されています。
デフォルト
arrow_drop_down
JSON応答
応答は JSON 形式で、URL、ヘッダー、コンテンツ、およびタイムスタンプ (利用可能な場合) が含まれます。検索モードでは、記述された JSON 構造にそれぞれ従う 5 つのエントリのリストが返されます。
タイムアウト
最大ページ読み込み待機時間(合計リクエスト処理時間ではありません)。
トークンの予算
このリクエストで使用されるトークンの最大数を制限します。この制限を超えると、リクエストは失敗します。
ReaderLM-v2の使用
実験
ReaderLM-v2 を使用して HTML を Markdown に変換し、複雑な構造とコンテンツを持つ Web サイトに高品質の結果を提供します。他のエンジンよりも3倍多くのトークンを消費します!
CSSセレクター: のみ
特定のページ要素をターゲットにするために使用される CSS セレクターのリスト。
CSS セレクター: Wait-For
結果を返す前に待機する CSS セレクター。
CSSセレクター: 除外
削除する要素の CSS セレクター (ヘッダー、フッターなど)。
すべての写真を削除
応答からすべての画像を削除します。
すべてのリンクを最後までグループ化する
最後に、「ボタンとリンク」セクションを作成します。これは、下流の大規模モデルやWebエージェントがページ内を移動したり、さらなるアクションを実行したりするのに役立ちます。
なし
arrow_drop_down
最後にすべての写真を集める
最後に、「写真」セクションが作成されます。これにより、下流の大規模モデルはページ上のすべてのビジュアルを概観できるようになり、推論機能が向上します。
なし
arrow_drop_down
転送クッキー
弊社の API サーバーは、URL にアクセスするときにカスタム Cookie 設定を転送できます。これは、追加の認証が必要なページに役立ちます。 Cookie を含むリクエストはキャッシュされないことに注意してください。
説明する
指定された URL にあるすべての画像にキャプションを追加し、キャプションのない画像には alt タグとして「Image [idx]: [caption]」を追加します。これにより、大規模な下流モデルは推論や要約などのアクティビティ中に画像を操作できるようになります。
国別のプロキシサーバーを使用する
ロケーションベースのプロキシ サーバーの国コードを設定します。最適な選択には「自動」を使用し、無効にするには「なし」を使用します。
キャッシュのバイパス
当社の API サーバーは、読み取りモードと検索モードのコンテンツを一定期間キャッシュします。このキャッシュをバイパスするには、このヘッダーを true に設定します。
キャッシュ/トラックしないでください。
有効にすると、リクエストの結果はサーバー上にキャッシュされません。
Github スタイルのマークダウン
GFM (Github Flavored Markdown) 機能のオプトイン/アウト。
有効
arrow_drop_down
ストリーミングモード
ストリーミング モードでは、ターゲット ページを大きくすることが容易になり、ページが完全にレンダリングされるまでにより多くの時間を費やすことができます。標準モードでコンテンツが不完全になる場合は、ストリーミング モードの使用を検討してください。
ブラウザのロケールをカスタマイズする
ページをレンダリングするためのブラウザーのロケール設定を制御します。多くの Web サイトは、ロケール設定に基づいて異なるコンテンツを提供します。
ロボットポリシーを厳守する
コンテンツを取得する前に robots.txt と照合されるロボットの User-Agent を定義します。
iframe 抽出
DOM ツリー内のすべてのベクトル化された iframe のコンテンツを処理します。
シャドウDOM抽出
ドキュメント内のすべての Shadow DOM ルートからコンテンツを抽出します。
リダイレクトページに従う
すべてのリダイレクトをたどった後、最終的な宛先 URL に解決するかどうかを選択します。完全なリダイレクト チェーンを追跡できるようにします。
ローカル PDF/HTML ファイル
POST
ローカルの PDF および HTML ファイルをアップロードして、リーダーを使用して読み取ります。 pdf および html ファイルのみがサポートされます。
upload
見出しスタイル
マークダウンのタイトル形式を設定します (Turndown に渡されます)。
代替タイトル構文
arrow_drop_down
水平線スタイル
マークダウンの水平罫線形式を定義します (Turndown に渡されます)。
箇条書きスタイル
箇条書きリストのマーク文字を設定します (Turndown に渡されます)。
*
arrow_drop_down
スタイルを重視
マークダウン強調区切り文字を定義します (Turndown に渡されます)。
_
arrow_drop_down
スタイルを重視
マークダウンの強い強調区切り文字を設定します (Turndown に渡されます)。
**
arrow_drop_down
リンクスタイル
マークダウン リンク形式を決定します (Turndown に渡されます)。
列をなして
arrow_drop_down
EU規制に準拠
実験
すべてのインフラストラクチャとデータ処理操作は完全に EU の管轄下にあります。
upload
聞く
GET
Bash
言語
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
APIキー
visibility_off
トークン残量
0
私たちの論文
最先端の検索モデルがどのようにゼロから学習されているかを学び、最新の論文をご覧ください。EMNLP、SIGIR、ICLR、NeurIPS、ICMLで私たちのチームに会ってください!
12月 04, 2025
AAAI 2026
10月 01, 2025
NeurIPS 2025
8月 31, 2025
EMNLP 2025
6月 24, 2025
ICLR 2025
3月 04, 2025
ACL 2025
12月 17, 2024
ICLR 2025
12月 12, 2024
ECIR 2025
9月 18, 2024
SIGIR 2025
9月 07, 2024
EMNLP 2024
8月 30, 2024
WWW 2025
6月 21, 2024
ICML 2024
5月 30, 2024
2月 26, 2024
10月 30, 2023
EMNLP 2023
7月 20, 2023
合計で 15 件の論文があります。




































