あなたの検索基盤 ぐんぐん加速!
私たちの顧客
より良い検索のために
当社の最先端のモデルは、高品質のエンタープライズ検索および RAG システムの検索基盤を形成します。
今すぐ始めましょう - クレジット カードや登録は必要ありません。
verified_user 当社は、米国公認会計士協会 (AICPA) SOC 2 タイプ 1 およびタイプ 2 基準に準拠しています。 open_in_new
chevron_leftchevron_right
globe_book
r.jina.ai
を使用して URL を読み取り、その内容を取得します。travel_explore
s.jina.ai
でウェブを検索し、SERP を取得しますコンテンツ形式
過剰なフィルタリングを防ぐために、応答の詳細レベルを制御できます。デフォルトのパイプラインは、ほとんどのサイトと大規模なモデル入力に対して最適化されています。
デフォルト
arrow_drop_down
JSON応答
応答は JSON 形式で、URL、ヘッダー、コンテンツ、およびタイムスタンプ (利用可能な場合) が含まれます。検索モードでは、記述された JSON 構造にそれぞれ従う 5 つのエントリのリストが返されます。
タイムアウト
最大ページ読み込み待機時間(合計リクエスト処理時間ではありません)。
トークンの予算
このリクエストで使用されるトークンの最大数を制限します。この制限を超えると、リクエストは失敗します。
ReaderLM-v2の使用
実験
ReaderLM-v2 を使用して HTML を Markdown に変換し、複雑な構造とコンテンツを持つ Web サイトに高品質の結果を提供します。他のエンジンよりも3倍多くのトークンを消費します!
CSSセレクター: のみ
特定のページ要素をターゲットにするために使用される CSS セレクターのリスト。
CSS セレクター: Wait-For
結果を返す前に待機する CSS セレクター。
CSSセレクター: 除外
削除する要素の CSS セレクター (ヘッダー、フッターなど)。
すべての写真を削除
応答からすべての画像を削除します。
すべてのリンクを最後までグループ化する
最後に、「ボタンとリンク」セクションが作成されます。これにより、下流の大規模モデルや Web エージェントがページを参照したり、さらにアクションを実行したりできるようになります。
なし
arrow_drop_down
最後にすべての写真を集める
最後に、「写真」セクションが作成されます。これにより、下流の大規模モデルはページ上のすべてのビジュアルを概観できるようになり、推論機能が向上します。
なし
arrow_drop_down
転送クッキー
弊社の API サーバーは、URL にアクセスするときにカスタム Cookie 設定を転送できます。これは、追加の認証が必要なページに役立ちます。 Cookie を含むリクエストはキャッシュされないことに注意してください。
説明する
指定された URL にあるすべての画像にキャプションを追加し、キャプションのない画像には alt タグとして「Image [idx]: [caption]」を追加します。これにより、大規模な下流モデルは推論や要約などのアクティビティ中に画像を操作できるようになります。
国別のプロキシサーバーを使用する
ロケーションベースのプロキシ サーバーの国コードを設定します。最適な選択には「自動」を使用し、無効にするには「なし」を使用します。
キャッシュのバイパス
当社の API サーバーは、読み取りモードと検索モードのコンテンツを一定期間キャッシュします。このキャッシュをバイパスするには、このヘッダーを true に設定します。
キャッシュ/トラックしないでください。
有効にすると、リクエストの結果はサーバー上にキャッシュされません。
Github スタイルのマークダウン
GFM (Github Flavored Markdown) 機能のオプトイン/アウト。
有効
arrow_drop_down
ストリーミングモード
ストリーミング モードでは、ターゲット ページを大きくすることが容易になり、ページが完全にレンダリングされるまでにより多くの時間を費やすことができます。標準モードでコンテンツが不完全になる場合は、ストリーミング モードの使用を検討してください。
ブラウザのロケールをカスタマイズする
ページをレンダリングするためのブラウザーのロケール設定を制御します。多くの Web サイトは、ロケール設定に基づいて異なるコンテンツを提供します。
ロボットポリシーを厳守する
コンテンツを取得する前に robots.txt と照合されるロボットの User-Agent を定義します。
iframe 抽出
DOM ツリー内のすべての iframe 埋め込みコンテンツを処理します。
シャドウDOM抽出
ドキュメント内のすべての Shadow DOM ルートからコンテンツを抽出します。
リダイレクトページに従う
すべてのリダイレクトをたどった後、最終的な宛先 URL に解決するかどうかを選択します。完全なリダイレクト チェーンを追跡できるようにします。
ローカル PDF/HTML ファイル
POST
ローカルの PDF および HTML ファイルをアップロードして、リーダーを使用して読み取ります。 pdf および html ファイルのみがサポートされます。
upload
見出しスタイル
マークダウンのタイトル形式を設定します (Turndown に渡されます)。
番号記号タイトル
arrow_drop_down
水平線スタイル
マークダウンの水平罫線形式を定義します (Turndown に渡されます)。
箇条書きスタイル
箇条書きリストのマーク文字を設定します (Turndown に渡されます)。
*
arrow_drop_down
スタイルを重視
マークダウン強調区切り文字を定義します (Turndown に渡されます)。
_
arrow_drop_down
スタイルを重視
マークダウンの強い強調区切り文字を設定します (Turndown に渡されます)。
**
arrow_drop_down
リンクスタイル
マークダウン リンク形式を決定します (Turndown に渡されます)。
列をなして
arrow_drop_down
EU規制に準拠
すべてのインフラストラクチャとデータ処理操作は完全に EU の管轄下にあります。
upload
聞く
GET
Bash
言語
arrow_drop_down
curl https://r.jina.ai/https://example.com
key
APIキー
visibility_off
トークン残量
0
私たちの論文
最先端の検索モデルがゼロからトレーニングされる方法を学び、最新の出版物をチェックしてください。 EMNLP、SIGIR、ICLR、NeurIPS、ICML のチームをご紹介します。