読者
URL を大規模モデルに適した入力に変換するには、先頭に
r.jina.ai
を追加するだけです。リーダーAPI
URL を大規模モデルに適した入力に変換するには、先頭に
r.jina.ai
を追加するだけです。 chevron_leftchevron_right
globe_book
r.jina.ai
を使用して URL を読み取り、その内容を取得します。travel_explore
s.jina.ai
でウェブを検索し、SERP を取得しますコンテンツ形式
過剰なフィルタリングを防ぐために、応答の詳細レベルを制御できます。デフォルトのパイプラインは、ほとんどのサイトと大規模なモデル入力に対して最適化されています。
デフォルト
arrow_drop_down
JSON応答
応答は JSON 形式で、URL、ヘッダー、コンテンツ、およびタイムスタンプ (利用可能な場合) が含まれます。検索モードでは、記述された JSON 構造にそれぞれ従う 5 つのエントリのリストが返されます。
タイムアウト
最大ページ読み込み待機時間(合計リクエスト処理時間ではありません)。
トークンの予算
このリクエストで使用されるトークンの最大数を制限します。この制限を超えると、リクエストは失敗します。
ReaderLM-v2の使用
実験
ReaderLM-v2 を使用して HTML を Markdown に変換し、複雑な構造とコンテンツを持つ Web サイトに高品質の結果を提供します。他のエンジンよりも3倍多くのトークンを消費します!
CSSセレクター: のみ
特定のページ要素をターゲットにするために使用される CSS セレクターのリスト。
CSS セレクター: Wait-For
結果を返す前に待機する CSS セレクター。
CSSセレクター: 除外
削除する要素の CSS セレクター (ヘッダー、フッターなど)。
すべての写真を削除
応答からすべての画像を削除します。
すべてのリンクを最後までグループ化する
最後に、「ボタンとリンク」セクションが作成されます。これにより、下流の大規模モデルや Web エージェントがページを参照したり、さらにアクションを実行したりできるようになります。
なし
arrow_drop_down
最後にすべての写真を集める
最後に、「写真」セクションが作成されます。これにより、下流の大規模モデルはページ上のすべてのビジュアルを概観できるようになり、推論機能が向上します。
なし
arrow_drop_down
転送クッキー
弊社の API サーバーは、URL にアクセスするときにカスタム Cookie 設定を転送できます。これは、追加の認証が必要なページに役立ちます。 Cookie を含むリクエストはキャッシュされないことに注意してください。
説明する
指定された URL にあるすべての画像にキャプションを追加し、キャプションのない画像には alt タグとして「Image [idx]: [caption]」を追加します。これにより、大規模な下流モデルは推論や要約などのアクティビティ中に画像を操作できるようになります。
国別のプロキシサーバーを使用する
ロケーションベースのプロキシ サーバーの国コードを設定します。最適な選択には「自動」を使用し、無効にするには「なし」を使用します。
キャッシュのバイパス
当社の API サーバーは、読み取りモードと検索モードのコンテンツを一定期間キャッシュします。このキャッシュをバイパスするには、このヘッダーを true に設定します。
キャッシュ/トラックしないでください。
有効にすると、リクエストの結果はサーバー上にキャッシュされません。
Github スタイルのマークダウン
GFM (Github Flavored Markdown) 機能のオプトイン/アウト。
有効
arrow_drop_down
ストリーミングモード
ストリーミング モードでは、ターゲット ページを大きくすることが容易になり、ページが完全にレンダリングされるまでにより多くの時間を費やすことができます。標準モードでコンテンツが不完全になる場合は、ストリーミング モードの使用を検討してください。
ブラウザのロケールをカスタマイズする
ページをレンダリングするためのブラウザーのロケール設定を制御します。多くの Web サイトは、ロケール設定に基づいて異なるコンテンツを提供します。
ロボットポリシーを厳守する
コンテンツを取得する前に robots.txt と照合されるロボットの User-Agent を定義します。
iframe 抽出
DOM ツリー内のすべての iframe 埋め込みコンテンツを処理します。
シャドウDOM抽出
ドキュメント内のすべての Shadow DOM ルートからコンテンツを抽出します。
リダイレクトページに従う
すべてのリダイレクトをたどった後、最終的な宛先 URL に解決するかどうかを選択します。完全なリダイレクト チェーンを追跡できるようにします。
ローカル PDF/HTML ファイル
POST
ローカルの PDF および HTML ファイルをアップロードして、リーダーを使用して読み取ります。 pdf および html ファイルのみがサポートされます。
upload
見出しスタイル
マークダウンのタイトル形式を設定します (Turndown に渡されます)。
代替タイトル構文
arrow_drop_down
水平線スタイル
マークダウンの水平罫線形式を定義します (Turndown に渡されます)。
箇条書きスタイル
箇条書きリストのマーク文字を設定します (Turndown に渡されます)。
*
arrow_drop_down
スタイルを重視
マークダウン強調区切り文字を定義します (Turndown に渡されます)。
_
arrow_drop_down
スタイルを重視
マークダウンの強い強調区切り文字を設定します (Turndown に渡されます)。
**
arrow_drop_down
リンクスタイル
マークダウン リンク形式を決定します (Turndown に渡されます)。
列をなして
arrow_drop_down
EU規制に準拠
すべてのインフラストラクチャとデータ処理操作は完全に EU の管轄下にあります。
upload
聞く
GET
Bash
言語
arrow_drop_down
curl "https://r.jina.ai/https://example.com"
key
APIキー
visibility_off
トークン残量
0
ReaderLM v2: HTML から Markdown および JSON までの小規模な言語モデル
ReaderLM-v2 は、HTML から Markdown への変換および HTML から JSON への抽出のために特別に設計された 1.5B パラメーター言語モデルです。 29 言語で最大 512,000 トークンのドキュメントをサポートし、以前のものよりも 20% 精度が向上しています。
ネットワーク情報をより大きなモデルに取り込むことは、優れた基盤を構築するための重要なステップですが、困難な場合もあります。最も簡単な方法は、Web ページをスクレイピングして生の HTML を入力することです。ただし、クロールは複雑でブロックされることが多く、生の HTML にはタグやスクリプトなどの不要な要素が混在します。 Reader API は、URL からコア コンテンツを抽出し、それをクリーンで大きなモデル対応テキストに変換することでこれらの問題を解決し、エージェントおよび RAG システムへの高品質の入力を保証します。
URLを入力してください
リーダーの URL
生のHTML
リーダー出力
質問する
Reader は SERP API として使用できます。これにより、SERP の背後にあるコンテンツを LLM に提供できるようになります。クエリの先頭に
https://s.jina.ai/?q=
を追加するだけで、Reader は Web を検索し、URL とコンテンツを含む上位 5 件の結果を、それぞれ LLM に適したわかりやすいテキストで返します。こうすることで、LLM を常に最新の状態に保ち、信頼性を高め、誤解を減らすことができます。クエリを入力してください
リーダーの URL
info 上記のデモンストレーションとは異なり、実際には、根拠を得るために元の質問を Web で検索する必要はないことに注意してください。よく行われるのは、元の問題を書き直したり、マルチホップの問題を使用したりすることです。検索結果を読み取り、最終的な回答に到達する前に、必要に応じて追加のクエリを生成してさらに情報を収集します。
Web 上の画像は、リーダーの視覚言語モデルを使用して自動的にキャプションが付けられ、出力では画像の alt タグとしてフォーマットされます。これにより、下流の大規模モデルがこれらの画像を推論および要約プロセスに組み込むための十分なヒントが提供されます。つまり、画像について質問したり、特定の画像を選択したり、さらに強力な VLM に URL を転送してより詳細な分析を行ったりすることもできます。
はい、Reader は PDF の読み取りをネイティブにサポートしています。画像の多い PDF も含め、ほとんどの PDF と互換性があり、非常に高速です。ビッグモデルと組み合わせることで、ChatPDF やドキュメント分析 AI を簡単かつ迅速に構築できます。
そしてそれは実際には無料です!
Reader API は無料で使用でき、柔軟なレート制限と価格設定を提供します。高いアクセシビリティ、同時実行性、信頼性を備えたスケーラブルなインフラストラクチャ上に構築されています。当社は、大型モデルの基礎ソリューションとしてお客様に選ばれるよう努めています。
レート制限
列
arrow_drop_down
製品 | APIポート | 説明するarrow_upward | APIキーがありませんkey_off | APIキーを使用するkey | プレミアムAPIキー付属key | 平均遅延 | 単語の使用数 | リクエストの種類 | |
---|---|---|---|---|---|---|---|---|---|
リーダーAPI | https://r.jina.ai | URLをモデルに適した大きなテキストに変換する | 20 RPM | 200 RPM | trending_up2000 RPM | 4.6s | 出力応答内のトークンの数に基づきます。 | GET/POST | |
リーダーAPI | https://s.jina.ai | ウェブを検索し、結果をモデルに適した大きなテキストに変換します | block | 40 RPM | trending_up400 RPM | 5.7s | 各リクエストには、10000 トークンから始まる固定数のトークンが必要です。 | GET/POST | |
ディープサーチ | https://deepsearch.jina.ai/v1/chat/completions | 推論し、検索し、繰り返して最善の答えを見つける | 1 RPM | 10 RPM | 100 RPM | 56.7s | プロセス全体のトークンの総数をカウントします。 | POST | |
ベクトルモデルAPI | https://api.jina.ai/v1/embeddings | テキスト/画像を固定長ベクトルに変換する | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 入力サイズに依存 help | 入力リクエスト内のトークンの数に基づきます。 | POST | |
リオーダラー API | https://api.jina.ai/v1/rerank | クエリによるドキュメントの絞り込み | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 入力サイズに依存 help | 入力リクエスト内のトークンの数に基づきます。 | POST | |
分類子 API | https://api.jina.ai/v1/train | トレーニング サンプルを使用して分類器をトレーニングする | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 入力サイズに依存 | 単語数は、入力単語×反復回数で表されます。 | POST | |
分類子 API (ゼロサンプル) | https://api.jina.ai/v1/classify | ゼロショット分類を使用して入力を分類する | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart 入力サイズに依存 | 単語数は、入力単語とタグ単語の合計です。 | POST | |
分類子 API (小さなサンプル) | https://api.jina.ai/v1/classify | トレーニングされた少数ショット分類器を使用して入力を分類する | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 入力サイズに依存 | トークン数: 入力トークン | POST | |
セグメンタ API | https://api.jina.ai/v1/segment | 長いテキストを単語や文に分割する | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | トークンの使用量はカウントされません。 | GET/POST |
パニックにならない!すべての新しい API キーには 100 万個の無料トークンが含まれています。
API価格表
API の価格はトークンの使用量に基づいて決まります。すべての Search Essentials 製品にアクセスするための 1 つの API キー。
Reader API の使用に関連するコストはいくらですか?
keyboard_arrow_down
Reader API はどのように機能しますか?
keyboard_arrow_down
リーダー API はオープンソースですか?
keyboard_arrow_down
Reader API の一般的なレイテンシはどれくらいですか?
keyboard_arrow_down
自分でページをスクレイピングする代わりに Reader API を使用する必要があるのはなぜですか?
keyboard_arrow_down
Reader API は複数の言語をサポートしていますか?
keyboard_arrow_down
Web サイトが Reader API をブロックした場合はどうすればよいですか?
keyboard_arrow_down
Reader API は PDF ファイルからコンテンツを抽出できますか?
keyboard_arrow_down
Reader API は Web ページのメディア コンテンツを処理できますか?
keyboard_arrow_down
ローカル HTML ファイルで Reader API を使用することはできますか?
keyboard_arrow_down
Reader API はコンテンツをキャッシュしますか?
keyboard_arrow_down
ログイン後に Reader API を使用してコンテンツにアクセスできますか?
keyboard_arrow_down
Reader API を使用して arXiv 上の PDF にアクセスできますか?
keyboard_arrow_down
画像の注釈はリーダーでどのように機能しますか?
keyboard_arrow_down
リーダーの拡張性はどの程度ですか?これを本番環境で使用できますか?
keyboard_arrow_down
Reader API のレート制限は何ですか?
keyboard_arrow_down
Reader-LMとは何ですか?使い方は?
keyboard_arrow_down
レート制限
列
arrow_drop_down
製品 | APIポート | 説明するarrow_upward | APIキーがありませんkey_off | APIキーを使用するkey | プレミアムAPIキー付属key | 平均遅延 | 単語の使用数 | リクエストの種類 | |
---|---|---|---|---|---|---|---|---|---|
リーダーAPI | https://r.jina.ai | URLをモデルに適した大きなテキストに変換する | 20 RPM | 200 RPM | trending_up2000 RPM | 4.6s | 出力応答内のトークンの数に基づきます。 | GET/POST | |
リーダーAPI | https://s.jina.ai | ウェブを検索し、結果をモデルに適した大きなテキストに変換します | block | 40 RPM | trending_up400 RPM | 5.7s | 各リクエストには、10000 トークンから始まる固定数のトークンが必要です。 | GET/POST | |
ディープサーチ | https://deepsearch.jina.ai/v1/chat/completions | 推論し、検索し、繰り返して最善の答えを見つける | 1 RPM | 10 RPM | 100 RPM | 56.7s | プロセス全体のトークンの総数をカウントします。 | POST | |
ベクトルモデルAPI | https://api.jina.ai/v1/embeddings | テキスト/画像を固定長ベクトルに変換する | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 入力サイズに依存 help | 入力リクエスト内のトークンの数に基づきます。 | POST | |
リオーダラー API | https://api.jina.ai/v1/rerank | クエリによるドキュメントの絞り込み | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 入力サイズに依存 help | 入力リクエスト内のトークンの数に基づきます。 | POST | |
分類子 API | https://api.jina.ai/v1/train | トレーニング サンプルを使用して分類器をトレーニングする | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 入力サイズに依存 | 単語数は、入力単語×反復回数で表されます。 | POST | |
分類子 API (ゼロサンプル) | https://api.jina.ai/v1/classify | ゼロショット分類を使用して入力を分類する | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart 入力サイズに依存 | 単語数は、入力単語とタグ単語の合計です。 | POST | |
分類子 API (小さなサンプル) | https://api.jina.ai/v1/classify | トレーニングされた少数ショット分類器を使用して入力を分類する | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 入力サイズに依存 | トークン数: 入力トークン | POST | |
セグメンタ API | https://api.jina.ai/v1/segment | 長いテキストを単語や文に分割する | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | トークンの使用量はカウントされません。 | GET/POST |
API関連のFAQ
code
Reader、Vector Model、Rearranger、Classifier、Fine-Tuned Model API に同じ API キーを使用できますか?
keyboard_arrow_down
code
API キーのトークンの使用状況を表示できますか?
keyboard_arrow_down
code
API キーを忘れた場合はどうすればよいですか?
keyboard_arrow_down
code
API キーには有効期限がありますか?
keyboard_arrow_down
code
API キー間でトークン残高を転送できますか?
keyboard_arrow_down
code
API キーを破棄してもいいですか?
keyboard_arrow_down
code
一部のモデルの初回リクエストに時間がかかるのはなぜですか?
keyboard_arrow_down
code
ユーザー入力データはモデルのトレーニングに使用されますか?
keyboard_arrow_down
請求に関するよくある質問
attach_money
API の料金は文の数またはリクエストの数に基づいて課金されますか?
keyboard_arrow_down
attach_money
新規ユーザーは無料トライアルを利用できますか?
keyboard_arrow_down
attach_money
失敗したリクエストに対してトークンは差し引かれますか?
keyboard_arrow_down
attach_money
どのような支払い方法が利用できますか?
keyboard_arrow_down
attach_money
Ci Yuanを購入した後に請求書を発行できますか?
keyboard_arrow_down