新聞
模型
產品
keyboard_arrow_down
讀取器
讀取URL或搜索為大模型提供更好的依據。
向量模型
世界一流的多模態多語言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相關性。
深度搜索
搜索、讀取並推理直到找到最佳答案。
更多的
keyboard_arrow_down
分類器
圖片和文本的零樣本和少樣本分類。
切分器
將長文本切分成塊或詞元。

API 文檔
為您的AI 編程助手 IDE 或大模型自動生成代碼
open_in_new


公司
keyboard_arrow_down
關於我們
聯繫銷售
實習生計劃
加入我們
open_in_new
下載Logo
open_in_new
條款及條件


登錄
login

讀取器

將 URL 轉換為大模型友好輸入,只需在前面添加 r.jina.ai 即可。


讀取器 API

將 URL 轉換為大模型友好輸入,只需在前面添加 r.jina.ai 即可。
key
密鑰和計費
code
用法
more_horiz
更多的
chevron_leftchevron_right

home
speed速率限制
bug_report 問題反饋
help_outline常見問題
服務狀態
chevron_leftchevron_right

globe_book
使用 r.jina.ai 讀取 URL 並獲取其內容
travel_explore
使用 s.jina.ai 搜索網絡並獲取 SERP


upload
請求
GET
curl "https://r.jina.ai/https://example.com"


ReaderLM v2:從 HTML 到 Markdown 和 JSON 的小型語言模型

ReaderLM-v2 是一個 1.5B 參數語言模型,專門用於 HTML 到 Markdown 的轉換和 HTML 到 JSON 的提取。它支持 29 種語言中多達 512K 個詞元的文檔,準確率比其前身高 20%。
讀取發行説明arrow_forward

什麼是讀取器?

將網絡信息輸入大模型是打好基礎的重要一步,但這可能很有挑戰性。最簡單的方法是抓取網頁並輸入原始 HTML。但是,抓取可能很複雜且經常受阻,而且原始 HTML 中充斥着標記和腳本等無關元素。讀取器 API 通過從 URL 中提取核心內容並將其轉換為乾淨的、大模型友好的文本來解決這些問題,從而確保為您的Agent和 RAG 系統提供高質量的輸入。



原始 HTML

讀取器的輸出

用於網頁搜索和 SERP 的讀取器

Reader 可用作 SERP API。它允許您將搜索結果引擎頁面背後的內容提供給您的 LLM。只需在您的查詢前面添加 https://s.jina.ai/?q=,Reader 就會搜索網絡並返回前五個結果及其 URL 和內容,每個結果都以乾淨、LLM 友好的文本顯示。這樣,您就可以始終讓您的 LLM 保持最新狀態,提高其真實性,並減少幻覺。



info 請注意,與上面的演示不同,在實踐中,您不會在網上搜索原始問題來獲取基礎。人們經常做的是重寫原始問題或使用多跳問題。他們讀取檢索到的結果,然後生成其他查詢以根據需要收集更多信息,然後得出最終答案。

讀取器也順便識圖!

網頁上的圖片會使用讀取器中的視覺語言模型自動添加標題,並在輸出中格式化為圖片 alt 標籤。這為您的下游大模型提供了足夠的提示,以將這些圖片納入其推理和總結過程。這意味着您可以詢問有關圖片的問題,選擇特定的圖片,甚至將其 URL 轉發到更強大的 VLM 進行更深入的分析!

讀取器還可以讀取 PDF!

是的,Reader 本身支持 PDF 讀取。它兼容大多數 PDF,包括包含大量圖片的 PDF,而且速度極快!結合大模型,您可以輕鬆快速地構建 ChatPDF 或文檔分析 AI。
open_in_new原始 PDF
open_in_new讀取器結果

而且它是竟然是免費的!

Reader API 可免費使用,並提供靈活的速率限制和定價。它建立在可擴展的基礎架構上,具有高可訪問性、併發性和可靠性。我們努力成為您大模型的首選基礎解決方案。
速率限制
速率限制通過三種方式跟蹤:RPM(每分鐘請求數)和TPM(每分鐘詞元數)。限制按 IP/API 密鑰強制執行,當首先達到 RPM 或 TPM 閾值時,將觸發限制。當您在請求標頭中提供 API 密鑰時,我們會按密鑰而不是 IP 地址跟蹤速率限制。
產品API端口描述arrow_upward無 API 密鑰key_off使用 API 密鑰key帶有高級 API 密鑰key平均延遲詞元使用計數請求類型
讀取器 APIhttps://r.jina.ai將 URL 轉換為大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以輸出響應中的詞元數量為準。GET/POST
讀取器 APIhttps://s.jina.ai搜索網絡並將結果轉換為大模型友好文本block100 RPMtrending_up1000 RPM2.5s每個請求都需要固定數量的詞元,從 10000 個詞元開始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s統計整個過程中詞元的總數。POST
向量模型APIhttps://api.jina.ai/v1/embeddings將文本/圖片轉為定長向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查詢對文檔進行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
分類器 APIhttps://api.jina.ai/v1/train使用訓練樣本訓練分類器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 × 迭代次數POST
分類器 API (少量樣本)https://api.jina.ai/v1/classify使用經過訓練的少樣本分類器對輸入進行分類block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元POST
分類器 API (零樣本)https://api.jina.ai/v1/classify使用零樣本分類對輸入進行分類block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 加 標籤詞元POST
切分器 APIhttps://api.jina.ai/v1/segment對長文本進行分詞分句20 RPM200 RPM1,000 RPM0.3s詞元不計算使用量。GET/POST
別慌!每個新的 API 密鑰都包含一千萬個免費詞元!

API價格表

API 定價基於詞元使用情況。一個 API 密鑰即可訪問所有搜索基礎產品。
使用Jina 搜索底座API
訪問我們所有產品的最簡單方法。隨時充值詞元。
使用更多詞元充值此 API 密鑰
根據您所在的位置,您可能需要支付美元、歐元或其他貨幣的費用。可能需繳納税費。
請輸入正確的API密鑰進行充值
瞭解速率限制
速率限制是指每個 IP 地址/API 密鑰 (RPM) 在一分鐘內可以向 API 發出的最大請求數。請在下面詳細瞭解每個產品和層級的速率限制。
keyboard_arrow_down
速率限制
速率限制通過三種方式跟蹤:RPM(每分鐘請求數)和TPM(每分鐘詞元數)。限制按 IP/API 密鑰強制執行,當首先達到 RPM 或 TPM 閾值時,將觸發限制。當您在請求標頭中提供 API 密鑰時,我們會按密鑰而不是 IP 地址跟蹤速率限制。
產品API端口描述arrow_upward無 API 密鑰key_off使用 API 密鑰key帶有高級 API 密鑰key平均延遲詞元使用計數請求類型
讀取器 APIhttps://r.jina.ai將 URL 轉換為大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以輸出響應中的詞元數量為準。GET/POST
讀取器 APIhttps://s.jina.ai搜索網絡並將結果轉換為大模型友好文本block100 RPMtrending_up1000 RPM2.5s每個請求都需要固定數量的詞元,從 10000 個詞元開始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s統計整個過程中詞元的總數。POST
向量模型APIhttps://api.jina.ai/v1/embeddings將文本/圖片轉為定長向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查詢對文檔進行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
分類器 APIhttps://api.jina.ai/v1/train使用訓練樣本訓練分類器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 × 迭代次數POST
分類器 API (少量樣本)https://api.jina.ai/v1/classify使用經過訓練的少樣本分類器對輸入進行分類block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元POST
分類器 API (零樣本)https://api.jina.ai/v1/classify使用零樣本分類對輸入進行分類block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 加 標籤詞元POST
切分器 APIhttps://api.jina.ai/v1/segment對長文本進行分詞分句20 RPM200 RPM1,000 RPM0.3s詞元不計算使用量。GET/POST

常見問題

使用 讀取器 API 的相關費用是多少?
keyboard_arrow_down
讀取器 API 是免費的,不需要 API 密鑰。只需在您的 URL 前面添加“https://r.jina.ai/”即可。
讀取器 API 如何發揮作用?
keyboard_arrow_down
讀取器 API 使用代理來獲取任何 URL,並在瀏覽器中呈現其內容以提取高質量的主要內容。
讀取器 API 是開源的嗎?
keyboard_arrow_down
是的,讀取器 API 是開源的,可以在 Jina AI GitHub 存儲庫中找到。
讀取器 API 的典型延遲是多少?
keyboard_arrow_down
讀取器 API 通常會在 2 秒內處理 URL 並返回內容,但複雜或動態的頁面可能需要更多時間。
為什麼我應該使用 讀取器 API 而不是自己抓取頁面?
keyboard_arrow_down
抓取可能很複雜且不可靠,尤其是複雜或動態頁面。讀取器 API 提供簡潔、可靠的乾淨大模型級文本輸出。
讀取器 API 是否支持多種語言?
keyboard_arrow_down
讀取器 API 返回 URL 原始語言的內容。它不提供翻譯服務。
如果某個網站屏蔽了 讀取器 API,我該怎麼辦?
keyboard_arrow_down
如果您遇到阻止問題,請聯繫我們的支持團隊尋求幫助和解決方案。
讀取器 API 可以從 PDF 文件中提取內容嗎?
keyboard_arrow_down
雖然 讀取器 API 主要用於網頁,但它可以從 arXiv 等網站上以 HTML 格式查看的 PDF 中提取內容,但它並未針對一般 PDF 提取進行優化。
讀取器 API 可以處理來自網頁的媒體內容嗎?
keyboard_arrow_down
目前,讀取器 API 不處理媒體內容,但未來的增強功能將包括圖片字幕和視頻摘要。
是否可以在本地 HTML 文件上使用 讀取器 API?
keyboard_arrow_down
不可以,讀取器 API 只能處理來自可公開訪問的 URL 的內容。
讀取器 API 是否緩存內容?
keyboard_arrow_down
如果您在 5 分鐘內請求相同的 URL,讀取器 API 將返回緩存的內容。
我可以使用 讀取器API 來訪問登錄後的內容嗎?
keyboard_arrow_down
不幸的是沒有。
我可以使用讀取器 API 訪問 arXiv 上的 PDF 嗎?
keyboard_arrow_down
是的,您可以使用讀取器中的原生 PDF 支持(https://r.jina.ai/https://arxiv.org/pdf/2310.19923v4)或使用 arXiv 中的 HTML 版本(https://r.jina.ai/https://arxiv.org/html/2310.19923v4)
圖片標註在讀取器中如何發揮作用?
keyboard_arrow_down
Reader 為指定 URL 上的所有圖片添加標題,並添加 `Image [idx]: [caption]` 作為 alt 標籤(如果最初沒有)。這使得下游大模型能夠與圖片進行推理、總結等交互。
讀取器的可擴展性如何?我可以在生產中使用它嗎?
keyboard_arrow_down
Reader API 的設計具有高度可擴展性。它根據實時流量自動擴展,最大併發請求數現在約為 4000。我們正在積極維護它,將其作為 Jina AI 的核心產品之一。因此,請放心在生產中使用它。
Reader API 的速率限制是多少?
keyboard_arrow_down
請在下表中查找最新的速率限制信息。請注意,我們正在積極致力於改進 Reader API 的速率限制和性能,因此該表將進行相應更新。
speed速率限制
什麼是 Reader-LM?如何使用它?
keyboard_arrow_down
Reader-LM 是一種新型小型語言模型 (SLM),專為從開放網絡中提取和清理數據而設計。它將原始、嘈雜的 HTML 轉換為乾淨的 markdown,靈感來自 Jina Reader。Reader-LM 注重成本效益和小模型尺寸,既實用又強大。它目前在 AWS、Azure 和 GCP 市場上可用。如果您有特定要求,請通過 sales AT jina.ai 聯繫我們。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure

如何獲取我的 API 密鑰?

video_not_supported

速率限制是多少?

速率限制
速率限制通過三種方式跟蹤:RPM(每分鐘請求數)和TPM(每分鐘詞元數)。限制按 IP/API 密鑰強制執行,當首先達到 RPM 或 TPM 閾值時,將觸發限制。當您在請求標頭中提供 API 密鑰時,我們會按密鑰而不是 IP 地址跟蹤速率限制。
產品API端口描述arrow_upward無 API 密鑰key_off使用 API 密鑰key帶有高級 API 密鑰key平均延遲詞元使用計數請求類型
讀取器 APIhttps://r.jina.ai將 URL 轉換為大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以輸出響應中的詞元數量為準。GET/POST
讀取器 APIhttps://s.jina.ai搜索網絡並將結果轉換為大模型友好文本block100 RPMtrending_up1000 RPM2.5s每個請求都需要固定數量的詞元,從 10000 個詞元開始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s統計整個過程中詞元的總數。POST
向量模型APIhttps://api.jina.ai/v1/embeddings將文本/圖片轉為定長向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查詢對文檔進行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
分類器 APIhttps://api.jina.ai/v1/train使用訓練樣本訓練分類器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 × 迭代次數POST
分類器 API (少量樣本)https://api.jina.ai/v1/classify使用經過訓練的少樣本分類器對輸入進行分類block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元POST
分類器 API (零樣本)https://api.jina.ai/v1/classify使用零樣本分類對輸入進行分類block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 加 標籤詞元POST
切分器 APIhttps://api.jina.ai/v1/segment對長文本進行分詞分句20 RPM200 RPM1,000 RPM0.3s詞元不計算使用量。GET/POST
API相關常見問題
code
我可以對讀取器、向量模型、重排器、分類器和微調模型 API 使用相同的 API 密鑰嗎?
keyboard_arrow_down
是的,同一個 API 密鑰適用於 Jina AI 的所有搜索基礎產品。這包括讀取器、向量模型、重排器、分類器和微調模型 API,所有服務之間共享詞元。
code
我可以查看 API 密鑰的詞元使用情況嗎?
keyboard_arrow_down
是的,您可以在“密鑰和計費”選項卡中輸入您的 API 密鑰來查看詞元最近的使用記錄和剩餘詞元餘額。如果您已登錄 API 密鑰控制面板,也可以在“管理 API 密鑰”選項卡中查看這些詳細信息。
code
如果我忘記了 API 密鑰,該怎麼辦?
keyboard_arrow_down
如果您遺失了充值密鑰並希望找回,請使用您的註冊電子郵件聯繫 support AT jina.ai 尋求幫助。建議登錄以便於安全保存和便捷訪問您的 API 密鑰。
聯繫我們
code
API 密鑰會過期嗎?
keyboard_arrow_down
不,我們的 API 密鑰沒有到期日期。但是,如果您懷疑您的密鑰已被泄露並希望停用它,請聯繫我們的支持團隊尋求幫助。您還可以在API 密鑰控制面板中自助銷燬您的密鑰。
聯繫我們
code
我可以在 API 密鑰之間轉移詞元餘額嗎?
keyboard_arrow_down
是的,您可以將剩餘的付費詞元餘額從一個高級密鑰轉移到另一個密鑰。在API 密鑰控制面板上登錄您的帳户後,在該密鑰的設置界面來轉移所有剩餘的付費詞元餘額。
code
我可以銷燬我的 API 密鑰嗎?
keyboard_arrow_down
是的,如果您認為您的 API 密鑰已被泄露,您可以銷燬該密鑰。銷燬密鑰將立即為所有存儲該密鑰的用户禁用該密鑰,並且所有剩餘詞元餘額和關聯資產將永久不可用。如果您擁有高級密鑰,您可以選擇在銷燬之前將剩餘的已付款詞元餘額轉移到另一個密鑰。請注意,此操作無法撤消。要銷燬密鑰,請前往API 密鑰控制面板中的密鑰設置。
code
為什麼有些機型第一次請求比較慢?
keyboard_arrow_down
這是因為我們的無服務器架構在使用率較低時會卸載某些模型。初始請求會激活或“預熱”模型,這可能需要幾秒鐘。初始激活後,後續請求的處理速度會快得多。
code
用户輸入數據是否用於訓練您的模型?
keyboard_arrow_down
我們遵守嚴格的隱私政策,不會使用用户輸入數據來訓練我們的模型。我們還符合 SOC 2 類型 I 和類型 II 標準,確保高標準的安全性和隱私性。
與計費相關的常見問題
attach_money
API是根據句子的數量或請求的數量計費嗎?
keyboard_arrow_down
我們的定價模型基於處理的詞元總數,允許用户靈活地在任意數量的句子中分配這些詞元,為不同的文本分析需求提供經濟高效的解決方案。
attach_money
新用户可以免費試用嗎?
keyboard_arrow_down
我們為新用户提供免費試用,其中包含一千萬個可用於我們任何模型的詞元,並通過自動生成的 API 密鑰進行兑換。免費詞元用完後,用户可以通過“購買詞元”標籤頁輕鬆購買額外的詞元,用於 API 密鑰。
attach_money
失敗的請求是否會扣除詞元?
keyboard_arrow_down
不,失敗的請求不會扣除詞元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通過 Stripe 處理,支持多種付款方式,包括信用卡、Google Pay 和 PayPal,為您提供方便。
attach_money
詞元購買後可以開具發票嗎?
keyboard_arrow_down
是的,購買詞元后,發票將發送到與您的 Stripe 帳户關聯的電子郵件地址。
辦公室
location_on
加利福尼亞州桑尼維爾
710 Lakeway Dr, Ste 200, 桑尼維爾, CA 94085, 美國
location_on
德國柏林(總部)
Prinzessinnenstraße 19-20,10969 柏林,德國
location_on
中國北京
中國北京市海淀區西大街48號6號樓5層
location_on
中國深圳
中國深圳市賦安科技大廈4樓402
搜索底座
讀取器
向量模型
重排器
深度搜索
分類器
切分器
API 文檔
獲取 Jina API 密鑰
速率限制
API 狀態
公司
關於我們
聯繫銷售
新聞
實習生計劃
加入我們
open_in_new
下載Logo
open_in_new
條款
安全
條款及條件
隱私
管理 Cookie
email
Jina AI © 2020-2025.