您的搜索底座 如虎添翼!
立即開始——無需信用卡或註冊!
verified_user我們符合美國註冊會計師協會 (AICPA) 的 SOC 2 Type 1 和 Type 2 標準。open_in_new
chevron_leftchevron_right
globe_book
使用
r.jina.ai 讀取 URL 並獲取其內容travel_explore
使用
s.jina.ai 搜索網絡並獲取 SERP添加
mcp.jina.ai 到您的MCP工具箱,讓大模型學用我們的API內容格式
您可以控制響應中的細節級別,以防止過度過濾。默認管道針對大多數網站和大模型輸入進行了優化。
默認
arrow_drop_down
JSON 響應
響應將採用 JSON 格式,包含 URL、標題、內容和時間戳(如果可用)。在搜索模式下,它會返回一個包含五個條目的列表,每個條目都遵循描述的 JSON 結構。
超時時間(秒)
頁面加載的最長等待時間。頁面加載速度慢時增加此值,簡單的靜態頁面減少此值。
限制詞元預算
限制此請求使用的最大詞元數。超出此限制將導致請求失敗。
使用 ReaderLM-v2
實驗
使用 ReaderLM-v2 將 HTML 轉換為 Markdown,為結構和內容複雜的網站提供高質量的結果。比其它引擎消耗 3 倍詞元!open_in_new瞭解更多
僅提取(CSS 選擇器)
僅提取與這些 CSS 選擇器匹配的內容。例如:article、.main-content、#post-body
等待(CSS 選擇器)
等待這些元素出現後再提取內容。這對於動態加載的內容非常有用。
排除(CSS 選擇器)
提取前請移除以下元素。例如:導航欄、頁腳、側邊欄、#廣告
刪除所有圖片
從輸出中移除所有圖像。這樣可以在不需要圖像時減少令牌使用量。
OpenAI 引用格式
為 OpenAI 的網頁瀏覽工具格式化鏈接。使用與 GPT 模型兼容的特殊引用標記。open_in_new瞭解更多
鏈接摘要部分
最後會創建一個“按鈕和鏈接”部分。這可以幫助下游大模型或 Web 智能體瀏覽頁面或採取進一步的行動。
無
arrow_drop_down
圖片摘要部分
最後會創建一個“圖片”部分。這可以讓下游的大模型概覽頁面上的所有視覺效果,從而提高推理能力。
無
arrow_drop_down
瀏覽器視口大小
POST
設置瀏覽器窗口尺寸。影響響應式佈局和內容可見性。open_in_new瞭解更多
轉發 Cookie
我們的 API 服務器可以在訪問 URL 時轉發您的自定義 Cookie 設置,這對於需要額外身份驗證的頁面非常有用。請注意,帶有 Cookie 的請求不會被緩存。open_in_new瞭解更多
圖片説明
為指定 URL 上的所有圖片添加標題,為沒有標題的圖片添加“Image [idx]: [caption]”作為 alt 標籤。這允許下游大模型在推理和總結等活動中與圖片進行交互。
使用代理服務器
我們的 API 服務器可以利用您的代理來訪問 URL,這對於只能通過特定代理訪問的頁面很有幫助。open_in_new瞭解更多
使用特定國家/地區的代理服務器
設置基於位置的代理服務器的國家代碼。使用“自動”進行最佳選擇或使用“無”禁用。
繞過緩存
我們的 API 服務器會將讀取和搜索模式的內容緩存一段時間。要繞過此緩存,請將此標頭設置為 true。
緩存容錯率(秒)
如果緩存內容的發佈時間小於 N 秒,則接受緩存內容。設置為 0 表示接受最新內容(與“繞過緩存”相同),設置為更高的值則允許從緩存中更快地獲取響應。
頁面準備時間
何時認為頁面已完全加載?較晚的計時方式等待時間更長,但能捕捉到更多動態內容。
默認
arrow_drop_down
自定義用户代理
覆蓋瀏覽器用户代理字符串。這對於訪問需要特定瀏覽器或阻止網絡爬蟲的網站非常有用。
自定義推薦人
設置 HTTP Referer 標頭。有些網站會檢查此標頭以驗證流量是否來自預期來源。
保存 Base64 圖像
將內聯 base64 編碼的圖片保留在 Markdown 輸出中,而不是將其轉換為外部 URL。
請勿緩存或追蹤
阻止此請求被緩存或記錄在我們的服務器上。僅用於敏感網址。
Github 風格的 Markdown
選擇加入/退出 GFM(Github Flavored Markdown)功能。
已啓用
arrow_drop_down
流模式
流模式有利於較大的目標頁面,從而留出更多時間讓頁面完全呈現。如果標準模式導致內容不完整,請考慮使用流模式。open_in_new瞭解更多
自定義瀏覽器區域設置
控制瀏覽器區域設置以呈現頁面。許多網站根據區域設置提供不同的內容。open_in_new瞭解更多
尊重機器人.txt
在抓取資源之前,請檢查 robots.txt 文件中的規則。指定用於檢查的機器人名稱。
包含 iframe 內容
從嵌入式 iframe 中提取內容。僅當頁面內容加載在 iframe 中時啓用此功能。
包含 Shadow DOM
從 Shadow DOM 組件中提取內容。適用於使用 Web 組件的頁面。
使用最終 URL 作為基準
使用重定向後的最終目標 URL 而不是原始 URL 來解析相對 URL。
本地 PDF/HTML 文件
POST
通過上傳本地 PDF 和 HTML 文件,使用讀取器讀取它們。僅支持 pdf 和 html 文件。
upload
提取前運行 JavaScript
POST
在提取內容之前,執行自定義 JS 代碼來修改頁面。可以是內聯代碼,也可以是指向腳本文件的 URL。open_in_new瞭解更多
標題樣式
設置 markdown 標題格式(傳遞給 Turndown)。
哈希風格
arrow_drop_down
水平線樣式
定義 markdown 水平規則格式(傳遞給 Turndown)。
項目符號樣式
設置項目符號列表標記字符(傳遞給 Turndown)。
*
arrow_drop_down
強調風格
定義 markdown 強調分隔符(傳遞給 Turndown)。
_
arrow_drop_down
強調風格
設置 markdown 強強調分隔符(傳遞給 Turndown)。
**
arrow_drop_down
鏈接樣式
確定 markdown 鏈接格式(傳遞給 Turndown)。
內聯
arrow_drop_down
符合歐盟規定
實驗
所有基礎設施和數據處理操作完全在歐盟管轄範圍內。
upload
請求
GET
Bash
語言
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
API密鑰
visibility_off
剩餘詞元額度
0
為了更好的搜索
我們的前沿模型構成了高質量企業搜索和 RAG 系統的搜索底座。
二月 17, 2026
二月 11, 2026
ICLR 2026
一月 22, 2026
十二月 29, 2025
ICLR 2026
十二月 04, 2025
AAAI 2026
十月 01, 2025
NeurIPS 2025
八月 31, 2025
EMNLP 2025
六月 24, 2025
ICLR 2025
三月 04, 2025
ACL 2025
十二月 17, 2024
ICLR 2025
十二月 12, 2024
ECIR 2025
九月 18, 2024
SIGIR 2025
九月 07, 2024
EMNLP 2024
八月 30, 2024
WWW 2025
六月 21, 2024
ICML 2024
五月 30, 2024
二月 26, 2024
十月 30, 2023
EMNLP 2023
七月 20, 2023
共計 19 篇論文。







































