您的搜索底座 如虎添翼!
我們的客户
為了更好的搜索
我們的前沿模型構成了高質量企業搜索和 RAG 系統的搜索底座。
立即開始——無需信用卡或註冊!
verified_user 我們符合美國註冊會計師協會 (AICPA) 的 SOC 2 Type 1 和 Type 2 標準。 open_in_new
chevron_leftchevron_right
globe_book
使用
r.jina.ai
讀取 URL 並獲取其內容travel_explore
使用
s.jina.ai
搜索網絡並獲取 SERP內容格式
您可以控制響應中的細節級別,以防止過度過濾。默認管道針對大多數網站和大模型輸入進行了優化。
默認
arrow_drop_down
JSON 響應
響應將採用 JSON 格式,包含 URL、標題、內容和時間戳(如果可用)。在搜索模式下,它會返回一個包含五個條目的列表,每個條目都遵循描述的 JSON 結構。
超時時間
最大頁面加載等待時間(不是總請求處理時間)。
限制詞元預算
限制此請求使用的最大詞元數。超出此限制將導致請求失敗。
使用 ReaderLM-v2
實驗
使用 ReaderLM-v2 將 HTML 轉換為 Markdown,為結構和內容複雜的網站提供高質量的結果。比其它引擎消耗 3 倍詞元!
CSS 選擇器:僅限
用於定位特定頁面元素的 CSS 選擇器列表。
CSS 選擇器:Wait-For
返回結果之前要等待的 CSS 選擇器。
CSS 選擇器:排除
要刪除的元素的 CSS 選擇器(頁眉、頁腳等)。
刪除所有圖片
從響應中刪除所有圖片。
將所有鏈接集中到最後
最後會創建一個“按鈕和鏈接”部分。這可以幫助下游大模型或 Web 代理瀏覽頁面或採取進一步的行動。
無
arrow_drop_down
將所有圖片集中到最後
最後會創建一個“圖片”部分。這可以讓下游的大模型概覽頁面上的所有視覺效果,從而提高推理能力。
無
arrow_drop_down
轉發 Cookie
我們的 API 服務器可以在訪問 URL 時轉發您的自定義 Cookie 設置,這對於需要額外身份驗證的頁面非常有用。請注意,帶有 Cookie 的請求不會被緩存。
圖片説明
為指定 URL 上的所有圖片添加標題,為沒有標題的圖片添加“Image [idx]: [caption]”作為 alt 標籤。這允許下游大模型在推理和總結等活動中與圖片進行交互。
使用特定國家/地區的代理服務器
設置基於位置的代理服務器的國家代碼。使用“自動”進行最佳選擇或使用“無”禁用。
繞過緩存
我們的 API 服務器會將讀取和搜索模式的內容緩存一段時間。要繞過此緩存,請將此標頭設置為 true。
請勿緩存/跟蹤!
啓用後,請求結果將不會緩存在我們的服務器上。
Github 風格的 Markdown
選擇加入/退出 GFM(Github Flavored Markdown)功能。
已啓用
arrow_drop_down
嚴格遵守機器人政策
定義機器人用户代理 (User-Agent),在獲取內容之前對照 robots.txt 進行檢查。
iframe 提取
處理 DOM 樹中所有嵌入 iframe 的內容。
影子 DOM 提取
從文檔中的所有 Shadow DOM 根中提取內容。
關注重定向頁面
選擇是否在遵循所有重定向後解析到最終目標網址。啓用以遵循完整的重定向鏈。
本地 PDF/HTML 文件
POST
通過上傳本地 PDF 和 HTML 文件,使用讀取器讀取它們。僅支持 pdf 和 html 文件。
upload
標題樣式
設置 markdown 標題格式(傳遞給 Turndown)。
替代標題語法
arrow_drop_down
水平線樣式
定義 markdown 水平規則格式(傳遞給 Turndown)。
項目符號樣式
設置項目符號列表標記字符(傳遞給 Turndown)。
*
arrow_drop_down
強調風格
定義 markdown 強調分隔符(傳遞給 Turndown)。
_
arrow_drop_down
強調風格
設置 markdown 強強調分隔符(傳遞給 Turndown)。
**
arrow_drop_down
鏈接樣式
確定 markdown 鏈接格式(傳遞給 Turndown)。
內聯
arrow_drop_down
符合歐盟規定
所有基礎設施和數據處理操作完全在歐盟管轄範圍內。
upload
請求
GET
Bash
語言
arrow_drop_down
curl "https://r.jina.ai/https://example.com"
key
API密鑰
visibility_off
剩餘詞元額度
0