Jina Reader：搜尋系統輔助，提升大型語言模型的事實性

對於 GenAI 應用而言，資料依據（Grounding）是絕對重要的。

自 2023 年以來，您可能已看到許多工具、提示（prompts）和 RAG 管道，都是為了提升 LLMs 的事實準確性而設計的。為什麼？因為阻止企業向數百萬用戶部署 LLMs 的主要障礙是信任度：答案是真實的，還是僅僅是模型的幻覺（hallucination）？這是整個產業的問題，而 Jina AI 一直在努力解決。今天，透過新的 Jina Reader 搜尋依據功能，您只需使用 https://s.jina.ai/YOUR_SEARCH_QUERY 就能從網路上搜尋最新的世界知識。有了這個功能，您就離提升 LLMs 的事實準確性更近一步，使其回應更加可信且有幫助。

tagLLMs 的事實準確性問題

我們都知道 LLMs 可能會編造內容並損害用戶信任。LLMs 可能會說出不符事實的內容（即所謂的幻覺），特別是對於它們在訓練期間沒有學習到的主題。這可能是訓練後產生的新資訊，或是在訓練過程中被「邊緣化」的專門知識。

因此，當遇到「今天天氣如何？」或「今年誰獲得了奧斯卡最佳女主角？」這類問題時，模型要麼回答「我不知道」，要麼給出過時的資訊。

Interactive web interface for querying Jina AI's founding details with input fields, navigation options, and informational no — 這是專門知識在訓練中被「邊緣化」的一個例子。當我們向 `GPT-3.5-turbo` 詢問「Jina AI 是何時成立的？」時，得到了錯誤的答案。然而，當使用 Reader 進行搜尋依據時，相同的 LLM 能夠提供正確答案。實際上，它精確到了具體日期。

Screen interface for inquiring about SpaceX launches with a query field and details about upcoming missions. — 這是訓練後產生的新資訊的例子。我們向 `GPT-3.5-turbo` 詢問「SpaceX 下一次發射是什麼時候？」（現在是 2024 年 5 月 14 日），模型回覆的是 2021 年的舊資訊。

tagJina Reader 如何幫助提供更好的資料依據

之前，用戶可以輕鬆地在網址前加上 https://r.jina.ai，將特定 URL 的文字和圖片內容讀取成 LLM 友好的格式，用於檢查依據和事實驗證。自 4 月 15 日首次發布以來，我們已經處理了超過 1800 萬次來自全球的請求，顯示其受歡迎程度。

今天，我們很高興透過引入搜尋依據 API https://s.jina.ai 進一步推進。只需在查詢前加上這個前綴，Reader 就會搜尋網路並檢索前 5 個結果。每個結果都包含標題、LLM 友好的 markdown（完整內容！不是摘要）以及URL，讓您能夠引用來源。以下是一個例子，您也可以試試我們的即時 demo。

左：Markdown 模式（直接訪問 https://s.jina.ai/who+is+han+xiao）；右：JSON 模式（使用 `curl https://s.jina.ai/who+is+han+xiao -H 'accept: application/json'`）。順便說一下，這種自我相關的問題總是作為一個很好的測試案例。

在設計 Reader 的搜尋依據時，我們遵循三個原則：

提高事實準確性；
獲取最新資訊，即世界知識；
將答案與其來源連結。

除了使用極其簡單外，s.jina.ai 還具有高度的可擴展性和客製化能力，因為它利用了現有的靈活且可擴展的 r.jina.ai 基礎設施。您可以透過請求標頭設置參數來控制圖片說明、過濾粒度等。

Configuration screen of Reader API with options for API behavior, proxy settings, and cookie forwarding against a dark backgr — 嘗試 Reader API 進階用法的互動式程式碼片段

tagJina Reader 作為全面的資料依據解決方案

Technical flowchart on a black background illustrating the processing of knowledge through various AI-related URLs.

如果我們結合搜尋依據（s.jina.ai）和檢查依據（r.jina.ai），我們可以為 LLMs、代理和 RAG 系統建立一個非常全面的資料依據解決方案。在一個典型的可信賴 RAG 工作流程中，Jina Reader 的工作方式如下：

用戶輸入問題；
使用 s.jina.ai 從網路獲取最新資訊；
根據上一步驟的搜尋結果生成初始答案並引用來源；
使用r.jina.ai 將答案連結到您自己的 URL；或從步驟 3 返回的來源讀取內嵌 URL 以獲得更深入的依據；
生成最終答案並向用戶標示潛在未經驗證的聲明。

tag使用 API Keys 提高使用限制

用戶無需授權即可免費使用新的搜尋基礎查詢端點。此外，當在請求標頭中提供 Jina AI API key（可與 Embedding/Reranking API 使用相同的金鑰）時，您可以立即享受 r.jina.ai 每個 IP 每分鐘 200 個請求，以及 s.jina.ai 每個 IP 每分鐘 40 個請求的額度。詳細資訊請參考下表：

端點	描述	無 API key 的使用限制	有 API key 的使用限制	Token 計算方式	平均延遲
`r.jina.ai`	讀取 URL 並返回其內容，適用於檢查基礎依據	20 RPM	200 RPM	基於輸出 tokens	3 秒
`s.jina.ai`	在網路上搜尋並返回前 5 個結果，適用於搜尋基礎依據	5 RPM	40 RPM	基於所有 5 個搜尋結果的輸出 tokens	30 秒

tag結論

我們相信基礎依據對生成式 AI 應用程式至關重要，且建立具有基礎依據的解決方案應該讓每個人都能輕鬆做到。這就是我們推出新的搜尋基礎查詢端點 s.jina.ai 的原因，它讓開發人員能夠輕鬆地將世界知識整合到他們的生成式 AI 應用程式中。我們希望開發人員能夠建立用戶信任，提供可解釋的答案，並激發數百萬用戶的好奇心。