Jina Reader：利用检索增强改进大语言模型的事实准确性

对 GenAI 应用来说，Grounding 是绝对必要的。

自 2023 年以来，您可能已经看到许多工具、提示和 RAG 流水线，都是为了提高 LLMs 的事实准确性而设计的。为什么？因为阻止企业向数百万用户部署 LLMs 的主要障碍是信任：这个回答是真实的，还是模型的幻觉？这是一个行业性的问题，Jina AI 一直在努力解决。今天，通过 Jina Reader 的新搜索 grounding 功能，您只需使用 https://s.jina.ai/YOUR_SEARCH_QUERY 就可以搜索来自网络的最新世界知识。有了这个功能，您就能更好地提高 LLMs 的事实准确性，使它们的回答更加可信和有用。

tagLLMs 的事实准确性问题

我们都知道 LLMs 可能会编造内容并损害用户信任。LLMs 可能会说出不真实的事情（即产生幻觉），特别是在涉及训练期间未学习到的主题时。这可能是训练后产生的新信息，或者是在训练过程中被"边缘化"的小众知识。

因此，当涉及到"今天天气如何？"或"今年奥斯卡最佳女演员是谁？"这样的问题时，模型要么回答"我不知道"，要么给出过时的信息。

Interactive web interface for querying Jina AI's founding details with input fields, navigation options, and informational no — 在训练中被"边缘化"的小众知识的一个例子可以从我们问 `GPT-3.5-turbo` "Jina AI 是何时成立的？"时看到，它给出了错误的答案。然而，当使用 Reader 进行搜索 grounding 时，同样的 LLM 能够提供正确的答案。事实上，它精确到了具体日期。

Screen interface for inquiring about SpaceX launches with a query field and details about upcoming missions. — 这是训练后产生的新信息的一个例子。我们问 `GPT-3.5-turbo` "下一次 SpaceX 发射是什么时候？"（今天是 2024 年 5 月 14 日），模型给出了 2021 年的旧信息。

tagJina Reader 如何帮助更好的 Grounding

此前，用户可以轻松地在 URL 前加上 https://r.jina.ai 来将特定 URL 的文本和图像内容读取成 LLM 友好的格式，并用于检查 grounding 和事实验证。自 4 月 15 日首次发布以来，我们已处理了超过 1800 万个来自全球的请求，这表明了其受欢迎程度。

今天我们很高兴通过引入搜索 grounding API https://s.jina.ai 进一步推进。只需在查询前加上它，Reader 就会搜索网页并检索前 5 个结果。每个结果都包含标题、LLM 友好的 markdown（完整内容！不是摘要）和URL，让你能够追溯信息来源。以下是一个例子，你也可以试试我们的在线演示。

左：Markdown 模式（直接访问 https://s.jina.ai/who+is+han+xiao）；右：JSON 模式（使用 `curl https://s.jina.ai/who+is+han+xiao -H 'accept: application/json'`）。顺便说一句，这样的自我问题总是一个很好的测试案例。

在设计 Reader 的搜索 grounding 时，我们遵循三个原则：

提高事实准确性；
获取最新信息，即世界知识；
将答案与其来源关联。

除了使用极其简单外，s.jina.ai 还具有高度的可扩展性和可定制性，因为它利用了现有的灵活且可扩展的 r.jina.ai 基础设施。您可以通过请求头设置参数来控制图像描述、过滤粒度等。

Configuration screen of Reader API with options for API behavior, proxy settings, and cookie forwarding against a dark backgr — 尝试 Reader API 高级用法的交互式代码片段

tag作为全面 Grounding 解决方案的 Jina Reader

Technical flowchart on a black background illustrating the processing of knowledge through various AI-related URLs.

如果我们结合搜索 grounding（s.jina.ai）和检查 grounding（r.jina.ai），我们可以为 LLMs、agents 和 RAG 系统构建一个非常全面的 grounding 解决方案。在一个典型的可信 RAG 工作流程中，Jina Reader 的工作方式如下：

用户输入问题；
使用 s.jina.ai 从网络检索最新信息；
根据上一步的搜索结果生成初始答案并附带引用；
使用r.jina.ai 对你自己的 URL 进行答案验证；或者从步骤 3 返回的来源中阅读内联 URL 以获得更深入的验证；
生成最终答案，并向用户突出显示潜在的未验证声明。

tag使用 API 密钥提高速率限制

用户无需授权即可免费使用新的搜索验证端点。此外，当在请求头中提供 Jina AI API 密钥（可以使用与 Embedding/Reranking API 相同的密钥）时，您可以立即享受到 r.jina.ai 每个 IP 每分钟 200 个请求，以及 s.jina.ai 每个 IP 每分钟 40 个请求的限制。详细信息可以在下表中找到：

端点	描述	无 API 密钥的速率限制	有 API 密钥的速率限制	令牌计数方案	平均延迟
`r.jina.ai`	读取 URL 返回其内容，适用于验证检查	20 RPM	200 RPM	基于输出令牌	3 秒
`s.jina.ai`	在网上搜索返回前 5 个结果，适用于搜索验证	5 RPM	40 RPM	基于所有 5 个搜索结果的输出令牌	30 秒

tag结论

我们认为事实验证对于 GenAI 应用来说至关重要，构建有验证依据的解决方案应该对每个人来说都很容易。这就是为什么我们推出了新的搜索验证端点 s.jina.ai，它使开发人员能够轻松地将世界知识整合到他们的 GenAI 应用中。我们希望开发人员能够建立用户信任，提供可解释的答案，并激发数百万用户的好奇心。