新闻
模型
产品
keyboard_arrow_down
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
深度搜索
搜索、读取并推理直到找到最佳答案。
更多的
keyboard_arrow_down
分类器
图片和文本的零样本和少样本分类。
切分器
将长文本切分成块或词元。

API 文档
为您的AI 编程助手 IDE 或大模型自动生成代码
open_in_new


公司
keyboard_arrow_down
关于我们
联系销售
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款及条件


登录
login
LLMs 的事实准确性问题
Jina Reader 如何帮助更好的 Grounding
作为全面 Grounding 解决方案的 Jina Reader
使用 API 密钥提高速率限制
结论
star
甄选
新闻稿
五月 14, 2024

Jina Reader:利用检索增强改进大语言模型的事实准确性

Grounding 对生成式 AI 应用来说至关重要。我们的新 https://s.jina.ai/ 让 LLM 能够访问来自网络的最新知识,实现搜索 grounding 并使响应更加可信。
Flowchart detailing Jina AI's info search using LLM, starting with "when was Jina AI founded?" and various process steps.
Jina AI
Jina AI • 5 分钟的读取量

对 GenAI 应用来说,Grounding 是绝对必要的。

自 2023 年以来,您可能已经看到许多工具、提示和 RAG 流水线,都是为了提高 LLMs 的事实准确性而设计的。为什么?因为阻止企业向数百万用户部署 LLMs 的主要障碍是信任:这个回答是真实的,还是模型的幻觉?这是一个行业性的问题,Jina AI 一直在努力解决。今天,通过 Jina Reader 的新搜索 grounding 功能,您只需使用 https://s.jina.ai/YOUR_SEARCH_QUERY 就可以搜索来自网络的最新世界知识。有了这个功能,您就能更好地提高 LLMs 的事实准确性,使它们的回答更加可信和有用。

Reader API
Read URLs or search the web, get better grounding for LLMs.

API,可在产品页面找到演示

tagLLMs 的事实准确性问题

我们都知道 LLMs 可能会编造内容并损害用户信任。LLMs 可能会说出不真实的事情(即产生幻觉),特别是在涉及训练期间未学习到的主题时。这可能是训练后产生的新信息,或者是在训练过程中被"边缘化"的小众知识。

因此,当涉及到"今天天气如何?"或"今年奥斯卡最佳女演员是谁?"这样的问题时,模型要么回答"我不知道",要么给出过时的信息。

Interactive web interface for querying Jina AI's founding details with input fields, navigation options, and informational no
在训练中被"边缘化"的小众知识的一个例子可以从我们问 GPT-3.5-turbo "Jina AI 是何时成立的?"时看到,它给出了错误的答案。然而,当使用 Reader 进行搜索 grounding 时,同样的 LLM 能够提供正确的答案。事实上,它精确到了具体日期。
Screen interface for inquiring about SpaceX launches with a query field and details about upcoming missions.
这是训练后产生的新信息的一个例子。我们问 GPT-3.5-turbo "下一次 SpaceX 发射是什么时候?"(今天是 2024 年 5 月 14 日),模型给出了 2021 年的旧信息。

tagJina Reader 如何帮助更好的 Grounding

此前,用户可以轻松地在 URL 前加上 https://r.jina.ai 来将特定 URL 的文本和图像内容读取成 LLM 友好的格式,并用于检查 grounding 和事实验证。自 4 月 15 日首次发布以来,我们已处理了超过 1800 万个来自全球的请求,这表明了其受欢迎程度。

今天我们很高兴通过引入搜索 grounding API https://s.jina.ai 进一步推进。只需在查询前加上它,Reader 就会搜索网页并检索前 5 个结果。每个结果都包含标题、LLM 友好的 markdown(完整内容!不是摘要)和URL,让你能够追溯信息来源。以下是一个例子,你也可以试试我们的在线演示。

左:Markdown 模式(直接访问 https://s.jina.ai/who+is+han+xiao);右:JSON 模式(使用 curl https://s.jina.ai/who+is+han+xiao -H 'accept: application/json')。顺便说一句,这样的自我问题总是一个很好的测试案例。

在设计 Reader 的搜索 grounding 时,我们遵循三个原则:

  • 提高事实准确性;
  • 获取最新信息,即世界知识;
  • 将答案与其来源关联。

除了使用极其简单外,s.jina.ai 还具有高度的可扩展性和可定制性,因为它利用了现有的灵活且可扩展的 r.jina.ai 基础设施。您可以通过请求头设置参数来控制图像描述、过滤粒度等。

Configuration screen of Reader API with options for API behavior, proxy settings, and cookie forwarding against a dark backgr
尝试 Reader API 高级用法的交互式代码片段

tag作为全面 Grounding 解决方案的 Jina Reader

Technical flowchart on a black background illustrating the processing of knowledge through various AI-related URLs.

如果我们结合搜索 grounding(s.jina.ai)和检查 grounding(r.jina.ai),我们可以为 LLMs、agents 和 RAG 系统构建一个非常全面的 grounding 解决方案。在一个典型的可信 RAG 工作流程中,Jina Reader 的工作方式如下:

  1. 用户输入问题;
  2. 使用 s.jina.ai 从网络检索最新信息;
  3. 根据上一步的搜索结果生成初始答案并附带引用;
  4. 使用r.jina.ai 对你自己的 URL 进行答案验证;或者从步骤 3 返回的来源中阅读内联 URL 以获得更深入的验证;
  5. 生成最终答案,并向用户突出显示潜在的未验证声明。

tag使用 API 密钥提高速率限制

用户无需授权即可免费使用新的搜索验证端点。此外,当在请求头中提供 Jina AI API 密钥(可以使用与 Embedding/Reranking API 相同的密钥)时,您可以立即享受到 r.jina.ai 每个 IP 每分钟 200 个请求,以及 s.jina.ai 每个 IP 每分钟 40 个请求的限制。详细信息可以在下表中找到:

端点描述无 API 密钥的速率限制有 API 密钥的速率限制令牌计数方案平均延迟
r.jina.ai读取 URL 返回其内容,适用于验证检查20 RPM200 RPM基于输出令牌3 秒
s.jina.ai在网上搜索返回前 5 个结果,适用于搜索验证5 RPM40 RPM基于所有 5 个搜索结果的输出令牌30 秒

tag结论

我们认为事实验证对于 GenAI 应用来说至关重要,构建有验证依据的解决方案应该对每个人来说都很容易。这就是为什么我们推出了新的搜索验证端点 s.jina.ai,它使开发人员能够轻松地将世界知识整合到他们的 GenAI 应用中。我们希望开发人员能够建立用户信任,提供可解释的答案,并激发数百万用户的好奇心。

类别:
star
甄选
新闻稿
rss_feed
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, CA 94085, 美国
location_on
德国柏林(总部)
Prinzessinnenstraße 19-20,10969 柏林,德国
location_on
中国北京
中国北京市海淀区西大街48号6号楼5层
location_on
中国深圳
中国深圳市赋安科技大厦4楼402
搜索底座
读取器
向量模型
重排器
深度搜索
分类器
切分器
API 文档
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Jina AI © 2020-2025.