您的搜索底座 如虎添翼!
我们的客户
为了更好的搜索
我们的前沿模型构成了高质量企业搜索和 RAG 系统的搜索底座。
立即开始——无需信用卡或注册!
verified_user 我们符合美国注册会计师协会 (AICPA) 的 SOC 2 Type 1 和 Type 2 标准。 open_in_new
chevron_leftchevron_right
globe_book
使用
r.jina.ai
读取 URL 并获取其内容travel_explore
使用
s.jina.ai
搜索网络并获取 SERP内容格式
您可以控制响应中的细节级别,以防止过度过滤。默认管道针对大多数网站和大模型输入进行了优化。
默认
arrow_drop_down
JSON 响应
响应将采用 JSON 格式,包含 URL、标题、内容和时间戳(如果可用)。在搜索模式下,它会返回一个包含五个条目的列表,每个条目都遵循描述的 JSON 结构。
超时时间
最大页面加载等待时间(不是总请求处理时间)。
限制词元预算
限制此请求使用的最大词元数。超出此限制将导致请求失败。
使用 ReaderLM-v2
实验
使用 ReaderLM-v2 将 HTML 转换为 Markdown,为结构和内容复杂的网站提供高质量的结果。比其它引擎消耗 3 倍词元!
CSS 选择器:仅限
用于定位特定页面元素的 CSS 选择器列表。
CSS 选择器:Wait-For
返回结果之前要等待的 CSS 选择器。
CSS 选择器:排除
要删除的元素的 CSS 选择器(页眉、页脚等)。
删除所有图片
从响应中删除所有图片。
将所有链接集中到最后
最后会创建一个“按钮和链接”部分。这可以帮助下游大模型或 Web 代理浏览页面或采取进一步的行动。
无
arrow_drop_down
将所有图片集中到最后
最后会创建一个“图片”部分。这可以让下游的大模型概览页面上的所有视觉效果,从而提高推理能力。
无
arrow_drop_down
转发 Cookie
我们的 API 服务器可以在访问 URL 时转发您的自定义 Cookie 设置,这对于需要额外身份验证的页面非常有用。请注意,带有 Cookie 的请求不会被缓存。
图片说明
为指定 URL 上的所有图片添加标题,为没有标题的图片添加“Image [idx]: [caption]”作为 alt 标签。这允许下游大模型在推理和总结等活动中与图片进行交互。
使用特定国家/地区的代理服务器
设置基于位置的代理服务器的国家代码。使用“自动”进行最佳选择或使用“无”禁用。
绕过缓存
我们的 API 服务器会将读取和搜索模式的内容缓存一段时间。要绕过此缓存,请将此标头设置为 true。
请勿缓存/跟踪!
启用后,请求结果将不会缓存在我们的服务器上。
Github 风格的 Markdown
选择加入/退出 GFM(Github Flavored Markdown)功能。
已启用
arrow_drop_down
严格遵守机器人政策
定义机器人用户代理 (User-Agent),在获取内容之前对照 robots.txt 进行检查。
iframe 提取
处理 DOM 树中所有嵌入 iframe 的内容。
影子 DOM 提取
从文档中的所有 Shadow DOM 根中提取内容。
关注重定向页面
选择是否在遵循所有重定向后解析到最终目标网址。启用以遵循完整的重定向链。
本地 PDF/HTML 文件
POST
通过上传本地 PDF 和 HTML 文件,使用读取器读取它们。仅支持 pdf 和 html 文件。
upload
标题样式
设置 markdown 标题格式(传递给 Turndown)。
数字符号标题
arrow_drop_down
水平线样式
定义 markdown 水平规则格式(传递给 Turndown)。
项目符号样式
设置项目符号列表标记字符(传递给 Turndown)。
*
arrow_drop_down
强调风格
定义 markdown 强调分隔符(传递给 Turndown)。
_
arrow_drop_down
强调风格
设置 markdown 强强调分隔符(传递给 Turndown)。
**
arrow_drop_down
链接样式
确定 markdown 链接格式(传递给 Turndown)。
内联
arrow_drop_down
符合欧盟规定
所有基础设施和数据处理操作完全在欧盟管辖范围内。
upload
请求
GET
Bash
语言
arrow_drop_down
curl https://r.jina.ai/https://example.com
key
API密钥
visibility_off
剩余词元额度
0