新闻
模型
产品
keyboard_arrow_down
深度搜索
搜索、读取并推理直到找到最佳答案。
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
更多的
keyboard_arrow_down
分类器
图片和文本的零样本和少样本分类。
切分器
将长文本切分成块或词元。

API 文档
为您的AI 编程助手 IDE 或大模型自动生成代码
open_in_new


公司
keyboard_arrow_down
关于我们
联系销售
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款及条件


登录
login

联系销售

与 Jina AI 一起拓展您的业务。
calculate企业许可证配置器

三种购买方式

订阅我们的 API、通过云提供商购买或为您的组织获取商业许可证。
radio_button_unchecked
cloud
与 3 个云服务提供商合作
您的公司是否在使用 AWS 或 Azure?那么请直接在贵公司的这些平台上私有化部署我们的搜索底座模型,这样您的数据就能保持安全且合规。
AWS SageMaker
向量模型
重排器
Microsoft Azure
向量模型
重排器
Google Cloud
向量模型
重排器
radio_button_checked
使用Jina 搜索底座API
访问我们所有产品的最简单方法。随时充值词元。
使用更多词元充值此 API 密钥
根据您所在的位置,您可能需要支付美元、欧元或其他货币的费用。可能需缴纳税费。
请输入正确的API密钥进行充值
了解速率限制
速率限制是指每个 IP 地址/API 密钥 (RPM) 在一分钟内可以向 API 发出的最大请求数。请在下面详细了解每个产品和层级的速率限制。
keyboard_arrow_down
速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
radio_button_unchecked
encrypted
拥有本地使用的商业许可证
购买商业许可证以在现场使用我们的模型。

常见问题

如何获取我的 API 密钥?

video_not_supported

速率限制是多少?

速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST

我需要商业许可证吗?

CC BY-NC 许可证自检

play_arrow
您是否使用我们的官方 API 或在 Azure 或 AWS 上我们的官方镜像?
play_arrow
done
是的
play_arrow
您使用的是付费 API 密钥还是免费试用密钥?
play_arrow
done
付费 API 密钥
无限制。请按照当前协议使用。
play_arrow
info
免费 API 密钥
免费试用密钥仅可用于非商业用途。如需商业用途,请购买付费套餐。
play_arrow
您是否在 AWS 和 Azure 上使用我们的官方模型?
无限制。请按照当前协议使用。
play_arrow
close
不
play_arrow
你正在使用这些模型吗?
jina-reranker-m0
jina-clip-v2
jina-embeddings-v3
jina-reranker-v2-base-multilingual
jina-colbert-v2
reader-lm-1.5b
reader-lm-0.5b
ReaderLM-v2
play_arrow
close
不
沒有限制。
play_arrow
done
是的
play_arrow
您的用途是商业用途吗?
play_arrow
question_mark
没有把握
play_arrow
你是:
play_arrow
将其用于个人项目或者业余爱好项目?
本模型非商业性质,您可以自由使用。
play_arrow
盈利性公司在内部使用它吗?
此为商业性质。请联系我们的销售团队。
联系销售
play_arrow
教育机构用它来教学吗?
这通常是非商业性的。您可以自由使用这些模型。
play_arrow
非营利组织或非政府组织是否利用它来完成你的使命?
这通常是非商业性的,但如果不确定,请与我们联系。
联系销售
play_arrow
在您销售的产品或服务中使用它吗?
此为商业性质。请联系我们的销售团队。
联系销售
play_arrow
政府实体使用它来提供公共服务?
这可能是商业用途。请联系我们进行澄清。
联系销售
play_arrow
close
不
您可以自由使用这些模型。
play_arrow
done
是的
联系我们的销售团队获取许可。
联系销售

其他问题

深度搜索相关常见问题
什么是深度搜索?
keyboard_arrow_down
深度搜索是一个大模型API,它执行迭代搜索、读取和推理,直到找到查询的准确答案或达到其词元预算限制。
深度搜索与 OpenAI 和 Gemini 的深度研究能力有何不同?
keyboard_arrow_down
与 OpenAI 和 Gemini 不同,深度搜索专注于通过迭代提供准确的答案,而不是生成长篇文章。它针对深度网络搜索的快速、精确答案进行了优化,而不是创建全面的报告。
我需要什么 API 密钥来使用 DeepResearch?
keyboard_arrow_down
您需要 Jina API 密钥。我们为新 API 密钥提供 1000 万个免费词元。
当深度搜索达到其词元预算时会发生什么?它会返回不完整的答案吗?
keyboard_arrow_down
它根据所有积累的知识生成最终答案,而不是仅仅放弃或返回不完整的答案。
深度搜索能保证答案的准确性吗?
keyboard_arrow_down
不是。虽然它使用迭代搜索过程来提高准确性,但评估显示它在测试题目上的通过率达到了 75%,明显优于 0% 的基线(gemini-2.0-flash),但并不完美。
一次典型的深度搜索查询需要多长时间?
keyboard_arrow_down
它差别很大 - 根据评估数据,查询可能需要 1 到 42 步,平均需要 4 步。也就是 20 秒。简单的查询可能很快得到解决,而复杂的研究问题可能涉及多次迭代,最多需要 120 秒。
深度搜索可以与任何与 OpenAI 兼容的客户端(如 Chatwise、CherryStudio 或 ChatBox)配合使用吗?
keyboard_arrow_down
是的,deepsearch.jina.ai/v1/chat/completions 上的官方深度搜索API 与 OpenAI API 架构完全兼容,使用“jina-deepsearch-v1”作为模型名称。因此,从 OpenAI 切换到深度搜索并与本地客户端或任何兼容 OpenAI 的客户端一起使用非常容易。我们强烈推荐 Chatwise 以获得无缝体验。
API 的速率限制是多少?
keyboard_arrow_down
速率限制因 API 密钥层而异,范围从 10 RPM 到 30 RPM。对于查询量大的应用程序来说,这一点很重要。
<think>标签里面的内容是什么?
keyboard_arrow_down
深度搜索将思考步骤包装在 XML 标签 ... 中,然后提供最终答案,遵循 OpenAI 流格式,但使用这些特殊标记来表示思路链。
深度搜索是否使用 Jina Reader 进行网页搜索和读取?
keyboard_arrow_down
是的。Jina Reader 用于网页搜索和读取,为系统提供高效访问和处理网页内容的能力。
为什么深度搜索对我的查询使用这么多标记?
keyboard_arrow_down
是的,深度搜索在复杂查询中的词元使用量可以说很高 - 平均为 70,000 个词元,而基本大模型响应为 500 个词元。这显示了研究的深度,但也影响了成本。
有没有办法控制或限制步数?
keyboard_arrow_down
该系统主要由词元预算而非步数控制。一旦超出词元预算,系统就会进入 Beast 模式以生成最终答案。查看 reasoning_effort 了解更多详情。
答案中的参考文献有多可靠?
keyboard_arrow_down
参考文献非常重要,如果一个答案被认为是明确的,但缺乏参考文献,系统会继续搜索而不是接受该答案。
深度搜索能处理有关未来事件的问题吗?
keyboard_arrow_down
是的,但需要进行大量的研究。“谁将在 2028 年成为总统”的例子表明,它可以通过多次研究迭代来处理推测性问题,尽管这种预测的准确性无法得到保证。
与读取器相关的常见问题
使用 读取器 API 的相关费用是多少?
keyboard_arrow_down
读取器 API 是免费的,不需要 API 密钥。只需在您的 URL 前面添加“https://r.jina.ai/”即可。
读取器 API 如何发挥作用?
keyboard_arrow_down
读取器 API 使用代理来获取任何 URL,并在浏览器中呈现其内容以提取高质量的主要内容。
读取器 API 是开源的吗?
keyboard_arrow_down
是的,读取器 API 是开源的,可以在 Jina AI GitHub 存储库中找到。
读取器 API 的典型延迟是多少?
keyboard_arrow_down
读取器 API 通常会在 2 秒内处理 URL 并返回内容,但复杂或动态的页面可能需要更多时间。
为什么我应该使用 读取器 API 而不是自己抓取页面?
keyboard_arrow_down
抓取可能很复杂且不可靠,尤其是复杂或动态页面。读取器 API 提供简洁、可靠的干净大模型级文本输出。
读取器 API 是否支持多种语言?
keyboard_arrow_down
读取器 API 返回 URL 原始语言的内容。它不提供翻译服务。
如果某个网站屏蔽了 读取器 API,我该怎么办?
keyboard_arrow_down
如果您遇到阻止问题,请联系我们的支持团队寻求帮助和解决方案。
读取器 API 可以从 PDF 文件中提取内容吗?
keyboard_arrow_down
虽然 读取器 API 主要用于网页,但它可以从 arXiv 等网站上以 HTML 格式查看的 PDF 中提取内容,但它并未针对一般 PDF 提取进行优化。
读取器 API 可以处理来自网页的媒体内容吗?
keyboard_arrow_down
目前,读取器 API 不处理媒体内容,但未来的增强功能将包括图片字幕和视频摘要。
是否可以在本地 HTML 文件上使用 读取器 API?
keyboard_arrow_down
不可以,读取器 API 只能处理来自可公开访问的 URL 的内容。
读取器 API 是否缓存内容?
keyboard_arrow_down
如果您在 5 分钟内请求相同的 URL,读取器 API 将返回缓存的内容。
我可以使用 读取器API 来访问登录后的内容吗?
keyboard_arrow_down
不幸的是没有。
我可以使用读取器 API 访问 arXiv 上的 PDF 吗?
keyboard_arrow_down
是的,您可以使用读取器中的原生 PDF 支持(https://r.jina.ai/https://arxiv.org/pdf/2310.19923v4)或使用 arXiv 中的 HTML 版本(https://r.jina.ai/https://arxiv.org/html/2310.19923v4)
图片标注在读取器中如何发挥作用?
keyboard_arrow_down
Reader 为指定 URL 上的所有图片添加标题,并添加 `Image [idx]: [caption]` 作为 alt 标签(如果最初没有)。这使得下游大模型能够与图片进行推理、总结等交互。
读取器的可扩展性如何?我可以在生产中使用它吗?
keyboard_arrow_down
Reader API 的设计具有高度可扩展性。它根据实时流量自动扩展,最大并发请求数现在约为 4000。我们正在积极维护它,将其作为 Jina AI 的核心产品之一。因此,请放心在生产中使用它。
Reader API 的速率限制是多少?
keyboard_arrow_down
请在下表中查找最新的速率限制信息。请注意,我们正在积极致力于改进 Reader API 的速率限制和性能,因此该表将进行相应更新。
speed速率限制
什么是 Reader-LM?如何使用它?
keyboard_arrow_down
Reader-LM 是一种新型小型语言模型 (SLM),专为从开放网络中提取和清理数据而设计。它将原始、嘈杂的 HTML 转换为干净的 markdown,灵感来自 Jina Reader。Reader-LM 注重成本效益和小模型尺寸,既实用又强大。它目前在 AWS、Azure 和 GCP 市场上可用。如果您有特定要求,请通过 sales AT jina.ai 联系我们。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
与 重排器 相关的常见问题
重排器 API 的费用是多少?
keyboard_arrow_down
重排器 API 的定价与我们的向量模型 API 定价结构一致。每个新 API 密钥都会获得 1000 万个免费词元。除了免费词元之外,还可以购买不同的套餐。欲了解更多详情,请访问我们的定价部分。
这两个重排器有什么区别?
keyboard_arrow_down
jina-reranker-v2-base-multilingual 在多语言支持方面表现出色,性能优于 bge-reranker-v2-m3,吞吐量比 jina-reranker-v1-base-en 快 15 倍。它还支持代理任务和代码检索。jina-colbert-v2 在 ColBERTv2 的基础上进行了改进,检索性能提高了 6.5%,并增加了对 89 种语言的多语言支持。它具有用户控制的向量大小,以实现最佳效率和精度。
Jina Rerankers 是开源的吗?
keyboard_arrow_down
是的,jina-reranker-v2-base-multilingual 和 jina-colbert-v2 都是基于 CC-BY-NC 4.0 协议开源。您可以自由地使用、共享和改编这些模型用于非商业用途。
重排器是否支持多种语言?
keyboard_arrow_down
是的,jina-reranker-v2-base-multilingual 和 jina-colbert-v2 均支持 100 多种语言,包括英语、中文和其他全球主要语言。它们针对多语言任务进行了优化,并且表现优于以前的模型。
查询和文档的最大长度是多少?
keyboard_arrow_down
最大查询词元长度为 512。文档没有词元限制。
每个查询可以重排的最大文档数是多少?
keyboard_arrow_down
每个查询最多可以对 2048 个文档进行重排。
批量大小是多少以及在一个请求中可以发送多少个查询文档元组?
keyboard_arrow_down
与我们的向量模型 API 不同,没有批量大小的概念。每个请求只能发送一个查询文档元组,但该元组最多可以包含 2048 个候选文档。
对 100 个文档重排时,预计延迟会是多少?
keyboard_arrow_down
延迟从 100 毫秒到 7 秒不等,主要取决于文档和查询的长度。例如,使用 64 个词元的查询对 100 个包含 256 个词元的文档进行重排大约需要 150 毫秒。将文档长度增加到 4096 个词元将使时间增加到 3.5 秒。如果查询长度增加到 512 个词元,则时间进一步增加到 7 秒。
以下是对一个查询和 100 个文档进行重排的时间成本(以毫秒为单位):
每个文档中的词元数量
查询中的词元数量256512102420484096
64156323136621073571
128194369137721233598
256273475139721554299
5124681385211435367068
您的服务可以在 AWS、Azure 或 GCP 上私有化部署吗?
keyboard_arrow_down
是的,我们的服务在 AWS、Azure 和 GCP 市场上可用。如果您有特定要求,请通过 sales AT jina.ai 联系我们。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
你们是否提供针对特定领域数据的微调重排器?
keyboard_arrow_down
如果您对针对特定域数据量身定制的微调重排器感兴趣,请联系我们的销售团队。我们的团队将及时回复您的询问。
联系我们
文档的最小图像尺寸是多少?
keyboard_arrow_down
jina-reranker-m0 模型可接受的最小图像尺寸为 28x28 像素。
向量模型相关的常见问题
jina-embeddings-v3 模型是如何训练的?
keyboard_arrow_down
有关我们的训练过程、数据源和评估的详细信息,请参阅 arXiv 上提供的技术报告。
launcharXiv
jina-clip 模型是什么?我可以使用它们进行文本和图片搜索吗?
keyboard_arrow_down
Jina CLIP jina-clip-v2 是一种先进的多模态向量模型,支持文本-文本、文本-图片、图片-图片和图片-文本检索任务。与在文本-文本搜索方面表现不佳的原始 OpenAI CLIP 不同,Jina CLIP 在文本检索方面表现出色。jina-clip-v2 在文本-图片和文本-文本检索任务中比 jina-clip-v1 的性能提高了 3%,支持 89 种语言进行多语言图片检索,处理更高分辨率的图片(512x512),并通过 Matryoshka 表示降低存储要求。您可以在我们的技术报告中读取更多相关信息。
launcharXiv
你们的模型支持哪些语言?
keyboard_arrow_down
截至 2024 年 9 月 18 日发布,jina-embeddings-v3 是最好的多语言模型,在参数少于 10 亿的模型的 MTEB 英语排行榜上排名第二。v3 共支持 89 种语言,包括性能最佳的前 30 种语言:阿拉伯语、孟加拉语、中文、丹麦语、荷兰语、英语、芬兰语、法语、格鲁吉亚语、德语、希腊语、印地语、印尼语、意大利语、日语、韩语、拉脱维亚语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、斯洛伐克语、西班牙语、瑞典语、泰语、土耳其语、乌克兰语、乌尔都语和越南语。有关更多详细信息,请参阅 jina-embeddings-v3 技术报告。
launcharXiv
单个句子输入的最大长度是多少?
keyboard_arrow_down
我们的模型允许输入长度高达 8192 个词元,这比大多数其他模型高得多。词元的范围可以从单个字符(如“a”)到整个单词(如“apple”)。可以输入的字符总数取决于所用单词的长度和复杂性。这种扩展的输入功能使我们的 jina-embeddings-v3 和 jina-clip 模型能够执行更全面的文本分析,并在上下文理解方面实现更高的准确性,尤其是对于大量文本数据。
单个请求中最多可以包含多少个句子?
keyboard_arrow_down
一次 API 调用最多可以处理 2048 个句子或文本,从而有助于在一次请求中进行广泛的文本分析。
如何将图片发送给 jina-clip 模型?
keyboard_arrow_down
您可以在 API 请求的 input 字段中使用 url 或 bytes。对于 url,请提供要处理的图片的 URL。对于 bytes,请以 base64 格式对图片进行编码并将其包含在请求中。模型将在结果中返回图片的向量。
Jina Embeddings 模型与 OpenAI 和 Cohere 的最新向量模型相比如何?
keyboard_arrow_down
在 MTEB 英语、多语言和 LongEmbed 基准的评估中,jina-embeddings-v3 在英语任务上的表现优于 OpenAI 和 Cohere 的最新专有向量模型,并在所有多语言任务中超越 multilingual-e5-large-instruct。由于集成了 Matryoshka 表示学习 (MRL),默认输出维度为 1024,用户可以将向量维度截断为 32,而不会影响性能。
如何从 OpenAI 的 text-embedding-3-large 迁移到 Jina Embeddings 模型?
keyboard_arrow_down
迁移过程十分顺畅,因为我们的 API 端点与 OpenAI 的 text-embedding-3-large 模型的输入和输出 JSON 架构相匹配。这种兼容性确保用户在使用 OpenAI 端点时可以轻松地将 OpenAI 模型替换为我们的模型。
使用 jina-clip 模型时如何计算 token?
keyboard_arrow_down
词元是根据文本长度和图片大小计算的。对于请求中的文本,词元以标准方式计算。对于图片,执行以下步骤: 1. 图块大小:每个图片被分成图块。对于 jina-clip-v2,图块为 512x512 像素,而对于 jina-clip-v1,图块为 224x224 像素。 2. 覆盖率:计算覆盖输入图片所需的图块数量。即使图片尺寸不能被图块大小完全整除,部分图块也会被视为完整图块。 3. 总图块数:覆盖图片的图块总数决定了成本。例如,600x600 像素的图片在 v2 中将被 2x2 图块(4 个图块)覆盖,在 v1 中将被 3x3 图块(9 个图块)覆盖。 4. 成本计算:对于 jina-clip-v2,每个图块的成本为 4000 个词元,而对于 jina-clip-v1,每个图块的成本为 1000 个词元。 示例: 对于尺寸为 600x600 像素的图片: • 使用 jina-clip-v2 • 图片被分成 512x512 像素图块。 • 所需的图块总数为 2(水平)x 2(垂直)= 4 个图块。 • jina-clip-v2 的成本为 4*4000 = 16000 个词元。 • 使用 jina-clip-v1 • 图片被分成 224x224 像素图块。 • 所需的图块总数为 3(水平)x 3(垂直)= 9 块图块。 • jina-clip-v1 的成本为 9*1000 = 9000 个词元。
你们提供向量模型图片或音频的模型吗?
keyboard_arrow_down
是的,jina-clip-v2 和 jina-clip-v1 可以支持图片和文本。更多模态上的向量模型将很快公布!
Jina 向量模型模型可以使用私人或公司数据进行微调吗?
keyboard_arrow_down
有关使用特定数据微调我们的模型的疑问,请联系我们讨论您的要求。我们愿意探索如何调整我们的模型来满足您的需求。
联系我们
您的服务可以在 AWS、Azure 或 GCP 上私有化部署吗?
keyboard_arrow_down
是的,我们的服务在 AWS、Azure 和 GCP 市场上可用。如果您有特定要求,请通过 sales AT jina.ai 联系我们。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
分类器相关常见问题
零样本和小样本的标签有何不同?
keyboard_arrow_down
零样本分类需要语义标签,训练时不需要,而少样本分类则需要训练时需要标签,但分类时不需要。这意味着零样本分类更适合灵活、即时的分类需求,而少样本分类更适合固定的、特定领域的类别,这些类别可以随时间而演变。
num_iters 有什么用处以及如何使用它?
keyboard_arrow_down
num_iters 控制训练强度 - 较高的值会强化重要示例,而较低的值会最大限度地减少不太可靠数据的影响。它可用于通过为近期示例提供更高的迭代次数来实现时间感知学习,这使其对于不断发展的数据模式很有价值。
公共分类器共享如何工作?
keyboard_arrow_down
任何拥有 classifier_id 的人都可以使用公共分类器,并消耗自己的词元配额。用户无法访问训练数据或配置,也无法查看其他人的分类请求,从而实现安全的分类器共享。
我需要多少数据才能使小样本研究发挥良好作用?
keyboard_arrow_down
少量样本需要 200-400 个训练样本才能超越零样本分类。虽然它最终会实现更高的准确率,但需要这段预热期才能发挥作用。零样本无需训练数据即可立即提供一致的性能。
它能处理多种语言和文本/图片吗?
keyboard_arrow_down
是的 - API 支持使用 jina-embeddings-v3 进行多语言查询和使用 jina-clip-v1 进行多模态(文本/图片)分类,并支持在同一请求中对 URL 或 base64 编码的图片进行支持。
我应该了解哪些硬性限制?
keyboard_arrow_down
Zero-shot 支持 256 个类别,没有分类器限制,而 few-shot 则限制为 16 个类别和 16 个分类器。两者均支持每个请求 1,024 个输入和每个输入 8,192 个词元。
我该如何处理随时间而发生的数据变化?
keyboard_arrow_down
少量样本模式允许通过 /train 端点进行持续更新,以适应不断变化的数据模式。当数据分布发生变化时,您可以逐步添加新的示例或类别,而无需重建整个分类器。
我发送训练数据后会发生什么情况?
keyboard_arrow_down
该 API 使用一次性在线学习 - 训练示例会更新分类器权重,但之后不会存储。这意味着您无法检索历史训练数据,但它可以确保隐私和资源效率。
零样本与小样本——何时使用哪个?
keyboard_arrow_down
当您需要使用语义标签进行灵活分类时,请从零样本开始,以获得即时结果。当您有 200-400 个示例、需要更高的准确度或需要处理特定领域/时间敏感的数据时,请切换到少样本。
我可以针对不同的语言/任务使用不同的模型吗?
keyboard_arrow_down
是的,您可以选择 jina-embeddings-v3 进行文本分类(特别适合多语言)和 jina-clip-v1 进行多模态分类。新模型(如 jina-clip-v2)将在发布时通过 API 自动提供。
与分段器相关的常见问题
切分器的价格是多少?
keyboard_arrow_down
切分器可免费使用。通过提供您的 API 密钥,您可以访问更高的速率限制,并且不会向您的密钥收费。
如果我不提供 API 密钥,速率限制是多少?
keyboard_arrow_down
如果没有 API 密钥,您可以以 20 RPM 的速率限制访问切分器。
如果我提供 API 密钥,速率限制是多少?
keyboard_arrow_down
使用 API 密钥,您可以以 200 RPM 的速率限制访问切分器。对于高级付费用户,速率限制为 1000 RPM。
您会从我的 API 密钥中收取词元吗?
keyboard_arrow_down
不可以,您的 API 密钥仅用于访问更高的速率限制。
切分器是否支持多种语言?
keyboard_arrow_down
是的,切分器是多语言的,支持超过 100 种语言。
GET 和 POST 请求有什么区别?
keyboard_arrow_down
GET 请求仅用于计算文本中的词元数,可让您轻松将其作为计数器集成到应用程序中。POST 请求支持更多参数和功能,例如返回第一个/最后一个 N 个词元。
每个请求可以切词的最大长度是多少?
keyboard_arrow_down
每个请求最多可以发送 64k 个字符。
切块功能如何工作?是语义切块吗?
keyboard_arrow_down
切块功能可根据常见的结构线索将长文档分割成较小的块,从而确保将文本准确地分割成有意义的块。本质上,它是一个(大!)正则表达式模式,可根据某些通常与语义边界一致的句法特征(例如句子结尾、段落分隔符、标点符号和某些连词)对文本进行分割。它不是语义切块。这个(大)正则表达式在正则表达式的限制范围内尽可能强大。它平衡了复杂性和性能。虽然正则表达式无法实现真正的语义理解,但它可以通过常见的结构线索很好地近似上下文。
如何在切分器中处理诸如“endoftext”之类的特殊词元?
keyboard_arrow_down
如果输入包含特殊词元,我们的切分器会将它们放入“special_tokens”字段中。这样您就可以轻松识别它们并根据下游任务进行相应的处理,例如在将文本输入大模型之前将其删除以防止注入攻击。
分块是否支持英语以外的其他语言?
keyboard_arrow_down
除了西方语言外,分块技术还适用于中文、日语和韩语。
自微调相关常见问题
微调 API 的费用是多少?
keyboard_arrow_down
此功能目前处于测试阶段,每个微调模型需要花费 100 万个词元。如果 Embedding/Reranker API 中有足够的词元,您可以使用现有的 API 密钥,也可以创建一个新的 API 密钥,其中包含 1000 万个免费词元。
我需要输入什么?我需要提供训练数据吗?
keyboard_arrow_down
您无需提供任何训练数据。只需用自然语言描述您的目标域(您希望优化微调向量模型的域),或使用 URL 作为参考,我们的系统就会生成合成数据来训练模型。
微调一个模型需要多长时间?
keyboard_arrow_down
大约 30 分钟。
微调后的模型存储在哪里?
keyboard_arrow_down
经过微调的模型和合成数据公开存储在 Hugging Face 模型中心。
如果我提供一个参考 URL,系统将如何使用它?
keyboard_arrow_down
系统使用 Reader API 从 URL 中获取内容。然后分析内容以总结语气和领域,并以此作为生成合成数据的指导方针。因此,URL 应该是公开可访问的,并且代表目标域。
我可以针对特定语言微调模型吗?
keyboard_arrow_down
是的,您可以针对非英语语言微调模型。系统会自动检测域指令的语言并相应地生成合成数据。我们还建议为目标语言选择合适的底座模型。例如,如果针对德语域,则应选择“jina-embeddings-v2-base-de”作为底座模型。
我可以微调非 Jina 向量模型吗,例如 bge-M3?
keyboard_arrow_down
不,我们的微调 API 仅支持 Jina v2 模型。
如何保证微调模型的质量?
keyboard_arrow_down
在微调过程结束时,系统会使用保留的测试集评估模型并报告性能指标。您将收到一封电子邮件,详细说明此测试集的前后性能。我们还鼓励您在自己的测试集上评估模型以确保其质量。
如何生成合成数据?
keyboard_arrow_down
该系统通过将您提供的目标域指令与大模型智能体的推理相结合来生成合成数据。它会产生具有挑战的三元组,这对于训练高质量的向量模型模型至关重要。有关更多详细信息,请参阅我们即将在 Arxiv 上发表的研究论文。
我可以对我的微调模型和合成数据保持私密吗?
keyboard_arrow_down
目前没有。请注意,此功能仍处于测试阶段。将微调后的模型和合成数据公开存储在 Hugging Face 模型中心有助于我们和社区评估训练的质量。未来,我们计划提供私人存储选项。
如何使用微调模型?
keyboard_arrow_down
由于所有微调模型都已上传至 Hugging Face,因此您只需指定模型名称即可通过 SentenceTransformers 访问它们。
我从未收到包含评估结果的电子邮件。我该怎么办?
keyboard_arrow_down
请检查您的垃圾邮件文件夹。如果仍然找不到,请使用您提供的电子邮件地址联系我们的支持团队。
联系我们
API相关常见问题
code
我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗?
keyboard_arrow_down
是的,同一个 API 密钥适用于 Jina AI 的所有搜索基础产品。这包括读取器、向量模型、重排器、分类器和微调模型 API,所有服务之间共享词元。
code
我可以查看 API 密钥的词元使用情况吗?
keyboard_arrow_down
是的,您可以在“密钥和计费”选项卡中输入您的 API 密钥来查看词元最近的使用记录和剩余词元余额。如果您已登录 API 密钥控制面板,也可以在“管理 API 密钥”选项卡中查看这些详细信息。
code
如果我忘记了 API 密钥,该怎么办?
keyboard_arrow_down
如果您遗失了充值密钥并希望找回,请使用您的注册电子邮件联系 support AT jina.ai 寻求帮助。建议登录以便于安全保存和便捷访问您的 API 密钥。
联系我们
code
API 密钥会过期吗?
keyboard_arrow_down
不,我们的 API 密钥没有到期日期。但是,如果您怀疑您的密钥已被泄露并希望停用它,请联系我们的支持团队寻求帮助。您还可以在API 密钥控制面板中自助销毁您的密钥。
联系我们
code
我可以在 API 密钥之间转移词元余额吗?
keyboard_arrow_down
是的,您可以将剩余的付费词元余额从一个高级密钥转移到另一个密钥。在API 密钥控制面板上登录您的帐户后,在该密钥的设置界面来转移所有剩余的付费词元余额。
code
我可以销毁我的 API 密钥吗?
keyboard_arrow_down
是的,如果您认为您的 API 密钥已被泄露,您可以销毁该密钥。销毁密钥将立即为所有存储该密钥的用户禁用该密钥,并且所有剩余词元余额和关联资产将永久不可用。如果您拥有高级密钥,您可以选择在销毁之前将剩余的已付款词元余额转移到另一个密钥。请注意,此操作无法撤消。要销毁密钥,请前往API 密钥控制面板中的密钥设置。
code
为什么有些机型第一次请求比较慢?
keyboard_arrow_down
这是因为我们的无服务器架构在使用率较低时会卸载某些模型。初始请求会激活或“预热”模型,这可能需要几秒钟。初始激活后,后续请求的处理速度会快得多。
code
用户输入数据是否用于训练您的模型?
keyboard_arrow_down
我们遵守严格的隐私政策,不会使用用户输入数据来训练我们的模型。我们还符合 SOC 2 类型 I 和类型 II 标准,确保高标准的安全性和隐私性。
与计费相关的常见问题
attach_money
API是根据句子的数量或请求的数量计费吗?
keyboard_arrow_down
我们的定价模型基于处理的词元总数,允许用户灵活地在任意数量的句子中分配这些词元,为不同的文本分析需求提供经济高效的解决方案。
attach_money
新用户可以免费试用吗?
keyboard_arrow_down
我们为新用户提供免费试用,其中包含一千万个可用于我们任何模型的词元,并通过自动生成的 API 密钥进行兑换。免费词元用完后,用户可以通过“购买词元”标签页轻松购买额外的词元,用于 API 密钥。
attach_money
失败的请求是否会扣除词元?
keyboard_arrow_down
不,失败的请求不会扣除词元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通过 Stripe 处理,支持多种付款方式,包括信用卡、Google Pay 和 PayPal,为您提供方便。
attach_money
词元购买后可以开具发票吗?
keyboard_arrow_down
是的,购买词元后,发票将发送到与您的 Stripe 帐户关联的电子邮件地址。
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, CA 94085, 美国
location_on
德国柏林(总部)
Prinzessinnenstraße 19-20,10969 柏林,德国
location_on
中国北京
中国北京市海淀区西大街48号6号楼5层
location_on
中国深圳
中国深圳市赋安科技大厦4楼402
搜索底座
深度搜索
读取器
向量模型
重排器
分类器
切分器
API 文档
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Jina AI © 2020-2025.