新闻
模型
产品
keyboard_arrow_down
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
深度搜索
搜索、读取并推理直到找到最佳答案。
更多的
keyboard_arrow_down
分类器
图片和文本的零样本和少样本分类。
切分器
将长文本切分成块或词元。

MCP 服务器
添加 mcp.jina.ai 作为您的MCP服务器,让大模型使用我们的API
open_in_new
API 文档
为您的AI 编程助手 IDE 或大模型自动生成代码
open_in_new


公司
keyboard_arrow_down
关于我们
联系销售
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款及条件


登录
login

切分器

用于将长文本分割成块并进行切词的免费 API。

切分器 API

我们的切分器对于帮助大模型在上下文限制内管理输入以及优化模型性能至关重要。它允许开发人员计算词元并提取相关文本段,从而确保高效的数据处理和成本管理。
key
密钥和计费
code
用量
more_horiz
更多的
chevron_leftchevron_right

home
speed速率限制
help_outline常见问题
api
服务状态
chevron_leftchevron_right

使用 GET 请求直接返回词元数量

使用 POST 请求获取更多功能

upload
请求
curl -X POST 'https://api.jina.ai/v1/segment' \
  -H "Content-Type: application/json" \
  -d @- <<EOFEOF
  {
    "content": "Jina AI: Your Search Foundation, Supercharged! 🚀\nIhrer Suchgrundlage, aufgeladen! 🚀\n您的搜索底座,从此不同!🚀\n検索ベース,もう二度と同じことはありません!🚀"
  }
EOFEOF



什么是切分器?

分段器是将文本转换为词元或块的关键组件,它们是向量模型/重排器或大模型处理的基本数据单位。词元可以表示整个单词、单词的一部分,甚至是单个字符。

对长文档进行切块,快如闪电鞭!

您还可以使用切分器将长文档分割成较小的块,从而更轻松地在向量模型或重排器中处理它们。我们利用常见的结构线索并构建了一套规则和启发式方法,这些规则和启发式方法在不同类型的内容(例如 Markdown、HTML、LaTeX 和 CJK 语言)中表现良好。
每个块的最大长度: 1000
每个块中的最大字符数。实际上,如果文本中有自然边界,块长度可以小于此值。

总共 0 个切块


切分器是免费的!

通过提供您的 API 密钥,您可以访问更高的速率限制,并且不会对您的密钥收费。
速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
key获取 API 密钥
handshake联系销售

常见问题

切分器的价格是多少?
keyboard_arrow_down
切分器可免费使用。通过提供您的 API 密钥,您可以访问更高的速率限制,并且不会向您的密钥收费。
如果我不提供 API 密钥,速率限制是多少?
keyboard_arrow_down
如果没有 API 密钥,您可以以 20 RPM 的速率限制访问切分器。
如果我提供 API 密钥,速率限制是多少?
keyboard_arrow_down
使用 API 密钥,您可以以 200 RPM 的速率限制访问切分器。对于高级付费用户,速率限制为 1000 RPM。
您会从我的 API 密钥中收取词元吗?
keyboard_arrow_down
不可以,您的 API 密钥仅用于访问更高的速率限制。
切分器是否支持多种语言?
keyboard_arrow_down
是的,切分器是多语言的,支持超过 100 种语言。
GET 和 POST 请求有什么区别?
keyboard_arrow_down
GET 请求仅用于计算文本中的词元数,可让您轻松将其作为计数器集成到应用程序中。POST 请求支持更多参数和功能,例如返回第一个/最后一个 N 个词元。
每个请求可以切词的最大长度是多少?
keyboard_arrow_down
每个请求最多可以发送 64k 个字符。
切块功能如何工作?是语义切块吗?
keyboard_arrow_down
切块功能可根据常见的结构线索将长文档分割成较小的块,从而确保将文本准确地分割成有意义的块。本质上,它是一个(大!)正则表达式模式,可根据某些通常与语义边界一致的句法特征(例如句子结尾、段落分隔符、标点符号和某些连词)对文本进行分割。它不是语义切块。这个(大)正则表达式在正则表达式的限制范围内尽可能强大。它平衡了复杂性和性能。虽然正则表达式无法实现真正的语义理解,但它可以通过常见的结构线索很好地近似上下文。
如何在切分器中处理诸如`endoftext`之类的特殊词元?
keyboard_arrow_down
如果输入包含特殊词元,我们的切分器会将它们放入`special_tokens`字段中。这样您就可以轻松识别它们并根据下游任务进行相应的处理,例如在将文本输入大模型之前将其删除以防止注入攻击。
分块是否支持英语以外的其他语言?
keyboard_arrow_down
除了西方语言外,分块技术还适用于中文、日语和韩语。

如何获取我的 API 密钥?

video_not_supported

速率限制是多少?

速率限制
速率限制通过三种方式跟踪:RPM(每分钟请求数)和TPM(每分钟词元数)。限制按 IP/API 密钥强制执行,当首先达到 RPM 或 TPM 阈值时,将触发限制。当您在请求标头中提供 API 密钥时,我们会按密钥而不是 IP 地址跟踪速率限制。
产品API端口描述arrow_upward无 API 密钥key_off使用 API 密钥key带有高级 API 密钥key平均延迟词元使用计数请求类型
读取器 APIhttps://r.jina.ai将 URL 转换为大模型友好文本20 RPM500 RPMtrending_up5000 RPM7.9s以输出响应中的词元数量为准。GET/POST
读取器 APIhttps://s.jina.ai搜索网络并将结果转换为大模型友好文本block100 RPMtrending_up1000 RPM2.5s每个请求都需要固定数量的词元,从 10000 个词元开始GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM500 RPM56.7s统计整个过程中词元的总数。POST
向量模型APIhttps://api.jina.ai/v1/embeddings将文本/图片转为定长向量block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查询对文档进行精排block500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
取决于输入大小
help
以输入请求中的词元数量为准。POST
分类器 APIhttps://api.jina.ai/v1/train使用训练样本训练分类器block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 × 迭代次数POST
分类器 API (少量样本)https://api.jina.ai/v1/classify使用经过训练的少样本分类器对输入进行分类block20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元POST
分类器 API (零样本)https://api.jina.ai/v1/classify使用零样本分类对输入进行分类block200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
取决于输入大小
词元计数为:输入词元 加 标签词元POST
切分器 APIhttps://api.jina.ai/v1/segment对长文本进行分词分句20 RPM200 RPM1,000 RPM0.3s词元不计算使用量。GET/POST
API相关常见问题
code
我可以对读取器、向量模型、重排器、分类器和微调模型 API 使用相同的 API 密钥吗?
keyboard_arrow_down
是的,同一个 API 密钥适用于 Jina AI 的所有搜索基础产品。这包括读取器、向量模型、重排器、分类器和微调模型 API,所有服务之间共享词元。
code
我可以查看 API 密钥的词元使用情况吗?
keyboard_arrow_down
是的,您可以在“密钥和计费”选项卡中输入您的 API 密钥来查看词元最近的使用记录和剩余词元余额。如果您已登录 API 密钥控制面板,也可以在“管理 API 密钥”选项卡中查看这些详细信息。
code
如果我忘记了 API 密钥,该怎么办?
keyboard_arrow_down
如果您遗失了充值密钥并希望找回,请使用您的注册电子邮件联系 support AT jina.ai 寻求帮助。建议登录以便于安全保存和便捷访问您的 API 密钥。
联系我们
code
API 密钥会过期吗?
keyboard_arrow_down
不,我们的 API 密钥没有到期日期。但是,如果您怀疑您的密钥已被泄露并希望停用它,请联系我们的支持团队寻求帮助。您还可以在API 密钥控制面板中自助销毁您的密钥。
联系我们
code
我可以在 API 密钥之间转移词元余额吗?
keyboard_arrow_down
是的,您可以将剩余的付费词元余额从一个高级密钥转移到另一个密钥。在API 密钥控制面板上登录您的帐户后,在该密钥的设置界面来转移所有剩余的付费词元余额。
code
我可以销毁我的 API 密钥吗?
keyboard_arrow_down
是的,如果您认为您的 API 密钥已被泄露,您可以销毁该密钥。销毁密钥将立即为所有存储该密钥的用户禁用该密钥,并且所有剩余词元余额和关联资产将永久不可用。如果您拥有高级密钥,您可以选择在销毁之前将剩余的已付款词元余额转移到另一个密钥。请注意,此操作无法撤消。要销毁密钥,请前往API 密钥控制面板中的密钥设置。
code
为什么有些机型第一次请求比较慢?
keyboard_arrow_down
这是因为我们的无服务器架构在使用率较低时会卸载某些模型。初始请求会激活或“预热”模型,这可能需要几秒钟。初始激活后,后续请求的处理速度会快得多。
code
用户输入数据是否用于训练您的模型?
keyboard_arrow_down
我们遵守严格的隐私政策,不会使用用户输入数据来训练我们的模型。我们还符合 SOC 2 类型 I 和类型 II 标准,确保高标准的安全性和隐私性。
与计费相关的常见问题
attach_money
API是根据句子的数量或请求的数量计费吗?
keyboard_arrow_down
我们的定价模型基于处理的词元总数,允许用户灵活地在任意数量的句子中分配这些词元,为不同的文本分析需求提供经济高效的解决方案。
attach_money
新用户可以免费试用吗?
keyboard_arrow_down
我们为新用户提供免费试用,其中包含一千万个可用于我们任何模型的词元,并通过自动生成的 API 密钥进行兑换。免费词元用完后,用户可以通过“购买词元”标签页轻松购买额外的词元,用于 API 密钥。
attach_money
失败的请求是否会扣除词元?
keyboard_arrow_down
不,失败的请求不会扣除词元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通过 Stripe 处理,支持多种付款方式,包括信用卡、Google Pay 和 PayPal,为您提供方便。
attach_money
词元购买后可以开具发票吗?
keyboard_arrow_down
是的,购买词元后,发票将发送到与您的 Stripe 帐户关联的电子邮件地址。
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, CA 94085, 美国
location_on
德国柏林(总部)
Prinzessinnenstraße 19-20,10969 柏林,德国
location_on
中国北京
中国北京市海淀区西大街48号6号楼5层
location_on
中国深圳
中国深圳市赋安科技大厦4楼402
搜索底座
读取器
向量模型
重排器
深度搜索
分类器
切分器
API 文档
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Jina AI © 2020-2025.