新聞
模型
API
keyboard_arrow_down
讀取器
讀取URL或搜索為大模型提供更好的依據。
向量模型
世界一流的多模態多語言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相關性。
MCP terminal命令行articlellms.txtsmart_toy代理人data_object模式menu_book文檔



登錄
login

切分器

用於將長文本分割成塊並進行切詞的免費 API。

切分器 API

我們的切分器對於幫助大模型在上下文限制內管理輸入以及優化模型性能至關重要。它允許開發人員計算詞元並提取相關文本段,從而確保高效的數據處理和成本管理。
key密鑰和計費
more_horiz更多的
chevron_leftchevron_right

home
speed速率限制
help_outline常見問題
menu_bookDocs
服務狀態
chevron_leftchevron_right

使用 GET 請求直接返回詞元數量

使用 POST 請求獲取更多功能

upload
請求
curl -X POST 'https://api.jina.ai/v1/segment' \
  -H "Content-Type: application/json" \
  -d @- <<EOFEOF
  {
    "content": "Jina AI: Your Search Foundation, Supercharged! 🚀\nIhrer Suchgrundlage, aufgeladen! 🚀\n您的搜索底座,从此不同!🚀\n検索ベース,もう二度と同じことはありません!🚀"
  }
EOFEOF



什麼是切分器?

分段器是將文本轉換為詞元或塊的關鍵組件,它們是向量模型/重排器或大模型處理的基本數據單位。詞元可以表示整個單詞、單詞的一部分,甚至是單個字符。

對長文檔進行切塊,快如閃電鞭!

您還可以使用切分器將長文檔分割成較小的塊,從而更輕鬆地在向量模型或重排器中處理它們。我們利用常見的結構線索並構建了一套規則和啓發式方法,這些規則和啓發式方法在不同類型的內容(例如 Markdown、HTML、LaTeX 和 CJK 語言)中表現良好。
每個塊的最大長度: 1000
每個塊中的最大字符數。實際上,如果文本中有自然邊界,塊長度可以小於此值。

總共 0 個切塊


切分器是免費的!

通過提供您的 API 密鑰,您可以訪問更高的速率限制,並且不會對您的密鑰收費。
速率限制
速率限制通過三種方式跟蹤:RPM(每分鐘請求數)和TPM(每分鐘詞元數)。限制按 IP/API 密鑰強制執行,當首先達到 RPM 或 TPM 閾值時,將觸發限制。當您在請求標頭中提供 API 密鑰時,我們會按密鑰而不是 IP 地址跟蹤速率限制。
產品API端口描述arrow_upward無 API 密鑰key_off免費 API 密鑰key使用付費 API 密鑰key帶有高級 API 密鑰key平均延遲詞元使用計數請求類型
讀取器 APIhttps://r.jina.ai將 URL 轉換為大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以輸出響應中的詞元數量為準。GET/POST
讀取器 APIhttps://s.jina.ai搜索網絡並將結果轉換為大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每個請求都需要固定數量的詞元,從 10000 個詞元開始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings將文本/圖片轉為定長向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查詢對文檔進行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
分類器 APIhttps://api.jina.ai/v1/train使用訓練樣本訓練分類器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 × 迭代次數POST
分類器 API (少量樣本)https://api.jina.ai/v1/classify使用經過訓練的少樣本分類器對輸入進行分類block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元POST
分類器 API (零樣本)https://api.jina.ai/v1/classify使用零樣本分類對輸入進行分類block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 加 標籤詞元POST
切分器 APIhttps://api.jina.ai/v1/segment對長文本進行分詞分句20 RPM200 RPM200 RPM1,000 RPM0.3s詞元不計算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s統計整個過程中詞元的總數。POST
key獲取 API 密鑰
handshake聯繫銷售

常見問題

切分器的價格是多少?
keyboard_arrow_down
切分器可免費使用。通過提供您的 API 密鑰,您可以訪問更高的速率限制,並且不會向您的密鑰收費。
如果我不提供 API 密鑰,速率限制是多少?
keyboard_arrow_down
如果沒有 API 密鑰,您可以以 20 RPM 的速率限制訪問切分器。
如果我提供 API 密鑰,速率限制是多少?
keyboard_arrow_down
使用 API 密鑰,您可以以 200 RPM 的速率限制訪問切分器。對於高級付費用户,速率限制為 1000 RPM。
您會從我的 API 密鑰中收取詞元嗎?
keyboard_arrow_down
不可以,您的 API 密鑰僅用於訪問更高的速率限制。
切分器是否支持多種語言?
keyboard_arrow_down
是的,切分器是多語言的,支持超過 100 種語言。
GET 和 POST 請求有什麼區別?
keyboard_arrow_down
GET 請求僅用於計算文本中的詞元數,可讓您輕鬆將其作為計數器集成到應用程序中。POST 請求支持更多參數和功能,例如返回第一個/最後一個 N 個詞元。
每個請求可以切詞的最大長度是多少?
keyboard_arrow_down
每個請求最多可以發送 64k 個字符。
切塊功能如何工作?是語義切塊嗎?
keyboard_arrow_down
切塊功能可根據常見的結構線索將長文檔分割成較小的塊,從而確保將文本準確地分割成有意義的塊。本質上,它是一個(大!)正則表達式模式,可根據某些通常與語義邊界一致的句法特徵(例如句子結尾、段落分隔符、標點符號和某些連詞)對文本進行分割。它不是語義切塊。這個(大)正則表達式在正則表達式的限制範圍內儘可能強大。它平衡了複雜性和性能。雖然正則表達式無法實現真正的語義理解,但它可以通過常見的結構線索很好地近似上下文。
如何在切分器中處理諸如`endoftext`之類的特殊詞元?
keyboard_arrow_down
如果輸入包含特殊詞元,我們的切分器會將它們放入`special_tokens`字段中。這樣您就可以輕鬆識別它們並根據下游任務進行相應的處理,例如在將文本輸入大模型之前將其刪除以防止注入攻擊。
分塊是否支持英語以外的其他語言?
keyboard_arrow_down
除了西方語言外,分塊技術還適用於中文、日語和韓語。

如何獲取我的 API 密鑰?

video_not_supported

速率限制是多少?

速率限制
速率限制通過三種方式跟蹤:RPM(每分鐘請求數)和TPM(每分鐘詞元數)。限制按 IP/API 密鑰強制執行,當首先達到 RPM 或 TPM 閾值時,將觸發限制。當您在請求標頭中提供 API 密鑰時,我們會按密鑰而不是 IP 地址跟蹤速率限制。
產品API端口描述arrow_upward無 API 密鑰key_off免費 API 密鑰key使用付費 API 密鑰key帶有高級 API 密鑰key平均延遲詞元使用計數請求類型
讀取器 APIhttps://r.jina.ai將 URL 轉換為大模型友好文本20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s以輸出響應中的詞元數量為準。GET/POST
讀取器 APIhttps://s.jina.ai搜索網絡並將結果轉換為大模型友好文本block100 RPM100 RPMtrending_up1000 RPM2.5s每個請求都需要固定數量的詞元,從 10000 個詞元開始GET/POST
向量模型APIhttps://api.jina.ai/v1/embeddings將文本/圖片轉為定長向量block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
重排器 APIhttps://api.jina.ai/v1/rerank按查詢對文檔進行精排block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
取決於輸入大小
help
以輸入請求中的詞元數量為準。POST
分類器 APIhttps://api.jina.ai/v1/train使用訓練樣本訓練分類器block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 × 迭代次數POST
分類器 API (少量樣本)https://api.jina.ai/v1/classify使用經過訓練的少樣本分類器對輸入進行分類block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元POST
分類器 API (零樣本)https://api.jina.ai/v1/classify使用零樣本分類對輸入進行分類block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
取決於輸入大小
詞元計數為:輸入詞元 加 標籤詞元POST
切分器 APIhttps://api.jina.ai/v1/segment對長文本進行分詞分句20 RPM200 RPM200 RPM1,000 RPM0.3s詞元不計算使用量。GET/POST
深度搜索https://deepsearch.jina.ai/v1/chat/completions推理、搜索和迭代以找到最佳答案block50 RPM50 RPM500 RPM56.7s統計整個過程中詞元的總數。POST
API相關常見問題
code
我可以對讀取器、向量模型、重排器、分類器和微調模型 API 使用相同的 API 密鑰嗎?
keyboard_arrow_down
是的,同一個 API 密鑰適用於 Jina AI 的所有搜索基礎產品。這包括讀取器、向量模型、重排器、分類器和微調模型 API,所有服務之間共享詞元。
code
我可以查看 API 密鑰的詞元使用情況嗎?
keyboard_arrow_down
是的,您可以在“密鑰和計費”選項卡中輸入您的 API 密鑰來查看最近的使用記錄和剩餘額度。如果您已登錄 API 密鑰控制面板,也可以在“管理 API 密鑰”選項卡中查看這些詳細信息。
code
如果我忘記了 API 密鑰,該怎麼辦?
keyboard_arrow_down
如果您遺失了充值密鑰並希望找回,請使用您的註冊電子郵件聯繫 support AT jina.ai 尋求幫助。建議登錄以便於安全保存和便捷訪問您的 API 密鑰。
聯繫我們
code
API 密鑰會過期嗎?
keyboard_arrow_down
不,我們的 API 密鑰沒有到期日期。但是,如果您懷疑您的密鑰已被泄露並希望停用它,請聯繫我們的支持團隊尋求幫助。您還可以在API 密鑰控制面板中自助銷燬您的密鑰。
聯繫我們
code
我可以在 API 密鑰之間轉移額度嗎?
keyboard_arrow_down
是的,您可以將剩餘的付費額度從一個高級密鑰轉移到另一個密鑰。在API 密鑰控制面板上登錄您的帳户後,在該密鑰的設置界面來轉移所有剩餘的付費額度。
code
我可以銷燬我的 API 密鑰嗎?
keyboard_arrow_down
是的,如果您認為您的 API 密鑰已被泄露,您可以銷燬該密鑰。銷燬密鑰將立即為所有存儲該密鑰的用户禁用該密鑰,並且所有剩餘額度和關聯資產將永久不可用。如果您擁有高級密鑰,您可以選擇在銷燬之前將剩餘的已付款額度轉移到另一個密鑰。請注意,此操作無法撤消。要銷燬密鑰,請前往API 密鑰控制面板中的密鑰設置。
code
為什麼有些機型第一次請求比較慢?
keyboard_arrow_down
這是因為我們的無服務器架構在使用率較低時會卸載某些模型。初始請求會激活或“預熱”模型,這可能需要幾秒鐘。初始激活後,後續請求的處理速度會快得多。
code
我的API數據是否用於訓練你們的模型?
keyboard_arrow_down
不。我們絕不會使用您的 API 請求、輸入或輸出來訓練我們的嵌入模型、重排序模型或任何其他模型。您的數據始終歸您所有。我們符合 SOC 2 I 型和 II 型標準。
code
Jina API 的速率限制是多少?
keyboard_arrow_down
每個 API 密鑰均有速率限制:

免費版: 100 RPM,100K TPM,2 個併發請求
付費版: 500 RPM,2M TPM,50 個併發請求
高級版: 5,000 RPM,50M TPM,500 個併發請求

此外,還有基於 IP 的速率限制,每 60 秒 10,000 個請求。這些限制適用於所有 Jina API(嵌入式 API、重排序 API、讀取器 API 等)。
code
API是否有批量大小限制?
keyboard_arrow_down
Embeddings API 和 Reranker API 均無批次大小限制。您可以根據需要每次請求發送任意數量的項目或文檔。這兩個 API 都會根據 token 數量對輸入進行內部批處理,以實現最佳的 GPU 利用率。
與計費相關的常見問題
attach_money
API是根據句子的數量或請求的數量計費嗎?
keyboard_arrow_down
我們的定價模型基於處理的詞元總數,允許用户靈活地在任意數量的句子中分配這些詞元,為不同的文本分析需求提供經濟高效的解決方案。
attach_money
新用户可以免費試用嗎?
keyboard_arrow_down
我們為新用户提供免費試用,自動生成的 API 密鑰包含一千萬個可用於我們任何模型的詞元。免費額度用完後,用户可以通過"充值"標籤頁輕鬆購買額外的額度。
attach_money
失敗的請求是否會扣除詞元?
keyboard_arrow_down
不,失敗的請求不會扣除詞元。
attach_money
接受哪些付款方式?
keyboard_arrow_down
付款通過 Stripe 處理,支持多種付款方式,包括信用卡、Google Pay 和 PayPal,為您提供方便。
attach_money
充值後可以開具發票嗎?
keyboard_arrow_down
是的,充值後發票將發送到與您的 Stripe 帳户關聯的電子郵件地址。
辦公室
location_on
加利福尼亞州桑尼維爾
710 Lakeway Dr, Ste 200, 桑尼維爾, 加州 94085, 美國
location_on
德國柏林
Prinzessinnenstraße 19-20,10969 柏林,德國
搜索底座
讀取器
向量模型
重排器
獲取 Jina API 密鑰
速率限制
API 狀態
公司
關於我們
聯繫銷售
新聞
實習生項目
下載 Jina 標誌
open_in_new
下載 Elastic 徽標
open_in_new
條款
安全
條款及條件
隱私
管理 Cookie
email
Elastic Jina AI © 2020-2026.