ニュース
モデル
API
keyboard_arrow_down
読者
URL を読み取ったり検索したりすると、大規模なモデルのサポートが向上します。
ベクトルモデル
世界クラスのマルチモーダル、多言語埋め込み。
並べ替え者
検索の関連性を最大化する世界クラスのニューラルレトリーバー。
MCP terminalコマンドラインarticlellms.txtsmart_toyエージェントdata_objectモデルmenu_book書類



ログイン
login

ベクトルモデル

検索、RAG、エージェント アプリケーション向けの最先端のマルチモーダルな多言語ロング コンテキスト ベクトル モデル。

ベクトルモデルAPI

世界クラスのベクトル モデルを使用して、検索システムと RAG システムを改善します。まずは無料トライアルから始めましょう!
key鍵と請求
code投与量
more_horizもっと
chevron_leftchevron_right

home
speedレート制限
bug_report問題のフィードバック
help_outlineよくある質問
サービス状況
chevron_leftchevron_right


入力例
変更してみて、応答がどのように変化するかを確認してください。
Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.
Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.
Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.
针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。
新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

upload
聞く
curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF


v5-text: 最新かつ最先端の小型多言語埋め込み

jina-embeddings-v5-text は、2 つの効率的なサイズ (677M の小さなモデルと 239M のナノスケール モデル) で第 5 世代の埋め込み品質を提供し、タスク固有の LoRA アダプター、Matryoshka 次元、32K コンテキスト、およびエッジ展開用の GGUF/MLX 量子化を使用して、MMTEB、MTEB 英語、および検索タスクの新しいベンチマークを設定します。
リリースノートを読むarrow_forward

v4: マルチモーダル・多言語検索のためのユニバーサルベクトル

jina-embeddings-v4 は、これまでで最大の飛躍です。38 億のモデルで、テキストと画像の統合パス ベクトルを通じて高密度かつ遅延インタラクティブ検索をサポートし、特に視覚的に豊富なドキュメント検索において、Google、OpenAI、Voyage AI の独自モデルを上回っています。

2つの購入方法

弊社の API をサブスクライブするか、クラウド サービス プロバイダーを通じて購入してください。
radio_button_unchecked
cloud
3 のクラウド サービス プロバイダーと連携します
あなたの会社は AWS または Azure を使用していますか?次に、当社の検索インフラストラクチャ モデルを社内のこれらのプラットフォームに直接展開して、データの安全性と準拠性を維持します。
AWS SageMaker
ベクトルモデル
並べ替え者
Microsoft Azure
ベクトルモデル
並べ替え者
Google Cloud
ベクトルモデル
radio_button_checked
Jinaを使用した検索ベースAPI
すべての製品にアクセスする最も簡単な方法。いつでもトークンをリチャージできます。
この API キーにさらにトークンを追加します
お住まいの地域によっては、米ドル、ユーロ、またはその他の通貨で請求される場合があります。税金が適用される場合があります。
リチャージするには正しい API キーを入力してください
レート制限について学ぶ
レート制限とは、1 分間に IP アドレス/API キー (RPM) ごとに API に対して実行できるリクエストの最大数です。各製品およびティアのレート制限の詳細については、以下をご覧ください。
keyboard_arrow_down
レート制限
レート制限は、RPM (1 分あたりのリクエスト数) と TPM (1 分あたりの単語数) の 3 つの方法で追跡されます。制限は IP/API キーごとに適用され、RPM または TPM のしきい値に最初に達したときにトリガーされます。リクエスト ヘッダーに API キーを指定すると、IP アドレスではなくキーによってレート制限が追跡されます。
製品APIポート説明するarrow_upwardAPIキーがありませんkey_off無料のAPIキーkey有料APIキーを使用するkeyプレミアムAPIキー付属key平均遅延単語の使用数リクエストの種類
リーダーAPIhttps://r.jina.aiURLをモデルに適した大きなテキストに変換する20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s出力応答内のトークンの数に基づきます。GET/POST
リーダーAPIhttps://s.jina.aiウェブを検索し、結果をモデルに適した大きなテキストに変換しますblock100 RPM100 RPMtrending_up1000 RPM2.5s各リクエストには、10000 トークンから始まる固定数のトークンが必要です。GET/POST
ベクトルモデルAPIhttps://api.jina.ai/v1/embeddingsテキスト/画像を固定長ベクトルに変換するblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
入力サイズに依存
help
入力リクエスト内のトークンの数に基づきます。POST
リオーダラー APIhttps://api.jina.ai/v1/rerankクエリによるドキュメントの絞り込みblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
入力サイズに依存
help
入力リクエスト内のトークンの数に基づきます。POST
分類子 APIhttps://api.jina.ai/v1/trainトレーニング サンプルを使用して分類器をトレーニングするblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
入力サイズに依存
単語数は、入力単語×反復回数で表されます。POST
分類子 API (ゼロサンプル)https://api.jina.ai/v1/classifyゼロショット分類を使用して入力を分類するblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
入力サイズに依存
単語数は、入力単語とタグ単語の合計です。POST
分類子 API (小さなサンプル)https://api.jina.ai/v1/classifyトレーニングされた少数ショット分類器を使用して入力を分類するblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
入力サイズに依存
トークン数: 入力トークンPOST
セグメンタ APIhttps://api.jina.ai/v1/segment長いテキストを単語や文に分割する20 RPM200 RPM200 RPM1,000 RPM0.3sトークンの使用量はカウントされません。GET/POST
ディープサーチhttps://deepsearch.jina.ai/v1/chat/completions推論し、検索し、繰り返して最善の答えを見つけるblock50 RPM50 RPM500 RPM56.7sプロセス全体のトークンの総数をカウントします。POST

プライベート展開

Jina Embeddings モデルを AWS Sagemaker と Microsoft Azure にデプロイし、まもなく Google Cloud サービスにもデプロイするか、当社の営業チームに問い合わせて、仮想プライベート クラウドとオンプレミス サーバー用のカスタム Kubernetes デプロイメントを入手してください。
AWS SageMaker
ベクトルモデル
並べ替え者
Microsoft Azure
ベクトルモデル
並べ替え者
Google Cloud
ベクトルモデル
API統合
当社のベクター モデル API は、一般的なデータベース、ベクター データベース、RAG および LLMOps フレームワークで簡単に使用できます。開始するには、API キーを以下の統合のいずれかにコピーするだけで、モデルをすぐに使用できます。
ベクトルデータベース
LLM フレームワーク
RAGアプリケーション
可観測性
open_in_new
MongoDB
open_in_new
DataStax
open_in_new
Qdrant
open_in_new
Pinecone
open_in_new
Chroma
open_in_new
Weaviate
open_in_new
Milvus
open_in_new
Epsilla
open_in_new
MyScale
open_in_new
LlamaIndex
open_in_new
Haystack
open_in_new
Langchain
open_in_new
Dify
open_in_new
SuperDuperDB
open_in_new
DashVector
open_in_new
Portkey
open_in_new
Baseten
open_in_new
TiDB
open_in_new
LanceDB
open_in_new
Carbon

私たちの論文

最先端の検索モデルがどのようにゼロから学習されているかを学び、最新の論文をご覧ください。EMNLP、SIGIR、ICLR、NeurIPS、ICMLで私たちのチームに会ってください!
arXiv
2月 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
arXiv
2月 11, 2026
Embedding Inversion via Conditional Masked Diffusion Language Models
ICLR 2026
1月 22, 2026
Embedding Compression via Spherical Coordinates
arXiv
12月 29, 2025
Vision Encoders in Vision-Language Models: A Survey
ICLR 2026
12月 04, 2025
Jina-VLM: Small Multilingual Vision Language Model
AAAI 2026
10月 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
NeurIPS 2025
8月 31, 2025
Efficient Code Embeddings from Code Generation Models
EMNLP 2025
6月 24, 2025
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval
ICLR 2025
3月 04, 2025
ReaderLM-v2: Small Language Model for HTML to Markdown and JSON
ACL 2025
12月 17, 2024
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark
ICLR 2025
12月 12, 2024
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images
ECIR 2025
9月 18, 2024
jina-embeddings-v3: Multilingual Embeddings With Task LoRA
SIGIR 2025
9月 07, 2024
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models
EMNLP 2024
8月 30, 2024
Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever
WWW 2025
6月 21, 2024
Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models
ICML 2024
5月 30, 2024
Jina CLIP: Your CLIP Model Is Also Your Text Retriever
arXiv
2月 26, 2024
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings
arXiv
10月 30, 2023
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents
EMNLP 2023
7月 20, 2023
Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models
合計で 19 件の論文があります。

ベクトルモデルの学習

ベクトルとは何ですか?なぜベクトル化する必要があるのですか?始めるための記事がいくつかあります。包括的なガイドでベクトル モデルについて基礎から学びましょう。
Abstract illustration of a sound wave or heartbeat, formed by blue, orange, and gray dots on a white background.
3月 11, 2026 • 7 読む時間
Bootstrapping Audio Embeddings from Multimodal LLMs
Turn any multimodal LLM into a small audio embedding model that beats CLAP with 25x less data.
Han Xiao
Fingerprint illustration made from numbers, showcasing digital and high-tech design on a light background.
3月 06, 2026 • 6 読む時間
Identifying Embedding Models from Raw Numerical Values
A tiny transformer that fingerprints embedding models by reading raw numerical digits. No feature engineering.
Han Xiao
Abstract digital artwork in black and white, featuring scattered dots forming letters in a halftone effect. The central lette
2月 19, 2026 • 7 読む時間
jina-embeddings-v5-text: New SOTA Small Multilingual Embeddings
Two sub-1B multilingual embeddings with best-in-class performance, available on Elastic Inference Service, Llama.cpp and MLX.
Han Xiao
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
2月 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
Text embedding models are widely used for semantic similarity tasks, including information retrieval, clustering, and classification. General-purpose models are typically trained with single- or multi-stage processes using contrastive loss functions. We introduce a novel training regimen that combines model distillation techniques with task-specific contrastive loss to produce compact, high-performance embedding models. Our findings suggest that this approach is more effective for training small models than purely contrastive or distillation-based training paradigms alone. Benchmark scores for the resulting models, jina-embeddings-v5-text-small and jina-embeddings-v5-text-nano, exceed or match the state-of-the-art for models of similar size. jina-embeddings-v5-text models additionally support long texts (up to 32k tokens) in many languages, and generate embeddings that remain robust under truncation and binary quantization. Model weights are publicly available, hopefully inspiring further advances in embedding model development.

再配列器、ベクトル検索、BM25の比較

以下の表は、リオーダラー、ベクトル検索、BM25 の包括的な比較を示し、各カテゴリの長所と短所を示しています。
並べ替え者ベクトル検索BM25
シーンに最適検索の精度と関連性の向上初期の迅速なフィルタリング幅広いクエリにわたる一般的なテキスト検索
粒度詳細: サブドキュメントとクエリセグメント広範囲: 文書全体中級: さまざまなテキストの断片
クエリ時間の複雑さ高い適度低い
インデックス作成時間の複雑さ不要高い低い、事前に構築されたインデックスを利用する
トレーニング時間の複雑さ高い高い不要
検索品質より詳細な問い合わせに最適効率と精度のバランス幅広いクエリに対する一貫性と信頼性
アドバンテージ深い文脈理解による高精度中程度の精度で高速かつ効率的確立された機能で拡張性が高い
並べ替え者 API の無料トライアルベクターモデルAPIの無償利用

ベクターモデル70年

当社の丁寧に作られたポスターをオフィススペースやリビングルームに飾って、1950 年以来のテキスト ベクター モデルの進化と進化から次のインスピレーションを見つけてください。
ポスターを知る
shopping_cartポスターを購入する

よくある質問

Jina 埋め込みモデルはどのようにトレーニングされますか?
keyboard_arrow_down
トレーニング プロセス、データ ソース、評価の詳細については、arXiv で公開されている技術レポート jina-embeddings-v3 と jina-embeddings-v4 を参照してください。
launcharXiv
マルチモーダル埋め込みモデルとは何ですか?
keyboard_arrow_down
`jina-embeddings-v4` は、当社の最新の汎用マルチモーダルモデル(38億パラメータ)です。テキストと画像の両方をサポートし、32K のコンテキスト情報を含み、集中的および遅延インタラクティブ検索をサポートし、視覚的にリッチなドキュメントで最先端のパフォーマンスを実現します。`jina-clip-v2` はより軽量なモデル(8億6500万パラメータ)で、89 の言語をサポートし、画像解像度は 512x512 で、マトリョーシカ記法を採用しています。どちらのモデルも、テキストからテキスト、テキストから画像、画像から画像の検索タスクにおいて非常に優れたパフォーマンスを発揮します。
launcharXiv
あなたのモデルはどの言語をサポートしていますか?
keyboard_arrow_down
`jina-embeddings-v4`と`jina-embeddings-v3`はどちらも89言語をサポートし、強力な多言語機能を誇ります。サポートされている上位30言語は、アラビア語、ベンガル語、中国語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、グルジア語、ドイツ語、ギリシャ語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、ラトビア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スロバキア語、スペイン語、スウェーデン語、タイ語、トルコ語、ウクライナ語、ウルドゥー語、ベトナム語です。`jina-clip-v2`も89言語をサポートしており、マルチモーダルタスクに使用できます。
launcharXiv
単一の文入力の最大長はどれくらいですか?
keyboard_arrow_down
コンテキストの長さはモデルによって異なります。`jina-embeddings-v4` は最大32Kトークンをサポートし、`jina-embeddings-v3` と `jina-clip-v2` は最大8192トークンをサポートします。トークンは1文字または完全な単語です。この拡張コンテキストにより、大量のテキストデータに対するより包括的なドキュメント分析が可能になり、コンテキスト理解の精度が向上します。
1 つのリクエストには何文を含めることができますか?
keyboard_arrow_down
各リクエストに含めることができるアイテムの数に厳密な制限はありません。APIはGPU利用率を最適化するため、トークンの数に基づいて入力を内部的にバッチ処理します。1回のリクエストで任意の数のテキストまたは画像を送信できます。
マルチモーダル埋め込みモデルに画像を送信するにはどうすればよいでしょうか?
keyboard_arrow_down
`jina-embeddings-v4`、`jina-clip-v2`、`jina-clip-v1` では、API リクエストの `input` フィールドに `url` または `bytes` を使用できます。`url` には、処理する画像の URL を指定します。`bytes` には、画像を base64 形式でエンコードします。`jina-embeddings-v4` は、PDF URL または base64 でエンコードされた PDF バイトを渡すことで、PDF ドキュメントに直接埋め込むこともできます。
Jina Embeddings モデルは、OpenAI や Cohere の最新のベクトル モデルとどのように比較されますか?
keyboard_arrow_down
`jina-embeddings-v4`は、当社の最新のフラッグシップモデルであり、視覚的にリッチな文書検索(ViDoRe)とマルチモーダルベンチマークの両方で最先端(SOTA)のパフォーマンスを達成しています。プレーンテキストタスクでは、`jina-embeddings-v3`はMTEB英語および多言語ベンチマークにおいてOpenAIおよびCohereを上回り、サイズも小さく、より効率的です。両モデルともMatryoshka表現学習(MRL)をサポートしており、パフォーマンスを大幅に低下させることなく次元切り捨てが可能です(v3は32次元、v4は128次元まで切り捨て可能です)。
OpenAI の text-embedding-3-large から Jina Embeddings モデルに移行するにはどうすればよいですか?
keyboard_arrow_down
API エンドポイントは OpenAI の text-embeddings と互換性があるため、移行プロセスはスムーズでした。 -3-large モデルの入力 JSON スキーマと出力 JSON スキーマが一致します。この互換性により、ユーザーは OpenAI エンドポイントを使用するときに、OpenAI モデルを当社のモデルに簡単に置き換えることができます。
jina-clipモデルを使用する場合のトークンの計算方法は?
keyboard_arrow_down
トークンはテキストの長さと画像のサイズに基づいて計算されます。リクエスト内のテキストについては、標準的な方法でトークンが計算されます。画像については、以下の手順が実行されます。 1. タイルサイズ: 各画像はタイルに分割されます。jina-embeddings-v4 の場合、タイルサイズは28x28ピクセル、jina-clip-v2 の場合、タイルサイズは512x512ピクセル、jina-clip-v1 の場合、タイルサイズは224x224ピクセルです。 2. カバー率: 入力画像をカバーするために必要なタイルの数を計算します。画像サイズがタイルサイズで正確に割り切れない場合でも、部分的なタイルは完全なタイルとしてカウントされます。 3. タイルの総数: 画像をカバーするタイルの総数によってコストが決まります。例えば、600x600ピクセルの画像は、jina-embeddings-v4では22x22タイル(484タイル)、jina-clip-v2では2x2タイル(4タイル)、jina-clip-v1では3x3タイル(9タイル)で覆われます。 4. コスト計算:jina-embeddings-v4の場合、タイル1つあたりのコストは10トークン、jina-clip-v2の場合、タイル1つあたりのコストは4000トークン、jina-clip-v1の場合、タイル1つあたりのコストは1000トークンです。 例: 600x600ピクセルの画像の場合: • jina-embeddings-v4 を使用する場合 • 画像は28x28ピクセルのタイルに分割されます。 • 必要なタイルの総数は、22 (横) x 22 (縦) = 484 タイルです。 • jina-embeddings-v4 のコストは、484 * 10 = 4840 トークンです。 • jina-clip-v2 を使用します。 • 画像は 512 x 512 ピクセルのタイルに分割されます。 • 必要なタイルの総数は、2 (横) x 2 (縦) = 4 タイルです。 • jina-clip-v2 のコストは、4 * 4000 = 16000 トークンです。 • jina-clip-v1 を使用します。 • 画像は 224 x 224 ピクセルのタイルに分割されます。 • 必要なタイルの総数は、3(横)×3(縦)=9枚です。 • jina-clip-v1のコストは、9×1000=9000トークンです。
ベクターモデル画像やオーディオモデルを提供していますか?
keyboard_arrow_down
はい、jina-clip-v2 と jina-clip-v1 は画像とテキストをサポートできます。より多くのモダリティのベクトル モデルが近日中に発表される予定です。
Jina Embedding モデルは個人データまたは企業データを使用して微調整できますか?
keyboard_arrow_down
特定のデータを使用したモデルの微調整についてご質問がある場合は、要件についてお問い合わせください。私たちのモデルをお客様のニーズに合わせてどのように適応できるかを検討したいと考えています。
お問い合わせ
サービスを AWS、Azure、または GCP にプライベートにデプロイできますか?
keyboard_arrow_down
はい、当社のサービスは AWS、Azure、GCP マーケットプレイスで利用できます。特定の要件がある場合は、セールス AT jina.ai までお問い合わせください。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
「タスク」パラメータとは何ですか?どのような状況で使用すればよいですか?
keyboard_arrow_down
`jina-embeddings-v3` と `jina-embeddings-v4` の両方において、`task` パラメータは特定のタスクに対して LoRA アダプタを有効化し、最適なパフォーマンスを実現するために使用されます。これには、検索クエリには `retrieval.query`、ドキュメント検索には `retrieval.passage`、意味的類似度計算には `text-matching`、テキスト分類には `classification`、クラスタリングタスクには `separation` の使用が含まれます。
遅延インタラクティブ検索とは何ですか?どのモデルがこの検索方法をサポートしていますか?
keyboard_arrow_down
`jina-embeddings-v4` は、`output_type` パラメータを介して、稠密(単一ベクトル)および遅延インタラクション(複数ベクトル)検索をサポートします。遅延インタラクションは、より細分化された単語レベルの情報を保持するため、複雑なクエリでも検索精度が向上します。`jina-colbert-v2` は、遅延インタラクション専用のモデルです。
遅延チャンクとは何ですか?どのような状況で使用すればよいですか?
keyboard_arrow_down
遅延チャンキングは、まず長文コンテキストモデルを用いて文書全体を埋め込み、次に語彙レベル表現からチャンク埋め込みを抽出する手法です。ネイティブチャンキング(まずチャンキングしてから埋め込みを行う)とは異なり、遅延チャンキングはチャンク間のコンテキストを保持するため、RAGアプリケーションの検索性能が向上します。この機能は、`jina-embeddings-v3` の `late_chunking` パラメータで有効化できます。
API でサポートされるコンテキストの長さがモデルの最大容量と異なるのはなぜですか?
keyboard_arrow_down
一部の埋め込みモデルはアーキテクチャ上、より長いコンテキスト長を処理できますが、推論インフラストラクチャにおけるGPUメモリの制約により、APIによって制限値が低くなる場合があります。非常に長いシーケンスの処理には大量のメモリが必要となるため、スループット、レイテンシ、コストのバランスをとるために、ほとんどのユースケース向けにサービス構成を最適化しています。より長いコンテキスト長のサポートが必要な場合は、専用の導入ソリューションについて営業チームまでお問い合わせください。
jina-embeddings-v4 は無料なのになぜこんなに遅いのでしょうか?
keyboard_arrow_down
`jina-embeddings-v4` API は、Qwen Research License に基づいてリリースされている Qwen2-VL ベースモデル上に構築されています。このライセンスは研究および非商用利用のみを許可しているため、`jina-embeddings-v4` を商用製品として提供することはできません。そのため、このモデルへのアクセスは API 経由で無料で提供しています。`jina-embeddings-v4` は、他のモデルよりも遅くなる可能性がありますが、これには 2 つの理由があります。1 つ目は、`jina-embeddings-v4` モデルは `jina-embeddings-v3` モデルよりも大幅に大きいため、リクエストあたりの計算時間が長くなることです。2 つ目は、このモデルを商用化できないため、インフラストラクチャコストを抑えるために API スループットを意図的に制限していることです。ユーザーは、`jina-embeddings-v4` API を使用する際に、高いスループットや本番環境レベルのスループットを期待しないでください。より高いスループットを必要とする本番ワークロードの場合は、`jina-embeddings-v3` を使用するか、Hugging Face 経由で独自のインフラストラクチャに `jina-embeddings-v4` をデプロイすることをお勧めします。
Embeddings API のレート制限は何ですか?
keyboard_arrow_down
レート制限はAPIキーの種類によって異なります。

無料版: 100 RPM、100K TPM、同時リクエスト数 2
有料版: 500 RPM、2M TPM、同時リクエスト数 50
プレミアム版: 5,000 RPM、50M TPM、同時リクエスト数 500

さらに、不正使用を防ぐため、IPアドレスベースのレート制限も設けており、60秒あたり最大10,000リクエストまでに制限されています。より高い制限が必要な場合は、営業チームにお問い合わせください。
各埋め込みモデルのコンテキストの長さの制限は何ですか?
keyboard_arrow_down
各モデルには、入力ごとに最大コンテキスト長の制限があります。

jina-embeddings-v4: 32,768 トークン
jina-embeddings-v3: 8,192 トークン
jina-embeddings-v2-*: 8,192 トークン
jina-clip-v1/v2: 8,192 トークン
jina-colbert-v1/v2: 8,192 トークン
jina-code-embeddings-*: 32,768 トークン

truncate: true が設定されていない場合、制限を超える入力はエラーを返します。これを設定すると、入力は最大長に自動的に切り捨てられます。
画像や PDF ファイルのサイズ制限は何ですか?
keyboard_arrow_down
ファイルの最大サイズは、画​​像: 5 MB、PDF: 8 MBです。この制限を超えるファイルは拒否され、エラーメッセージが表示されます。

API キーを取得するにはどうすればよいですか?

video_not_supported

レート制限とは何ですか?

レート制限
レート制限は、RPM (1 分あたりのリクエスト数) と TPM (1 分あたりの単語数) の 3 つの方法で追跡されます。制限は IP/API キーごとに適用され、RPM または TPM のしきい値に最初に達したときにトリガーされます。リクエスト ヘッダーに API キーを指定すると、IP アドレスではなくキーによってレート制限が追跡されます。
製品APIポート説明するarrow_upwardAPIキーがありませんkey_off無料のAPIキーkey有料APIキーを使用するkeyプレミアムAPIキー付属key平均遅延単語の使用数リクエストの種類
リーダーAPIhttps://r.jina.aiURLをモデルに適した大きなテキストに変換する20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s出力応答内のトークンの数に基づきます。GET/POST
リーダーAPIhttps://s.jina.aiウェブを検索し、結果をモデルに適した大きなテキストに変換しますblock100 RPM100 RPMtrending_up1000 RPM2.5s各リクエストには、10000 トークンから始まる固定数のトークンが必要です。GET/POST
ベクトルモデルAPIhttps://api.jina.ai/v1/embeddingsテキスト/画像を固定長ベクトルに変換するblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
入力サイズに依存
help
入力リクエスト内のトークンの数に基づきます。POST
リオーダラー APIhttps://api.jina.ai/v1/rerankクエリによるドキュメントの絞り込みblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
入力サイズに依存
help
入力リクエスト内のトークンの数に基づきます。POST
分類子 APIhttps://api.jina.ai/v1/trainトレーニング サンプルを使用して分類器をトレーニングするblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
入力サイズに依存
単語数は、入力単語×反復回数で表されます。POST
分類子 API (ゼロサンプル)https://api.jina.ai/v1/classifyゼロショット分類を使用して入力を分類するblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
入力サイズに依存
単語数は、入力単語とタグ単語の合計です。POST
分類子 API (小さなサンプル)https://api.jina.ai/v1/classifyトレーニングされた少数ショット分類器を使用して入力を分類するblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
入力サイズに依存
トークン数: 入力トークンPOST
セグメンタ APIhttps://api.jina.ai/v1/segment長いテキストを単語や文に分割する20 RPM200 RPM200 RPM1,000 RPM0.3sトークンの使用量はカウントされません。GET/POST
ディープサーチhttps://deepsearch.jina.ai/v1/chat/completions推論し、検索し、繰り返して最善の答えを見つけるblock50 RPM50 RPM500 RPM56.7sプロセス全体のトークンの総数をカウントします。POST

商用ライセンスは必要ですか?

CC BY-NC ライセンスのセルフチェック

play_arrow
Azure、AWS、または GCP で当社の公式 API または公式イメージを使用していますか?
play_arrow
はい
制限はありません。当社のウェブサイトまたはクラウドマーケットプレイスからご登録とお支払いいただくだけです。
play_arrow
いいえ
play_arrow
あなたは Elastic の有料顧客ですか?
play_arrow
はい
Elasticライセンスには既に商用利用が含まれている場合があります。ご質問がございましたら、Elasticの営業担当者までお問い合わせください。
営業担当者に問い合わせる
play_arrow
いいえ
現在、個別の商用ライセンス契約を発行することはできません。詳細については、Elasticの営業担当までお問い合わせください。
営業担当者に問い合わせる
API関連のFAQ
code
Reader、Embedding、Reranker、Classifier、Fine-Tuned Model API に同じ API キーを使用できますか?
keyboard_arrow_down
はい、同じ API キーが Jina AI のすべての検索ベース製品で機能します。これには、Reader、Embedding、Reranger、Classifier、Fine-Tune Model API が含まれており、すべてのサービス間でトークンが共有されます。
code
API キーのトークンの使用状況を表示できますか?
keyboard_arrow_down
はい、[キーと請求] タブに API キーを入力すると、最近のトークン使用量と残りのトークン残高を表示できます。 API キー コントロール パネルにサインインしている場合は、[API キーの管理] タブでこれらの詳細を表示することもできます。
code
API キーを忘れた場合はどうすればよいですか?
keyboard_arrow_down
リチャージ キーを紛失し、再取得したい場合は、登録した電子メールを使用してサポート AT jina.ai までご連絡ください。安全に保管し、API キーに簡単にアクセスできるように、ログインすることをお勧めします。
お問い合わせ
code
API キーには有効期限がありますか?
keyboard_arrow_down
いいえ、API キーには有効期限がありません。ただし、キーが侵害された疑いがあり、キーを非アクティブ化したい場合は、弊社のサポート チームにご連絡ください。 API キー コントロール パネルでキーを自己破壊することもできます。
お問い合わせ
code
API キー間でトークン残高を転送できますか?
keyboard_arrow_down
はい、残りの有料トークン残高をあるプレミアム キーから別のプレミアム キーに移すことができます。 API キー コントロール パネルでアカウントにログインした後、キー転送の設定インターフェースに移動します。残りのすべての支払い済みトークン残高。
code
API キーを破棄してもいいですか?
keyboard_arrow_down
はい、API キーが侵害されたと思われる場合は、破棄できます。キーを破棄すると、そのキーを保存しているすべてのユーザーに対してキーが即座に無効になり、残りのトークン残高と関連資産はすべて永久に利用できなくなります。プレミアム キーをお持ちの場合は、それを書き込む前に、残りの支払い済みトークンの残高を別のキーに転送することを選択できます。この操作は元に戻すことができないことに注意してください。キーを破棄するには、API キー ダッシュボードのキー設定に移動します。
code
一部のモデルの初回リクエストに時間がかかるのはなぜですか?
keyboard_arrow_down
これは、使用率が低い場合、サーバーレス アーキテクチャが特定のモデルをオフロードするためです。最初のリクエストではモデルがアクティブ化または「ウォームアップ」されますが、これには数秒かかる場合があります。最初のアクティベーションの後、後続のリクエストははるかに高速に処理されます。
code
私の API データはモデルのトレーニングに使用されましたか?
keyboard_arrow_down
いいえ。埋め込みモデル、並べ替えモデル、その他のモデルの学習に、お客様のAPIリクエスト、入力、出力を使用することは一切ありません。お客様のデータは常にお客様の所有物です。当社はSOC 2 Type IおよびType II基準に準拠しています。
code
Jina API のレート制限は何ですか?
keyboard_arrow_down
各APIキーにはレート制限があります。

無料版: 100 RPM、100K TPM、同時リクエスト数2
有料版: 500 RPM、2M TPM、同時リクエスト数50
プレミアム版: 5,000 RPM、50M TPM、同時リクエスト数500

さらに、IPアドレスに基づくレート制限(60秒あたり10,000リクエスト)があります。これらの制限は、すべてのJina API(埋め込みAPI、並べ替えAPI、リーダーAPIなど)に適用されます。
code
API にはバッチ サイズの制限がありますか?
keyboard_arrow_down
Embeddings APIとReranker APIには**バッチサイズ制限**はありません。必要に応じて、リクエストごとに任意の数のアイテムまたはドキュメントを送信できます。どちらのAPIも、GPUを最適に利用するために、トークン数に基づいて入力を内部的にバッチ処理します。
請求に関するよくある質問
attach_money
API の料金は文の数またはリクエストの数に基づいて課金されますか?
keyboard_arrow_down
当社の価格モデルは処理されるトークンの総数に基づいており、ユーザーはこれらのトークンを任意の数の文に柔軟に割り当てることができ、さまざまなテキスト分析ニーズに費用対効果の高いソリューションを提供します。
attach_money
新規ユーザーは無料トライアルを利用できますか?
keyboard_arrow_down
新規ユーザーには無料トライアルを提供しており、これには自動生成された API キーを介して引き換えられる、当社のどのモデルでも使用できる 1,000 万トークンが含まれています。無料トークンを使い切ったら、ユーザーは「トークンを購入」タブから API キーで使用するための追加トークンを簡単に購入できます。
attach_money
失敗したリクエストに対してトークンは差し引かれますか?
keyboard_arrow_down
いいえ、失敗したリクエストに対してトークンは差し引かれません。
attach_money
どのような支払い方法が利用できますか?
keyboard_arrow_down
支払いは Stripe を通じて処理され、クレジット カード、Google Pay、PayPal などの複数の支払い方法がサポートされているため、便利です。
attach_money
Ci Yuanを購入した後に請求書を発行できますか?
keyboard_arrow_down
はい、トークンを購入すると、Stripe アカウントに関連付けられた電子メール アドレスに請求書が送信されます。
オフィス
location_on
カリフォルニア州サニーベール
710 Lakeway Dr, Ste 200, サニーベール, カリフォルニア州 94085, アメリカ合衆国
location_on
ベルリン、ドイツ
Prinzessinnenstraße 19-20、10969 ベルリン、ドイツ
検索ベース
読者
ベクトルモデル
並べ替え者
Jina APIキーを取得する
レート制限
APIステータス
会社
私たちについて
営業担当者に問い合わせる
ニュース
インターンシッププログラム
Jinaロゴをダウンロード
open_in_new
Elasticロゴをダウンロード
open_in_new
条項
安全性
利用規約
プライバシー
Cookieを管理する
email
エラスティックジナAI © 2020-2026.