ニュース
モデル
製品
keyboard_arrow_down
読者
URL を読み取ったり検索したりすると、大規模なモデルのサポートが向上します。
ベクトルモデル
世界クラスのマルチモーダル、多言語埋め込み。
並べ替え者
検索の関連性を最大化する世界クラスのニューラルレトリーバー。
ディープサーチ
最善の答えが見つかるまで、検索し、読み、推論してください。
もっと
keyboard_arrow_down
分類子
画像とテキストのゼロショットおよび少数ショットの分類。
スライサー
長いテキストをチャンクまたはトークンに分割します。

APIドキュメント
AIプログラミングアシスタントIDEまたは大規模モデル用のコードを自動生成
open_in_new


会社
keyboard_arrow_down
私たちについて
営業担当者に問い合わせる
インターンプログラム
参加しませんか
open_in_new
ロゴをダウンロード
open_in_new
利用規約


ログイン
login

営業担当者に問い合わせる

Jina AI でビジネスを成長させましょう。
calculateエンタープライズ ライセンス コンフィギュレーター

3つの購入方法

API をサブスクライブするか、クラウド プロバイダーを通じて購入するか、組織の商用ライセンスを取得します。
radio_button_unchecked
cloud
3 のクラウド サービス プロバイダーと連携します
あなたの会社は AWS または Azure を使用していますか?次に、当社の検索インフラストラクチャ モデルを社内のこれらのプラットフォームに直接展開して、データの安全性と準拠性を維持します。
AWS SageMaker
ベクトルモデル
並べ替え者
Microsoft Azure
ベクトルモデル
並べ替え者
Google Cloud
ベクトルモデル
並べ替え者
radio_button_checked
Jinaを使用した検索ベースAPI
すべての製品にアクセスする最も簡単な方法。いつでもトークンをリチャージできます。
この API キーにさらにトークンを追加します
お住まいの地域によっては、米ドル、ユーロ、またはその他の通貨で請求される場合があります。税金が適用される場合があります。
リチャージするには正しい API キーを入力してください
レート制限について学ぶ
レート制限とは、1 分間に IP アドレス/API キー (RPM) ごとに API に対して実行できるリクエストの最大数です。各製品およびティアのレート制限の詳細については、以下をご覧ください。
keyboard_arrow_down
レート制限
レート制限は、RPM (1 分あたりのリクエスト数) と TPM (1 分あたりの単語数) の 3 つの方法で追跡されます。制限は IP/API キーごとに適用され、RPM または TPM のしきい値に最初に達したときにトリガーされます。リクエスト ヘッダーに API キーを指定すると、IP アドレスではなくキーによってレート制限が追跡されます。
製品APIポート説明するarrow_upwardAPIキーがありませんkey_offAPIキーを使用するkeyプレミアムAPIキー付属key平均遅延単語の使用数リクエストの種類
リーダーAPIhttps://r.jina.aiURLをモデルに適した大きなテキストに変換する20 RPM500 RPMtrending_up5000 RPM7.9s出力応答内のトークンの数に基づきます。GET/POST
リーダーAPIhttps://s.jina.aiウェブを検索し、結果をモデルに適した大きなテキストに変換しますblock100 RPMtrending_up1000 RPM2.5s各リクエストには、10000 トークンから始まる固定数のトークンが必要です。GET/POST
ディープサーチhttps://deepsearch.jina.ai/v1/chat/completions推論し、検索し、繰り返して最善の答えを見つけるblock50 RPM500 RPM56.7sプロセス全体のトークンの総数をカウントします。POST
ベクトルモデルAPIhttps://api.jina.ai/v1/embeddingsテキスト/画像を固定長ベクトルに変換するblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
入力サイズに依存
help
入力リクエスト内のトークンの数に基づきます。POST
リオーダラー APIhttps://api.jina.ai/v1/rerankクエリによるドキュメントの絞り込みblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
入力サイズに依存
help
入力リクエスト内のトークンの数に基づきます。POST
分類子 APIhttps://api.jina.ai/v1/trainトレーニング サンプルを使用して分類器をトレーニングするblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
入力サイズに依存
単語数は、入力単語×反復回数で表されます。POST
分類子 API (ゼロサンプル)https://api.jina.ai/v1/classifyゼロショット分類を使用して入力を分類するblock200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
入力サイズに依存
単語数は、入力単語とタグ単語の合計です。POST
分類子 API (小さなサンプル)https://api.jina.ai/v1/classifyトレーニングされた少数ショット分類器を使用して入力を分類するblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
入力サイズに依存
トークン数: 入力トークンPOST
セグメンタ APIhttps://api.jina.ai/v1/segment長いテキストを単語や文に分割する20 RPM200 RPM1,000 RPM0.3sトークンの使用量はカウントされません。GET/POST
radio_button_unchecked
encrypted
ローカルで使用するための商用ライセンスを持っている
現場で当社のモデルを使用するには、商用ライセンスを購入してください。

よくある質問

API キーを取得するにはどうすればよいですか?

video_not_supported

レート制限とは何ですか?

レート制限
レート制限は、RPM (1 分あたりのリクエスト数) と TPM (1 分あたりの単語数) の 3 つの方法で追跡されます。制限は IP/API キーごとに適用され、RPM または TPM のしきい値に最初に達したときにトリガーされます。リクエスト ヘッダーに API キーを指定すると、IP アドレスではなくキーによってレート制限が追跡されます。
製品APIポート説明するarrow_upwardAPIキーがありませんkey_offAPIキーを使用するkeyプレミアムAPIキー付属key平均遅延単語の使用数リクエストの種類
リーダーAPIhttps://r.jina.aiURLをモデルに適した大きなテキストに変換する20 RPM500 RPMtrending_up5000 RPM7.9s出力応答内のトークンの数に基づきます。GET/POST
リーダーAPIhttps://s.jina.aiウェブを検索し、結果をモデルに適した大きなテキストに変換しますblock100 RPMtrending_up1000 RPM2.5s各リクエストには、10000 トークンから始まる固定数のトークンが必要です。GET/POST
ディープサーチhttps://deepsearch.jina.ai/v1/chat/completions推論し、検索し、繰り返して最善の答えを見つけるblock50 RPM500 RPM56.7sプロセス全体のトークンの総数をカウントします。POST
ベクトルモデルAPIhttps://api.jina.ai/v1/embeddingsテキスト/画像を固定長ベクトルに変換するblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
入力サイズに依存
help
入力リクエスト内のトークンの数に基づきます。POST
リオーダラー APIhttps://api.jina.ai/v1/rerankクエリによるドキュメントの絞り込みblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
入力サイズに依存
help
入力リクエスト内のトークンの数に基づきます。POST
分類子 APIhttps://api.jina.ai/v1/trainトレーニング サンプルを使用して分類器をトレーニングするblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
入力サイズに依存
単語数は、入力単語×反復回数で表されます。POST
分類子 API (ゼロサンプル)https://api.jina.ai/v1/classifyゼロショット分類を使用して入力を分類するblock200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
入力サイズに依存
単語数は、入力単語とタグ単語の合計です。POST
分類子 API (小さなサンプル)https://api.jina.ai/v1/classifyトレーニングされた少数ショット分類器を使用して入力を分類するblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
入力サイズに依存
トークン数: 入力トークンPOST
セグメンタ APIhttps://api.jina.ai/v1/segment長いテキストを単語や文に分割する20 RPM200 RPM1,000 RPM0.3sトークンの使用量はカウントされません。GET/POST

商用ライセンスは必要ですか?

CC BY-NC ライセンスのセルフチェック

play_arrow
Azure または AWS で公式 API または公式ミラーを使用していますか?
play_arrow
done
はい
play_arrow
有料の API キーを使用していますか? それとも無料の試用版キーを使用していますか?
play_arrow
done
有料APIキー
制限はありません。現在の規約に従ってご利用ください。
play_arrow
info
無料のAPIキー
無料トライアル キーは、非営利目的でのみ使用できます。商用利用の場合は、有料パッケージをご購入ください。
play_arrow
AWS と Azure で公式モデルを使用していますか?
制限はありません。現在の規約に従ってご利用ください。
play_arrow
close
いいえ
play_arrow
これらのモデルを使用していますか?
jina-reranker-m0
jina-clip-v2
jina-embeddings-v3
jina-reranker-v2-base-multilingual
jina-colbert-v2
reader-lm-1.5b
reader-lm-0.5b
ReaderLM-v2
play_arrow
close
いいえ
制限はありません。
play_arrow
done
はい
play_arrow
あなたの使用は商用ですか?
play_arrow
question_mark
わからない
play_arrow
あなたは誰ですか:
play_arrow
個人的なプロジェクトや趣味のプロジェクトに使用しますか?
このモデルは非商用ですのでご自由にお使いいただけます。
play_arrow
営利企業は社内でそれを使用していますか?
これは商業的な性質のものです。当社の営業チームにお問い合わせください。
営業担当者に問い合わせる
play_arrow
教育機関は教育に使用していますか?
これは通常、非営利的なものです。これらのモデルは自由に使用できます。
play_arrow
非営利団体や NGO はあなたの使命を果たすためにそれを使用していますか?
通常、これは非営利ですが、不明な場合はご連絡ください。
営業担当者に問い合わせる
play_arrow
販売する製品やサービスに使用しますか?
これは商業的な性質のものです。当社の営業チームにお問い合わせください。
営業担当者に問い合わせる
play_arrow
政府機関が公共サービスを提供するために使用していますか?
これは商用利用が可能です。ご不明な点がございましたら、お問い合わせください。
営業担当者に問い合わせる
play_arrow
close
いいえ
これらのモデルは自由に使用できます。
play_arrow
done
はい
ライセンスについては、弊社の営業チームにお問い合わせください。
営業担当者に問い合わせる

その他の質問

ディープサーチに関するよくある質問
ディープサーチとは何ですか?
keyboard_arrow_down
Deep Search は、クエリに対する正確な回答が見つかるか、トークン予算の制限に達するまで、反復的な検索、読み取り、推論を実行する大規模なモデル API です。
Deep Search は、OpenAI や Gemini のディープ リサーチ機能とどう違うのでしょうか?
keyboard_arrow_down
OpenAI や Gemini とは異なり、DeepSearch は長い記事を生成するのではなく、反復を通じて正確な回答を提供することに重点を置いています。これは、包括的なレポートを作成するためではなく、ディープ ウェブ検索に対する高速で正確な回答を得るために最適化されています。
DeepResearch を使用するにはどのような API キーが必要ですか?
keyboard_arrow_down
Jina API キーが必要です。新しい API キーには 1,000 万個の無料トークンを提供します。
ディープサーチがトークン予算に達すると何が起こりますか?不完全な回答が返されますか?
keyboard_arrow_down
単に諦めたり不完全な答えを返すのではなく、蓄積されたすべての知識に基づいて最終的な答えを生成します。
ディープサーチは回答の正確性を保証できますか?
keyboard_arrow_down
いいえ。精度を向上させるために反復検索プロセスを使用していますが、評価ではテスト問題の合格率が 75% に達しており、0% のベースライン (gemini-2.0-flash) より大幅に向上していますが、完璧ではありません。
典型的なディープ検索クエリにはどれくらいの時間がかかりますか?
keyboard_arrow_down
評価データによると、クエリには 1 ~ 42 ステップかかることがあり、平均は 4 ステップです。それは20秒です。単純なクエリはすぐに解決できますが、複雑な調査の質問には複数の反復が必要になり、最大 120 秒かかる場合があります。
Deep Search は、Chatwise、CherryStudio、ChatBox などの OpenAI 互換クライアントで動作しますか?
keyboard_arrow_down
はい、deepsearch.jina.ai/v1/chat/completions にある公式の Deep Search API は、モデル名として「jina-deepsearch-v1」を使用して、OpenAI API アーキテクチャと完全に互換性があります。したがって、OpenAI から Deep Search に切り替えて、ローカル クライアントまたは任意の OpenAI 互換クライアントで使用するのは非常に簡単です。シームレスな体験のために Chatwise を強くお勧めします。
API のレート制限は何ですか?
keyboard_arrow_down
レート制限は API キー層によって異なり、10 RPM から 30 RPM の範囲になります。これはクエリを多用するアプリケーションにとって重要です。
<think> タグ内には何がありますか?
keyboard_arrow_down
ディープ サーチは、思考ステップを XML タグ ... で囲み、OpenAI フロー形式に従いながら、思考の連鎖を表すためにこれらの特別なタグを使用して最終的な答えを提供します。
Deep Search は Web 検索と閲覧に Jina Reader を使用していますか?
keyboard_arrow_down
はい。 Jina Reader は Web ページの検索と読み取りに使用され、システムに Web ページのコンテンツに効率的にアクセスして処理する機能を提供します。
ディープサーチではクエリになぜこれほど多くのタグが使用されるのでしょうか?
keyboard_arrow_down
はい、複雑なクエリにおける Deep Search のトークン使用量は、おそらく高く、基本的な大規模モデル応答の 500 トークンと比較して、平均 70,000 トークンです。これは研究の深さを示していますが、コストにも影響します。
ステップ数を制御または制限する方法はありますか?
keyboard_arrow_down
このシステムは、ステップ数ではなく、主に単語予算によって制御されます。単語単位の予算を超えると、システムはビースト モードに入り、最終的な回答を生成します。詳細については、reasoning_effort を参照してください。
回答内の参照はどの程度信頼できるのでしょうか?
keyboard_arrow_down
参照は非常に重要であり、回答が明確であるにもかかわらず参照がない場合、システムは回答を受け入れずに検索を続行します。
ディープサーチは将来のイベントに関する質問を処理できますか?
keyboard_arrow_down
はい、しかし多くの調査が必要です。 「2028 年に大統領になるのは誰か」という例は、そのような予測の正確さは保証できないものの、複数の研究の反復を通じて推測的な質問に対処することが可能であることを示しています。
リーダーに関するよくある質問
Reader API の使用に関連するコストはいくらですか?
keyboard_arrow_down
Reader API は無料であり、API キーは必要ありません。 URL の前に「https://r.jina.ai/」を追加するだけです。
Reader API はどのように機能しますか?
keyboard_arrow_down
Reader API は、プロキシを使用して URL を取得し、そのコンテンツをブラウザーでレンダリングして、高品質のプライマリ コンテンツを抽出します。
リーダー API はオープンソースですか?
keyboard_arrow_down
はい、リーダー API はオープンソースであり、Jina AI GitHub リポジトリにあります。
Reader API の一般的なレイテンシはどれくらいですか?
keyboard_arrow_down
Reader API は通常、URL を処理して 2 秒以内にコンテンツを返しますが、複雑なページや動的なページの場合はさらに時間がかかる場合があります。
自分でページをスクレイピングする代わりに Reader API を使用する必要があるのはなぜですか?
keyboard_arrow_down
特に複雑なページや動的なページの場合、スクレイピングは複雑で信頼性が低くなる可能性があります。リーダー API は、簡潔で信頼性が高く、簡潔な、クリーンで大規模なモデル レベルのテキスト出力を提供します。
Reader API は複数の言語をサポートしていますか?
keyboard_arrow_down
Reader API は、URL のコンテンツを元の言語で返します。翻訳サービスは提供しておりません。
Web サイトが Reader API をブロックした場合はどうすればよいですか?
keyboard_arrow_down
ブロックの問題が発生した場合は、サポート チームに問い合わせて解決策を求めてください。
Reader API は PDF ファイルからコンテンツを抽出できますか?
keyboard_arrow_down
Reader API は主に Web ページを対象としており、arXiv などのサイトで HTML で表示される PDF からコンテンツを抽出できますが、一般的な PDF 抽出には最適化されていません。
Reader API は Web ページのメディア コンテンツを処理できますか?
keyboard_arrow_down
現在、リーダー API はメディア コンテンツを処理しませんが、将来的には画像のキャプションやビデオの概要などの機能強化が行われる予定です。
ローカル HTML ファイルで Reader API を使用することはできますか?
keyboard_arrow_down
いいえ、Reader API は、公的にアクセス可能な URL からのコンテンツのみを処理できます。
Reader API はコンテンツをキャッシュしますか?
keyboard_arrow_down
5 分以内に同じ URL をリクエストすると、Reader API はキャッシュされたコンテンツを返します。
ログイン後に Reader API を使用してコンテンツにアクセスできますか?
keyboard_arrow_down
残念だけど違う。
Reader API を使用して arXiv 上の PDF にアクセスできますか?
keyboard_arrow_down
はい、リーダーでネイティブ PDF サポート (https://r.jina.ai/https://arxiv.org/pdf/2310.19923v4) を使用するか、arXiv で HTML バージョン (https:// r. jina.ai/https://arxiv.org/html/2310.19923v4)
画像の注釈はリーダーでどのように機能しますか?
keyboard_arrow_down
リーダーは指定された URL にあるすべての画像にキャプションを追加し、最初に何もなかった場合は `Image [idx]: [caption]` を alt タグとして追加します。これにより、大規模な下流モデルが推論や要約などのために画像と対話できるようになります。
リーダーの拡張性はどの程度ですか?これを本番環境で使用できますか?
keyboard_arrow_down
Reader API は、高度に拡張できるように設計されています。リアルタイムのトラフィックに基づいて自動的に拡張され、同時リクエストの最大数は約 4,000 になりました。当社は、Jina AI のコア製品の 1 つとして積極的に維持しています。したがって、本番環境で自由に使用してください。
Reader API のレート制限は何ですか?
keyboard_arrow_down
最新のレート制限情報は以下の表で確認してください。私たちは Reader API のレート制限とパフォーマンスの改善に積極的に取り組んでおり、それに応じてこの表も更新されることに注意してください。
speedレート制限
Reader-LMとは何ですか?使い方は?
keyboard_arrow_down
Reader-LM は、オープン Web からデータを抽出してクリーニングするために設計された新しい小型言語モデル (SLM) です。 Jina Reader からインスピレーションを得て、生のノイズの多い HTML をクリーンなマークダウンに変換します。費用対効果と小型モデルサイズに重点を置いた Reader-LM は、実用的かつ強力です。現在、AWS、Azure、GCP マーケットプレイスで入手できます。特定の要件がある場合は、セールス AT jina.ai までお問い合わせください。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
リランカーに関するよくある質問
Reranker API の料金はいくらですか?
keyboard_arrow_down
Reranker API の価格は、Embedding API の価格体系と一致しています。新しい API キーごとに 1,000 万個の無料トークンが付属します。無料トークンに加えて、さまざまなパッケージを購入することもできます。詳細については、料金セクションをご覧ください。
これら 2 つの再配置ツールの違いは何ですか?
keyboard_arrow_down
jina-reranker-v2-base-multilingual は、bge-reranker-v2-m3 よりも優れたパフォーマンスと、jina よりも優れたスループットを備え、多言語サポートで優れたパフォーマンスを発揮します。 - reranker-v1-base-en は 15 倍高速です。また、エージェントのタスクとコードの取得もサポートします。 jina-colbert-v2 は ColBERTv2 を改良し、検索パフォーマンスを 6.5% 向上させ、89 言語の多言語サポートを追加しました。最適な効率と精度を実現するために、ユーザー制御のベクトル サイズを備えています。
Jina Rerankers はオープンソースですか?
keyboard_arrow_down
はい、jina-reranker-v2-base-multilingual と jina-colbert-v2 は両方とも CC-BY-NC 4.0 ライセンスの下でオープン ソースです。これらのモデルは、非営利目的で自由に使用、共有、改変することができます。
リシーケンサは複数の言語をサポートしていますか?
keyboard_arrow_down
はい、jina-reranker-v2-base-multilingual と jina-colbert-v2 は両方とも、英語、中国語、その他の主要な世界言語を含む 100 以上の言語をサポートしています。これらは多言語タスク用に最適化されており、以前のモデルよりも優れたパフォーマンスを発揮します。
クエリとドキュメントの最大長はどれくらいですか?
keyboard_arrow_down
クエリ トークンの最大長は 512 です。ドキュメントにはトークンの制限はありません。
クエリごとに並べ替えできるドキュメントの最大数はいくつですか?
keyboard_arrow_down
各クエリでは、最大 2048 個のドキュメントを並べ替えることができます。
バッチ サイズはどれくらいですか? 1 つのリクエストで送信できるクエリ ドキュメント タプルの数はどれくらいですか?
keyboard_arrow_down
ベクター モデル API とは異なり、バッチ サイズの概念はありません。リクエストごとに送信できるクエリ ドキュメント タプルは 1 つだけですが、タプルには最大 2048 個の候補ドキュメントを含めることができます。
100 個のドキュメントをリフローする場合に予想される待ち時間はどれくらいですか?
keyboard_arrow_down
待ち時間は、ドキュメントとクエリの長​​さに応じて、100 ミリ秒から 7 秒の範囲です。たとえば、64 語のクエリを使用して 256 個のトークンを持つ 100 個のドキュメントを並べ替えるには、約 150 ミリ秒かかります。ドキュメントの長さを 4096 トークンに増やすと、時間は 3.5 秒に増加します。クエリの長​​さが 512 トークンに増加すると、時間はさらに 7 秒に増加します。
クエリと 100 個のドキュメントを並べ替えるのにかかる時間コスト (ミリ秒) は次のとおりです。
各ドキュメント内のトークンの数
クエリ内のトークンの数256512102420484096
64156323136621073571
128194369137721233598
256273475139721554299
5124681385211435367068
サービスを AWS、Azure、または GCP にプライベートにデプロイできますか?
keyboard_arrow_down
はい、当社のサービスは AWS、Azure、GCP マーケットプレイスで利用できます。特定の要件がある場合は、セールス AT jina.ai までお問い合わせください。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
ドメイン固有のデータに対して微調整された再配列ツールを提供していますか?
keyboard_arrow_down
特定のドメインデータに合わせて調整されたリフォーマーに興味がある場合は、当社の営業チームまでお問い合わせください。弊社チームがお客様のお問い合わせに迅速に対応させていただきます。
お問い合わせ
ドキュメントの最小画像サイズはどれくらいですか?
keyboard_arrow_down
jina-reranker-m0 モデルで受け入れられる最小画像サイズは 28x28 ピクセルです。
ベクトル モデルに関するよくある質問
jina-embeddings-v3 モデルはどのようにトレーニングされますか?
keyboard_arrow_down
トレーニング プロセス、データ ソース、評価の詳細については、arXiv で入手可能な技術レポートを参照してください。
launcharXiv
jina-clipモデルとは何ですか?テキスト検索や画像検索にも使えますか?
keyboard_arrow_down
Jina CLIP jina-clip-v2 は、テキスト-テキスト、テキスト-画像、画像-画像、画像-テキストの検索タスクをサポートする高度なマルチモーダル ベクトル モデルです。テキスト間の検索のパフォーマンスが低かったオリジナルの OpenAI CLIP とは異なり、Jina CLIP はテキスト検索に優れています。 jina-clip-v2 は、テキスト-画像およびテキスト-テキスト検索タスクにおいて jina-clip-v1 よりもパフォーマンスが 3% 向上し、多言語画像検索用に 89 の言語をサポートし、より高解像度の画像 (512x512) を処理し、マトリョーシカ表現によってストレージ要件を削減します。詳細については、弊社の技術レポートをご覧ください。
launcharXiv
あなたのモデルはどの言語をサポートしていますか?
keyboard_arrow_down
2024 年 9 月 18 日のリリースの時点で、jina-embeddings-v3 は最高の多言語モデルであり、パラメータ数が 10 億未満のモデルの MTEB 英語リーダーボードで 2 位にランクされています。 v3 は、パフォーマンス上位 30 言語を含む合計 89 言語をサポートしています: アラビア語、ベンガル語、中国語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、グルジア語、ドイツ語、ギリシャ語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、ラトビア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スロバキア語、スペイン語、スウェーデン語、タイ語、トルコ語、ウクライナ語、ウルドゥー語、ベトナム語。詳細については、jina-embeddings-v3 テクニカル レポートを参照してください。
launcharXiv
単一の文入力の最大長はどれくらいですか?
keyboard_arrow_down
私たちのモデルでは、最大 8192 トークンまでの入力長が許可されており、これは他のほとんどのモデルよりもはるかに長くなります。トークンの範囲は、単一の文字 (「a」など) から単語全体 (「apple」など) までです。入力できる合計文字数は、使用される単語の長さと複雑さによって異なります。この拡張された入力機能により、jina-embeddings-v3 モデルと jina-clip モデルは、特に大量の場合に、より包括的なテキスト分析を実行し、より高いレベルのコンテキスト理解を達成できるようになります。テキストデータのこと。
1 つのリクエストには何文を含めることができますか?
keyboard_arrow_down
API 呼び出しは最大 2048 文またはテキストを処理できるため、1 回のリクエストで広範なテキスト分析が容易になります。
jina-clip モデルに画像を送信するにはどうすればいいですか?
keyboard_arrow_down
API リクエストの input フィールドでは、url または bytes のいずれかを使用できます。 url には、処理する画像の URL を指定します。 bytes の場合、画像を base64 形式でエンコードし、リクエストに含めます。モデルは結果として画像のベクトルを返します。
Jina Embeddings モデルは、OpenAI や Cohere の最新のベクトル モデルとどのように比較されますか?
keyboard_arrow_down
MTEB 英語、多言語、および LongEmbed ベンチマークの評価では、jina-embeddings-v3 は英語タスクで OpenAI と Cohere の最新独自ベクトル モデルを上回り、すべての多言語で OpenAI と Cohere の最新独自ベクトル モデルを上回りました。 multilingual-e5-large-instruct を超えたタスク。 Matryoshka Representation Learning (MRL) の統合により、デフォルトの出力次元は 1024 ですが、ユーザーはパフォーマンスに影響を与えることなくベクトル次元を 32 に切り捨てることができます。
OpenAI の text-embedding-3-large から Jina Embeddings モデルに移行するにはどうすればよいですか?
keyboard_arrow_down
API エンドポイントは OpenAI の text-embeddings と互換性があるため、移行プロセスはスムーズでした。 -3-large モデルの入力 JSON スキーマと出力 JSON スキーマが一致します。この互換性により、ユーザーは OpenAI エンドポイントを使用するときに、OpenAI モデルを当社のモデルに簡単に置き換えることができます。
jina-clipモデルを使用する場合のトークンの計算方法は?
keyboard_arrow_down
トークンは、テキストの長さと画像のサイズに基づいて計算されます。トークンは、リクエスト内のテキストに対して標準的な方法で計算されます。画像の場合は、次の手順に従います。 1. タイルサイズ: 各画像はタイルに分割されます。 jina-clip-v2 の場合、タイルは 512x512 ピクセルですが、jina-clip-v1 の場合、タイルは 224x224 ピクセルです。 2. カバレッジ: 入力画像をカバーするのに必要なタイルの数を計算します。画像のサイズがタイルのサイズで正確に割り切れない場合でも、部分的なタイルは完全なタイルとして扱われます。 3. タイルの総数: 画像を覆うタイルの総数によってコストが決まります。たとえば、600 x 600 ピクセルの画像は、v2 では 2 x 2 タイル (4 タイル) で覆われ、v1 では 3 x 3 タイル (9 タイル) で覆われます。 4. コスト計算: jina-clip-v2 の場合、タイルあたりのコストは 4000 トークンですが、jina-clip-v1 の場合、タイルあたりのコストは 1000 トークンです。 例: サイズが 600 x 600 ピクセルの画像の場合: • jina-clip-v2 を使用する • 画像は 512 x 512 ピクセルのタイルに分割されます。 • 必要なタイルの合計数は、2 (水平) x 2 (垂直) = 4 タイルです。 • jina-clip-v2 のコストは 4*4000 = 16000 トークンです。 • jina-clip-v1 を使用する • 画像は 224 x 224 ピクセルのタイルに分割されます。 • 必要なタイルの合計数は、3 (水平) x 3 (垂直) = 9 タイルです。 • jina-clip-v1 のコストは 9*1000 = 9000 トークンです。
ベクターモデル画像やオーディオモデルを提供していますか?
keyboard_arrow_down
はい、jina-clip-v2 と jina-clip-v1 は画像とテキストをサポートできます。より多くのモダリティのベクトル モデルが近日中に発表される予定です。
Jina Embedding モデルは個人データまたは企業データを使用して微調整できますか?
keyboard_arrow_down
特定のデータを使用したモデルの微調整についてご質問がある場合は、要件についてお問い合わせください。私たちのモデルをお客様のニーズに合わせてどのように適応できるかを検討したいと考えています。
お問い合わせ
サービスを AWS、Azure、または GCP にプライベートにデプロイできますか?
keyboard_arrow_down
はい、当社のサービスは AWS、Azure、GCP マーケットプレイスで利用できます。特定の要件がある場合は、セールス AT jina.ai までお問い合わせください。
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
分類子に関するよくある質問
ゼロサンプルと小さなサンプルのラベルの違いは何ですか?
keyboard_arrow_down
ゼロショット分類にはセマンティック ラベルが必要ですが、トレーニング中には必要ありません。一方、少数ショット分類には、トレーニング中にラベルが必要ですが、分類中には必要ありません。これは、柔軟で即時の分類ニーズにはゼロショット分類の方が適しているのに対し、時間の経過とともに進化する可能性がある固定のドメイン固有のカテゴリには少数ショット分類の方が適していることを意味します。
num_iters は何に使用されますか?またその使用方法は何ですか?
keyboard_arrow_down
num_iters はトレーニング強度を制御します。値が大きいほど重要な例が強調され、値が小さいほど信頼性の低いデータの影響が最小限に抑えられます。これを使用すると、最近の例をより多くの反復回数で供給することで、時間認識学習を実現でき、進化するデータ パターンにとって価値があります。
パブリック分類子の共有はどのように機能しますか?
keyboard_arrow_down
classifier_id を持つユーザーは誰でもパブリック分類子を使用し、独自のトークン クォータを消費できます。ユーザーはトレーニング データや設定にアクセスしたり、他の人の分類リクエストを表示したりできないため、安全な分類子の共有が可能になります。
小規模なサンプル研究をうまく機能させるにはどのくらいのデータが必要ですか?
keyboard_arrow_down
サンプル数が少ない場合、ゼロショット分類を超えるには 200 ~ 400 のトレーニング サンプルが必要です。最終的にはより高い精度が達成されますが、効果的にするにはこのウォームアップ期間が必要です。 Zero-shot は、トレーニング データを必要とせずに、すぐに安定したパフォーマンスを提供します。
複数の言語やテキスト・画像を扱うことはできますか?
keyboard_arrow_down
はい。API は、jina-embeddings-v3 を使用した多言語クエリと、jina-clip-v1 を使用したマルチモーダル (テキスト/画像) 分類をサポートし、同じリクエストで URL または base64 でエンコードされた画像もサポートします。
注意すべきハード制限は何ですか?
keyboard_arrow_down
ゼロショットは分類子の制限なしで 256 のカテゴリをサポートしますが、フューショットは 16 のカテゴリと 16 の分類子に制限されます。どちらも、リクエストごとに 1,024 個の入力と、入力ごとに 8,192 個のトークンをサポートします。
時間の経過に伴うデータの変化にどのように対処すればよいですか?
keyboard_arrow_down
少数のサンプル パターンにより、変化するデータ パターンに適応するために /train エンドポイントを介した継続的な更新が可能になります。データの分布が変化した場合、分類器全体を再構築することなく、新しい例やカテゴリを段階的に追加できます。
トレーニング データを送信した後はどうなりますか?
keyboard_arrow_down
API はワンショットのオンライン学習を使用します。トレーニング サンプルは分類子の重みを更新しますが、その後は保存されません。つまり、過去のトレーニング データを取得することはできませんが、プライバシーとリソース効率は確保されます。
ゼロサンプルと少量サンプル - いつどちらを使用するか?
keyboard_arrow_down
セマンティック ラベルを使用した柔軟な分類が必要な場合は、即座に結果を得るためにサンプルをゼロから開始します。 200 ~ 400 個のサンプルがある場合、より高い精度が必要な場合、またはドメイン固有のデータや時間に敏感なデータを処理する必要がある場合は、少数のサンプルに切り替えます。
異なる言語/タスクに異なるモデルを使用できますか?
keyboard_arrow_down
はい、テキスト分類 (特に多言語に適しています) には jina-embeddings-v3 を選択し、マルチモーダル分類には jina-clip-v1 を選択できます。新しいモデル (jina-clip-v2 など) は、リリース時に API を通じて自動的に利用可能になります。
セグメンターに関するよくある質問
スライサーの値段はいくらですか?
keyboard_arrow_down
スライサーは無料でご利用いただけます。 API キーを提供すると、より高いレート制限にアクセスでき、キーは請求されません。
API キーを提供しない場合のレート制限は何ですか?
keyboard_arrow_down
API キーを使用しない場合は、20 RPM のレート制限でスライサーにアクセスできます。
API キーを指定した場合、レート制限はどのくらいになりますか?
keyboard_arrow_down
API キーを使用すると、200 RPM のレート制限でスライサーにアクセスできます。プレミアム有料ユーザーの場合、レート制限は 1000 RPM です。
私の API キーからトークンを請求してくれますか?
keyboard_arrow_down
いいえ、API キーはより高いレート制限にアクセスするためにのみ使用されます。
スライサーは複数の言語をサポートしていますか?
keyboard_arrow_down
はい、スライサーは多言語対応で、100 以上の言語をサポートしています。
GET リクエストと POST リクエストの違いは何ですか?
keyboard_arrow_down
GET リクエストはテキスト内のトークンの数をカウントするためにのみ使用されるため、これをカウンターとしてアプリケーションに簡単に統合できます。 POST リクエストは、最初と最後の N 個のトークンを返すなど、より多くのパラメーターと機能をサポートします。
リクエストごとに分割できる単語の最大長はどれくらいですか?
keyboard_arrow_down
リクエストごとに最大 64,000 文字を送信できます。
ダイシング機能はどのように機能しますか?それはセマンティックダイシングですか?
keyboard_arrow_down
タイル機能は、共通の構造上の手がかりに基づいて長い文書を小さなチャンクに分割し、テキストが意味のあるチャンクに正確に分割されるようにします。基本的に、これは、意味上の境界 (文末、段落区切り文字、句読点、および特定の接続詞など) と一般に一致する特定の構文上の特徴に基づいてテキストを分割する (大きな!) 正規表現パターンです。それは意味論的な分割ではありません。この (大きな) 正規表現は、正規表現の制限内で可能な限り強力です。複雑さとパフォーマンスのバランスをとります。正規表現は真の意味の理解を達成することはできませんが、共通の構造上の手がかりを通じてコン​​テキストの適切な近似を提供できます。
スプリッターで「endoftext」のような特別なトークンを処理するにはどうすればよいですか?
keyboard_arrow_down
入力に特別なトークンが含まれている場合、トークナイザーはそれらを「special_tokens」フィールドに格納します。こうすることで、それらを簡単に識別し、下流のタスクに応じて処理することができます。たとえば、インジェクション攻撃を防ぐために、テキストを大規模なモデルに取り込む前にそれらを削除するなどです。
チャンキングは英語以外の言語もサポートしていますか?
keyboard_arrow_down
チャンキング技術は、西洋言語に加えて、中国語、日本語、韓国語でも機能します。
セルフチューニングに関するよくある質問
API の微調整にはどれくらいの費用がかかりますか?
keyboard_arrow_down
この機能は現在ベータ版であり、微調整されたモデルごとに 100 万トークンかかります。 Embedding/Reranker API に十分なトークンがある場合は、既存の API キーを使用することも、1,000 万個の無料トークンを含む新しい API キーを作成することもできます。
何を入力する必要がありますか?トレーニング データを提供する必要がありますか?
keyboard_arrow_down
トレーニング データを提供する必要はありません。ターゲット ドメイン (微調整されたベクトル モデルを最適化するドメイン) を自然言語で記述するか、URL を参照として使用するだけで、システムがモデルをトレーニングするための合成データを生成します。
モデルの微調整にはどのくらい時間がかかりますか?
keyboard_arrow_down
約30分。
微調整されたモデルはどこに保存されますか?
keyboard_arrow_down
微調整されたモデルと合成データは、Hugging Face Model Center に公的に保存されます。
参照 URL を指定した場合、システムはそれをどのように使用しますか?
keyboard_arrow_down
システムは Reader API を使用して URL からコンテンツを取得します。次に、コンテンツを分析してトーンとドメインを要約し、合成データを生成するためのガイドラインとして使用しました。したがって、URL はパブリックにアクセス可能であり、ターゲット ドメインを表す必要があります。
特定の言語に合わせてモデルを微調整できますか?
keyboard_arrow_down
はい、英語以外の言語向けにモデルを微調整できます。システムはドメイン命令の言語を自動的に検出し、それに応じて合成データを生成します。また、ターゲット言語に適切な基本モデルを選択することをお勧めします。たとえば、ドイツ語ドメインをターゲットとする場合は、「jina-embeddings-v2-base-de」をベース モデルとして選択する必要があります。
bge-M3 など、Jina 以外のベクトル モデルを微調整できますか?
keyboard_arrow_down
いいえ、微調整 API は Jina v2 モデルのみをサポートしています。
微調整されたモデルの品質を保証するにはどうすればよいですか?
keyboard_arrow_down
微調整プロセスの最後に、保持されたテスト セットを使用してモデルが評価され、パフォーマンス メトリックが報告されます。このテスト セットの前後のパフォーマンスの詳細を記載した電子メールが届きます。また、品質を保証するために、独自のテスト セットでモデルを評価することをお勧めします。
合成データを生成するにはどうすればよいですか?
keyboard_arrow_down
システムは、ユーザーが提供するターゲット ドメインの指示と大規模なモデル エージェントからの推論を組み合わせて、合成データを生成します。高品質のベクトルベースのモデルをトレーニングするために不可欠な、難しいトリプレットを生成します。詳細については、Arxiv で公開予定の研究論文をご覧ください。
微調整されたモデルと合成データを非公開にしておくことができますか?
keyboard_arrow_down
今は何もありません。この機能はまだベータ版であることに注意してください。微調整されたモデルと合成データを Hugging Face Model Center に公開して保存することは、私たちとコミュニティがトレーニングの品質を評価するのに役立ちます。将来的には、プライベート ストレージ オプションも提供する予定です。
微調整モデルの使用方法は?
keyboard_arrow_down
すべての微調整されたモデルはすでに Hugging Face にアップロードされているため、SentenceTransformers を通じてモデル名を指定するだけでモデルにアクセスできます。
査定結果のメールが届きません。私は何をしますか?
keyboard_arrow_down
スパムフォルダを確認してください。それでも見つからない場合は、指定した電子メール アドレスを使用してサポート チームにお問い合わせください。
お問い合わせ
API関連のFAQ
code
Reader、Embedding、Reranker、Classifier、Fine-Tuned Model API に同じ API キーを使用できますか?
keyboard_arrow_down
はい、同じ API キーが Jina AI のすべての検索ベース製品で機能します。これには、Reader、Embedding、Reranger、Classifier、Fine-Tune Model API が含まれており、すべてのサービス間でトークンが共有されます。
code
API キーのトークンの使用状況を表示できますか?
keyboard_arrow_down
はい、[キーと請求] タブに API キーを入力すると、最近のトークン使用量と残りのトークン残高を表示できます。 API キー コントロール パネルにサインインしている場合は、[API キーの管理] タブでこれらの詳細を表示することもできます。
code
API キーを忘れた場合はどうすればよいですか?
keyboard_arrow_down
リチャージ キーを紛失し、再取得したい場合は、登録した電子メールを使用してサポート AT jina.ai までご連絡ください。安全に保管し、API キーに簡単にアクセスできるように、ログインすることをお勧めします。
お問い合わせ
code
API キーには有効期限がありますか?
keyboard_arrow_down
いいえ、API キーには有効期限がありません。ただし、キーが侵害された疑いがあり、キーを非アクティブ化したい場合は、弊社のサポート チームにご連絡ください。 API キー コントロール パネルでキーを自己破壊することもできます。
お問い合わせ
code
API キー間でトークン残高を転送できますか?
keyboard_arrow_down
はい、残りの有料トークン残高をあるプレミアム キーから別のプレミアム キーに移すことができます。 API キー コントロール パネルでアカウントにログインした後、キー転送の設定インターフェースに移動します。残りのすべての支払い済みトークン残高。
code
API キーを破棄してもいいですか?
keyboard_arrow_down
はい、API キーが侵害されたと思われる場合は、破棄できます。キーを破棄すると、そのキーを保存しているすべてのユーザーに対してキーが即座に無効になり、残りのトークン残高と関連資産はすべて永久に利用できなくなります。プレミアム キーをお持ちの場合は、それを書き込む前に、残りの支払い済みトークンの残高を別のキーに転送することを選択できます。この操作は元に戻すことができないことに注意してください。キーを破棄するには、API キー ダッシュボードのキー設定に移動します。
code
一部のモデルの初回リクエストに時間がかかるのはなぜですか?
keyboard_arrow_down
これは、使用率が低い場合、サーバーレス アーキテクチャが特定のモデルをオフロードするためです。最初のリクエストではモデルがアクティブ化または「ウォームアップ」されますが、これには数秒かかる場合があります。最初のアクティベーションの後、後続のリクエストははるかに高速に処理されます。
code
ユーザー入力データはモデルのトレーニングに使用されますか?
keyboard_arrow_down
当社は厳格なプライバシー ポリシーを遵守しており、モデルのトレーニングにユーザー入力データを使用しません。また、SOC 2 Type I および Type II にも準拠しており、高水準のセキュリティとプライバシーを保証します。
請求に関するよくある質問
attach_money
API の料金は文の数またはリクエストの数に基づいて課金されますか?
keyboard_arrow_down
当社の価格モデルは処理されるトークンの総数に基づいており、ユーザーはこれらのトークンを任意の数の文に柔軟に割り当てることができ、さまざまなテキスト分析ニーズに費用対効果の高いソリューションを提供します。
attach_money
新規ユーザーは無料トライアルを利用できますか?
keyboard_arrow_down
新規ユーザーには無料トライアルを提供しており、これには自動生成された API キーを介して引き換えられる、当社のどのモデルでも使用できる 1,000 万トークンが含まれています。無料トークンを使い切ったら、ユーザーは「トークンを購入」タブから API キーで使用するための追加トークンを簡単に購入できます。
attach_money
失敗したリクエストに対してトークンは差し引かれますか?
keyboard_arrow_down
いいえ、失敗したリクエストに対してトークンは差し引かれません。
attach_money
どのような支払い方法が利用できますか?
keyboard_arrow_down
支払いは Stripe を通じて処理され、クレジット カード、Google Pay、PayPal などの複数の支払い方法がサポートされているため、便利です。
attach_money
Ci Yuanを購入した後に請求書を発行できますか?
keyboard_arrow_down
はい、トークンを購入すると、Stripe アカウントに関連付けられた電子メール アドレスに請求書が送信されます。
オフィス
location_on
カリフォルニア州サニーベール
710 Lakeway Dr、Ste 200、サニーベール、CA 94085、アメリカ合衆国
location_on
ドイツ、ベルリン(本社)
Prinzessinnenstraße 19-20、10969 ベルリン、ドイツ
location_on
中国、北京
中国北京市海淀区西街48号ビル6号5階
location_on
深セン、中国
ルーム 402、4 階、福安テクノロジービル、深セン、中国
検索ベース
読者
ベクトルモデル
並べ替え者
ディープサーチ
分類子
スライサー
APIドキュメント
Jina APIキーを取得する
レート制限
APIステータス
会社
私たちについて
営業担当者に問い合わせる
ニュース
インターンプログラム
参加しませんか
open_in_new
ロゴをダウンロード
open_in_new
条項
安全性
利用規約
プライバシー
Cookieを管理する
email
Jina AI © 2020-2025.