ニュース
モデル
製品
keyboard_arrow_down
読者
URL を読み取ったり検索したりすると、大規模なモデルのサポートが向上します。
ベクトルモデル
世界クラスのマルチモーダル、多言語埋め込み。
並べ替え者
検索の関連性を最大化する世界クラスのニューラルレトリーバー。
ディープサーチ
最善の答えが見つかるまで、検索し、読み、推論してください。
もっと
keyboard_arrow_down
分類子
画像とテキストのゼロショットおよび少数ショットの分類。
スライサー
長いテキストをチャンクまたはトークンに分割します。

MCPサーバー
大規模なモデルが API を使用できるようにするには、MCP サーバーとして mcp.jina.ai を追加します。
open_in_new
APIドキュメント
AIプログラミングアシスタントIDEまたは大規模モデル用のコードを自動生成
open_in_new


会社
keyboard_arrow_down
私たちについて
営業担当者に問い合わせる
インターンプログラム
参加しませんか
open_in_new
ロゴをダウンロード
open_in_new
利用規約


ログイン
login
warning
このモデルは、新しいモデルでは非推奨になりました。

jina-embeddings-v2-base-code

コードおよび技術文書検索用のベクトル モデル
リリースノートarrow_forward
ライセンス
license
Apache-2.0
発売日
calendar_month
2024-02-05
入力
abc
テキスト(コード)
arrow_forward
出力
more_horiz
ベクター
モデル詳細
パラメータ: 137M
単語の長さを入力してください: 8K
出力寸法: 768
言語サポート
🇺🇸 英語
関連機種
link
jina-embeddings-v2-base-en
ラベル
code-embeddings
programming-languages
semantic-code-search
code-similarity
long-context
text-embeddings
multilingual-code
docstring-search
以下の方法で入手できます
APIアマゾンクラウドマイクロソフトクラウド顔を抱きしめる
I/O 図
比較するモデルを選択してください

概要

Jina Embeddings v2 コード ベースは、大規模なコード ベースを効率的にナビゲートして理解するという、現代のソフトウェア開発における重要な課題を解決します。コードの発見と文書化に苦労している開発チームにとって、このモデルは 30 のプログラミング言語にわたる自然言語検索を可能にし、開発者がコードを操作する方法を変えます。正確なパターン マッチングに依存する従来のコード検索ツールとは異なり、このモデルはコードの背後にある意味論的な意味を理解するため、開発者は平易な英語の説明を使用して関連するコード スニペットを見つけることができます。この機能は、大規模なレガシー コード ベースを維持しているチーム、新しいプロジェクトに参加している開発者、またはコードの再利用とドキュメント化の実践を改善しようとしている組織にとって特に価値があります。

方法

このモデルは、コード理解のために特別に設計された専用アーキテクチャを通じて、優れたパフォーマンスを実現します。その中核となるのは、Python、JavaScript、Java、PHP、Go、Ruby の 6 つの主要言語に重点を置いた、さまざまなプログラミング言語データセットでトレーニングされた 1 億 6,100 万のパラメーターを備えた Transformer ベースのニューラル ネットワークです。このアーキテクチャは、8,192 トークンの拡張コンテキスト ウィンドウにより、セマンティックな理解を維持しながら関数全体または複数のファイルを同時に処理できるという点で独特です。このモデルは、コードの構文構造と意味論的な意味を捉える高密度の 768 次元ベクトルを生成するため、同じ目標を達成するために異なるプログラミング パターンや構文を使用している場合でも、異なるコード セグメント間の関係を理解できるようになります。

パフォーマンス

実際のテストでは、Jina Embeddings v2 Base Code は優れた機能を実証し、CodeNetSearch の主要なベンチマーク 15 件中 9 件で首位を獲得しました。 Microsoft や Salesforce などの業界大手のモデルと比較して、より効率的な設置面積を維持しながら、優れたパフォーマンスを実現します。このモデルは、言語を越えたコードの理解に特に優れており、異なるプログラミング言語で機能的に同等のコード スニペットを首尾よく照合します。 8,192 トークンのコンテキスト ウィンドウは、大規模な関数や複雑なコード ファイルにとって特に価値があり、多くの場合数百トークンしか処理できない従来のモデルよりもはるかに優れています。このモデルの効率は 307MB (非量子化) というコンパクトなサイズに反映されており、コードの類似性と検索タスクで高い精度を維持しながら高速な推論が可能になります。

ガイド

Jina Embeddings v2 コード ベースを効果的に展開するには、チームはいくつかの実用的な側面を考慮する必要があります。このモデルは、MongoDB、Qdrant、Weaviate などの一般的なベクトル データベースとシームレスに統合されており、スケーラブルなコード検索システムを簡単に構築できます。最高のパフォーマンスを得るには、8,192 トークンの制限を処理する適切なコード前処理を実装します。通常、これはほとんどの関数およびクラス定義に対応します。このモデルは 30 のプログラミング言語をサポートしていますが、Python、JavaScript、Java、PHP、Go、Ruby の 6 つのコア言語で最も強力なパフォーマンスを示します。チームは、パフォーマンスを最適化するために、大規模なコードのインデックス作成にバッチ処理の使用を検討する必要があります。モデルの RAG 互換性により、自動ドキュメント生成やコード理解タスクに特に効果的ですが、チームは非常に大規模なコード ベースに対して適切なチャンク戦略を実装する必要があります。本番環境のデプロイでは、マネージド推論に AWS SageMaker エンドポイントの使用を検討し、適切なキャッシュ戦略を実装してクエリのパフォーマンスを最適化します。
このモデルについて言及しているブログ
4月 08, 2025 • 21 読む時間
jina-reranker-m0:多言語マルチモーダルドキュメントリランカー
視覚的なドキュメントを検索するための新しい多言語・マルチモーダルリランカー jina-reranker-m0 を紹介します。多言語の長文ドキュメントやコード検索タスクにおいて、最先端(SOTA)の性能を実現しています。
Jina AI
Modern dot matrix text display on a dark blue background, conveying a digital feel.
9月 27, 2024 • 15 読む時間
Jina Embeddings v2 から v3 への移行
Jina Embeddings v2 から v3 への移行に役立つヒントをいくつか集めました。
Alex C-G
Scott Martens
A digital upgrade theme with "V3" and a white "2", set against a green and black binary code background, with "Upgrade" centr
4月 29, 2024 • 7 読む時間
Azure 上の Jina Embeddings と Reranker:スケーラブルなビジネス向け AI ソリューション
Jina Embeddings および Rerankers が Azure Marketplace で利用可能になりました。プライバシーとセキュリティを重視する企業は、Jina AI の最先端モデルを既存の Azure エコシステムに簡単に統合できるようになりました。
Susana Guzmán
Futuristic black background with a purple 3D grid, featuring the "Embeddings" and "Reranker" logos with a stylized "A".
2月 05, 2024 • 4 読む時間
新しい Jina コード埋め込みであなたのコード検索を強化する
新しい 𝗷𝗶𝗻𝗮-𝗲𝗺𝗯𝗲𝗱𝗱𝗶𝗻𝗴𝘀-𝘃𝟮-𝗯𝗮𝘀𝗲-𝗰𝗼𝗱𝗲 は、コードと docstring の検索に最適化されています。この強力なモデルは、英語と 30 の主要なプログラミング言語間の検索をサポートし、すべて 8192 のコンテキスト長と SOTA のパフォーマンスを備えています。
Jina AI
Abstract image with concentric circles in purple and green, featuring "jina" logo and repeated "code embeddings" text around
オフィス
location_on
カリフォルニア州サニーベール
710 Lakeway Dr、Ste 200、サニーベール、CA 94085、アメリカ合衆国
location_on
ドイツ、ベルリン(本社)
Prinzessinnenstraße 19-20、10969 ベルリン、ドイツ
location_on
中国、北京
中国北京市海淀区西街48号ビル6号5階
location_on
深セン、中国
ルーム 402、4 階、福安テクノロジービル、深セン、中国
検索ベース
読者
ベクトルモデル
並べ替え者
ディープサーチ
分類子
スライサー
APIドキュメント
Jina APIキーを取得する
レート制限
APIステータス
会社
私たちについて
営業担当者に問い合わせる
ニュース
インターンプログラム
参加しませんか
open_in_new
ロゴをダウンロード
open_in_new
条項
安全性
利用規約
プライバシー
Cookieを管理する
email
Jina AI © 2020-2025.