소식
모델
제품
keyboard_arrow_down
심층 검색
검색하고, 읽고, 추론하여 가장 좋은 답을 찾으세요.
리더
URL을 읽거나 검색하면 대규모 모델에 대한 지원이 더 향상됩니다.
벡터 모델
세계적 수준의 다중 모드 다중 언어 임베딩.
재배열자
검색 관련성을 극대화하는 세계적 수준의 신경 검색기입니다.
더
keyboard_arrow_down
분류자
이미지와 텍스트의 제로 샷 및 퓨어 샷 분류.
얇게 써는 기계
긴 텍스트를 청크 또는 토큰으로 분할합니다.

API 문서
AI 프로그래밍 어시스턴트 IDE 또는 대형 모델에 대한 코드를 자동으로 생성합니다.
open_in_new


회사
keyboard_arrow_down
회사 소개
영업팀에 문의
인턴 프로그램
우리와 함께
open_in_new
로고 다운로드
open_in_new
이용약관


로그인
login

jina-embeddings-v2-base-code

코드 및 기술 문서 검색을 위한 벡터 모델
릴리스 노트arrow_forward
특허
license
Apache-2.0
출시일
calendar_month
2024-02-05
입력하다
abc
텍스트(코드)
arrow_forward
산출
more_horiz
벡터
모델 세부정보
매개변수: 137M
단어 길이를 입력하세요: 8K
출력 크기: 768
언어 지원
🇺🇸 영어
관련 모델
link
jina-embeddings-v2-base-en
상표
code-embeddings
programming-languages
semantic-code-search
code-similarity
long-context
text-embeddings
multilingual-code
docstring-search
다음과 같은 방법으로 얻을 수 있습니다
API아마존 클라우드마이크로소프트 클라우드얼굴을 껴안다
I/O 다이어그램
비교할 모델을 선택하세요

개요

Jina Embeddings v2 Code Base는 현대 소프트웨어 개발의 주요 과제인 대규모 코드 베이스를 효율적으로 탐색하고 이해하는 문제를 해결합니다. 코드 발견 및 문서화로 어려움을 겪고 있는 개발 팀을 위해 이 모델은 30개 프로그래밍 언어에 대한 자연어 검색을 지원함으로써 개발자가 코드와 상호 작용하는 방식을 변화시킵니다. 정확한 패턴 일치에 의존하는 기존 코드 검색 도구와 달리 이 모델은 코드 뒤에 숨은 의미를 이해하므로 개발자는 일반 영어 설명을 사용하여 관련 코드 조각을 찾을 수 있습니다. 이 기능은 대규모 레거시 코드 베이스를 유지 관리하는 팀, 새 프로젝트에 참여하는 개발자 또는 코드 재사용 및 문서화 방식을 개선하려는 조직에 특히 유용합니다.

방법

이 모델은 코드 이해를 위해 특별히 설계된 특수 목적 아키텍처를 통해 인상적인 성능을 달성합니다. 핵심적으로는 Python, JavaScript, Java, PHP, Go 및 Ruby 등 6가지 주요 언어에 중점을 두고 다양한 프로그래밍 언어 데이터세트에 대해 훈련된 1억 6,100만 개의 매개변수가 있는 Transformer 기반 신경망을 사용합니다. 이 아키텍처는 8,192개 토큰의 확장된 컨텍스트 창을 통해 의미론적 이해를 유지하면서 전체 기능 또는 여러 파일을 동시에 처리할 수 있다는 점에서 독특합니다. 이 모델은 코드의 구문 구조와 의미론적 의미를 포착하는 조밀한 768차원 벡터를 생성하므로 동일한 목표를 달성하기 위해 서로 다른 프로그래밍 패턴이나 구문을 사용하더라도 서로 다른 코드 세그먼트 간의 관계를 이해할 수 있습니다.

성능

실제 테스트에서 Jina Embeddings v2 Base Code는 주요 CodeNetSearch 벤치마크 15개 중 9개를 차지하는 뛰어난 기능을 보여주었습니다. Microsoft 및 Salesforce와 같은 업계 거대 기업의 모델에 비해 더 효율적인 공간을 유지하면서 뛰어난 성능을 달성합니다. 이 모델은 특히 언어 간 코드 이해에 뛰어나며, 다양한 프로그래밍 언어에서 기능적으로 동일한 코드 조각을 성공적으로 일치시킵니다. 8,192개의 토큰 컨텍스트 창은 대규모 기능과 복잡한 코드 파일에 특히 유용하며, 종종 수백 개의 토큰만 처리할 수 있는 기존 모델보다 훨씬 뛰어납니다. 모델의 효율성은 307MB(비양자화)의 컴팩트한 크기에 반영되어 코드 유사성 및 검색 작업에서 높은 정확도를 유지하면서 빠른 추론을 가능하게 합니다.

가이드

Jina Embeddings v2 코드 베이스를 효과적으로 배포하기 위해 팀은 몇 가지 실용적인 측면을 고려해야 합니다. 이 모델은 MongoDB, Qdrant 및 Weaviate와 같은 널리 사용되는 벡터 데이터베이스와 원활하게 통합되어 확장 가능한 코드 검색 시스템을 쉽게 구축할 수 있습니다. 최상의 성능을 얻으려면 일반적으로 대부분의 함수 및 클래스 정의를 수용하는 8,192개 토큰 제한을 처리하는 적절한 코드 전처리를 구현하십시오. 이 모델은 30가지 프로그래밍 언어를 지원하지만 Python, JavaScript, Java, PHP, Go, Ruby 등 6가지 핵심 언어에서 가장 강력한 성능을 보여줍니다. 팀은 성능을 최적화하기 위해 대규모 코드 인덱싱을 위한 일괄 처리 사용을 고려해야 합니다. 모델의 RAG 호환성은 자동화된 문서 생성 및 코드 이해 작업에 특히 효과적이지만 팀은 매우 큰 코드 기반에 대해 적절한 청크 전략을 구현해야 합니다. 프로덕션 배포의 경우 관리형 추론을 위해 AWS SageMaker 엔드포인트를 사용하는 것을 고려하고 적절한 캐싱 전략을 구현하여 쿼리 성능을 최적화하십시오.
이 모델을 언급하는 블로그
4월 08, 2025 • 21 독서의 분
jina-reranker-m0: 다국어 멀티모달 문서 재정렬기
시각적 문서를 검색하기 위한 새로운 다국어 멀티모달 리랭커인 jina-reranker-m0를 소개합니다. 다국어 긴 문서와 코드 검색 작업에서 최고 수준(SOTA)의 성능을 제공합니다.
Jina AI
Modern dot matrix text display on a dark blue background, conveying a digital feel.
9월 27, 2024 • 15 독서의 분
Jina Embeddings v2에서 v3로의 마이그레이션
Jina Embeddings v2에서 v3로 마이그레이션하는 데 도움이 될 만한 팁들을 모아보았습니다.
Alex C-G
Scott Martens
A digital upgrade theme with "V3" and a white "2", set against a green and black binary code background, with "Upgrade" centr
4월 29, 2024 • 7 독서의 분
Azure의 Jina Embeddings와 Reranker: 확장 가능한 기업용 AI 솔루션
Jina Embeddings와 Rerankers가 이제 Azure Marketplace에서 사용 가능합니다. 개인정보 보호와 보안을 중요시하는 기업들은 이제 Jina AI의 최첨단 모델을 기존 Azure 생태계에 쉽게 통합할 수 있습니다.
Susana Guzmán
Futuristic black background with a purple 3D grid, featuring the "Embeddings" and "Reranker" logos with a stylized "A".
2월 05, 2024 • 4 독서의 분
Jina 코드 임베딩과 함께 코드 검색을 한 단계 업그레이드하세요
새로운 𝗷𝗶𝗻𝗮-𝗲𝗺𝗯𝗲𝗱𝗱𝗶𝗻𝗴𝘀-𝘃𝟮-𝗯𝗮𝘀𝗲-𝗰𝗼𝗱𝗲는 코드와 docstring 검색에 최적화되어 있습니다. 이 강력한 모델은 영어와 30개의 널리 사용되는 프로그래밍 언어 간의 검색을 지원하며, 모두 8192 컨텍스트 길이와 SOTA 성능을 제공합니다.
Jina AI
Abstract image with concentric circles in purple and green, featuring "jina" logo and repeated "code embeddings" text around
사무실
location_on
캘리포니아주 서니베일
710 Lakeway Dr, Ste 200, 서니베일, CA 94085, 미국
location_on
독일 베를린(본사)
Prinzessinnenstraße 19-20, 10969 베를린, 독일
location_on
중국 베이징
중국 베이징 하이뎬구 서가 48호 6호관 5층
location_on
중국 선전
중국 선전 푸안 테크놀로지 빌딩 4층 402호
검색 기반
심층 검색
리더
벡터 모델
재배열자
분류자
얇게 써는 기계
API 문서
Jina API 키 받기
비율 제한
API 상태
회사
회사 소개
영업팀에 문의
소식
인턴 프로그램
우리와 함께
open_in_new
로고 다운로드
open_in_new
자귀
안전
이용약관
은둔
쿠키 관리
email
Jina AI © 2020-2025.