소식
모델
API
keyboard_arrow_down
리더
URL을 읽거나 검색하면 대규모 모델에 대한 지원이 더 향상됩니다.
벡터 모델
세계적 수준의 다중 모드 다중 언어 임베딩.
재배열자
검색 관련성을 극대화하는 세계적 수준의 신경 검색기입니다.
MCP terminal명령줄articlellms.txtsmart_toy대리인data_object모델menu_book문서



로그인
login

영업팀에 문의

Jina AI와 함께 비즈니스를 성장시키세요.

nights_stay 영업팀이 잠시 자리를 비웠다가 3시간 후에 돌아올 예정입니다.

구매 방법 두 가지

저희 API를 구독하시거나 클라우드 서비스 제공업체를 통해 구매하세요.
radio_button_unchecked
cloud
3 클라우드 서비스 제공업체와 협력
귀하의 회사는 AWS 또는 Azure를 사용하고 있습니까? 그런 다음 회사 내의 이러한 플랫폼에 직접 검색 인프라 모델을 배포하여 데이터를 안전하게 유지하고 규정을 준수하세요.
AWS SageMaker
벡터 모델
재배열자
Microsoft Azure
벡터 모델
재배열자
Google Cloud
벡터 모델
radio_button_checked
Jina를 사용한 검색 기반 API
당사의 모든 제품에 접근할 수 있는 가장 쉬운 방법입니다. 언제든지 토큰을 재충전하세요.
더 많은 토큰으로 이 API 키를 충전하세요
위치에 따라 미국 달러, 유로 또는 기타 통화로 요금이 청구될 수 있습니다. 세금이 적용될 수 있습니다.
재충전하려면 올바른 API 키를 입력하세요.
비율 제한에 대해 알아보기
속도 제한은 1분 동안 IP 주소/API 키(RPM)당 API에 보낼 수 있는 최대 요청 수입니다. 각 제품과 등급의 요금 한도에 대해 자세히 알아보세요.
keyboard_arrow_down
비율 제한
속도 제한은 세 가지 방법, 즉 RPM(분당 요청 수)과 TPM(분당 단어 수)으로 추적됩니다. 제한은 IP/API 키별로 적용되며 RPM 또는 TPM 임계값에 먼저 도달하면 트리거됩니다. 요청 헤더에 API 키를 제공하면 IP 주소 대신 키별로 요금 제한을 추적합니다.
제품API 포트설명하다arrow_upwardAPI 키 없음key_off무료 API 키key유료 API 키를 사용하세요key프리미엄 API 키와 함께 제공key평균 지연단어 사용 횟수요청 유형
리더 APIhttps://r.jina.aiURL을 큰 모델 친화적 텍스트로 변환20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s출력 응답의 토큰 수를 기준으로 합니다.GET/POST
리더 APIhttps://s.jina.ai웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다.block100 RPM100 RPMtrending_up1000 RPM2.5s각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다.GET/POST
벡터 모델 APIhttps://api.jina.ai/v1/embeddings텍스트/이미지를 고정 길이 벡터로 변환block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
입력 크기에 따라 다름
help
입력 요청의 토큰 수를 기준으로 합니다.POST
재정렬 APIhttps://api.jina.ai/v1/rerank쿼리로 문서 구체화block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
입력 크기에 따라 다름
help
입력 요청의 토큰 수를 기준으로 합니다.POST
분류자 APIhttps://api.jina.ai/v1/train훈련 샘플을 사용하여 분류기 훈련block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
입력 크기에 따라 다름
단어 수는 입력 단어 × 반복 횟수입니다.POST
분류자 API (작은 샘플)https://api.jina.ai/v1/classify훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다.block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
입력 크기에 따라 다름
토큰 개수는 다음과 같습니다. 입력 토큰POST
분류자 API (제로 샘플)https://api.jina.ai/v1/classify제로샷 분류를 사용하여 입력 분류block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
입력 크기에 따라 다름
단어 수는: 입력 단어와 태그 단어입니다.POST
분할기 APIhttps://api.jina.ai/v1/segment긴 텍스트를 단어와 문장으로 분할20 RPM200 RPM200 RPM1,000 RPM0.3s토큰 사용은 계산되지 않습니다.GET/POST
심층 검색https://deepsearch.jina.ai/v1/chat/completions추론하고, 검색하고, 반복하여 최상의 답을 찾으세요block50 RPM50 RPM500 RPM56.7s전체 프로세스에서 총 토큰 수를 계산합니다.POST

자주하는 질문

지나 AI × 엘라스틱

handshake
지나 브랜드는 살아남을 수 있을까요?
keyboard_arrow_down
네. 지나(Jina)는 모델 브랜드로 거듭나고 있습니다. 알리바바의 큐웬(Qwen), 오픈아이언(OpenAI)의 GPT, 문샷(Moonshot)의 키미(Kimi)와 같은 관계라고 생각하시면 됩니다. 점진적으로 회사명을 지나 AI에서 엘라스틱(Elastic)으로 변경하여, 지나 AI가 검색 엔진 플랫폼 모델 브랜드에 집중할 수 있도록 할 계획입니다.
handshake
Jina AI는 앞으로 어떤 분야에 집중할 계획인가요?
keyboard_arrow_down
벡터화, 재정렬 기능, 그리고 소형 언어 모델은 검색 경험을 개선하는 데 도움이 됩니다. 하지만 우리의 목표는 아직 끝나지 않았습니다. 세계 최고 수준의 검색 모델 제공업체가 되는 것이 우리의 목표이며, 우리는 결코 이 목표를 숨긴 ​​적이 없습니다.
handshake
API 및 클라우드 마켓플레이스 서비스는 계속해서 출시될까요?
keyboard_arrow_down
네. 리더 API, 임베딩 API, 그리고 리랭커 API는 계속해서 개발 및 유지 관리될 예정입니다. 새롭게 출시되는 모든 모델은 클라우드 마켓플레이스 플랫폼에 동시에 배포됩니다. 기존처럼 API 서비스를 계속 이용하실 수 있습니다. 다만, 미국 수출 통제 대상 국가 또는 단체에는 서비스를 제공할 수 없습니다.
handshake
Hugging Face에 고중량 모델들을 계속해서 공개하실 건가요?
keyboard_arrow_down
네. 엘라스틱에서 지나는 앞으로도 검색 기반 모델의 한계를 뛰어넘기 위해 노력할 것이며, 저희는 개방형 가중치 모델을 계속해서 출시할 예정입니다.
handshake
이러한 오픈 소스 모델은 어떤 라이선스 계약에 따라 배포될 예정인가요?
keyboard_arrow_down
상황이 바뀌지 않는 한 (그럴 가능성은 낮지만), 저희는 앞으로도 CC-BY-NC 4.0 라이선스에 따라 저희의 저작물을 배포할 것입니다.
handshake
연구 논문 발표를 계속하실 건가요?
keyboard_arrow_down
네. 저희가 출시하는 모든 모델은 엄격한 연구 논문을 통해 뒷받침되며, ICLR, EMNLP, SIGIR, NeurIPS, ICML과 같은 주요 학회에 지속적으로 논문을 제출할 예정입니다.
handshake
저는 현재 Jina나 Elastic 고객이 아니지만, Reader API, Model API 또는 클라우드 마켓플레이스 이미지를 사용하고 싶습니다. 어떻게 하면 될까요?
keyboard_arrow_down
이전과 마찬가지로 저희 웹사이트 또는 해당 클라우드 마켓플레이스를 통해 간단히 등록하고 결제하시면 됩니다.
handshake
저는 이미 Elastic 유료 고객인데, 이제 Reader API, Model API 또는 클라우드 마켓플레이스 이미지를 사용하고 싶습니다. 어떻게 해야 하나요?
keyboard_arrow_down
현재 저희 제품은 Elastic의 제품 라이브러리(SKU)에 아직 포함되어 있지 않으므로, 해당 서비스를 이용하시려면 저희 웹사이트를 통해 결제하셔야 합니다. 조만간 Jina 모델은 Elastic Inference Services를 통해 제공될 예정입니다.
handshake
저는 Elastic 유료 고객이며, API나 클라우드 마켓플레이스를 통하지 않고 비즈니스 목적으로 Jina의 벡터 모델과 리플라워링 기능을 온프레미스에 배포하고 싶습니다. 어떻게 해야 할까요?
keyboard_arrow_down
Elastic 유료 라이선스를 보유하고 계신 경우, 당사 모델에 상업적 사용 정보가 이미 포함되어 있을 가능성이 높습니다. 따라서 바로 사용하실 수 있습니다. 확실하지 않은 경우, Elastic 영업 담당자 또는 현장 영업 엔지니어에게 문의해 주십시오. 담당자가 당사와 협의하여 확인해 드리겠습니다.
handshake
저는 Elastic 고객이 아니며, API나 클라우드 마켓플레이스를 통하지 않고 Jina의 벡터 모델과 리플라워링 기능을 로컬 비즈니스 목적으로 사용하고 싶습니다. 어떻게 해야 할까요?
keyboard_arrow_down
현재 Elastic과의 통합 작업을 진행 중이며, 향후 방향이 곧 명확해질 것입니다. 현재로서는 저희 모델에 대한 개별 상업용 라이선스를 발급할 수 없습니다.
handshake
저는 중국 회사로서 귀사의 서비스를 구매했습니다. 중국어로 된 송장을 받을 수 있을까요?
keyboard_arrow_down
당사는 중국에 법인을 두고 있지 않으므로 중국어로 송장을 발행할 수 없습니다. 송장은 독일 본사인 Jina AI GmbH에서 발행합니다.
handshake
지나 AI와 계약을 체결하고 싶습니다. 어떻게 해야 하나요?
keyboard_arrow_down
Jina AI의 비즈니스 모델에서 계약 기반 방식은 항상 작은 부분에 불과했습니다. 대부분의 고객은 사용량에 따라 지불하는 셀프 서비스 모델을 이용하고 있습니다. 현재 Elastic과의 통합 작업을 진행 중이지만, 새로운 계약은 발행하지 않습니다.
handshake
저는 Elastic 유료 고객이며 벡터 모델 및 재정렬 도구 사용에 대한 모범 사례를 배우고 싶거나 Jina AI 개발에 관심이 있습니다. 어떻게 해야 할까요?
keyboard_arrow_down
해당 사안에 대해 논의하기 위해 귀하와 Jina AI 팀, 그리고 Elastic 간의 미팅을 주선할 수 있도록 Elastic 영업 담당자에게 문의해 주십시오.

API 키를 어떻게 얻나요?

video_not_supported

속도 제한은 무엇입니까?

비율 제한
속도 제한은 세 가지 방법, 즉 RPM(분당 요청 수)과 TPM(분당 단어 수)으로 추적됩니다. 제한은 IP/API 키별로 적용되며 RPM 또는 TPM 임계값에 먼저 도달하면 트리거됩니다. 요청 헤더에 API 키를 제공하면 IP 주소 대신 키별로 요금 제한을 추적합니다.
제품API 포트설명하다arrow_upwardAPI 키 없음key_off무료 API 키key유료 API 키를 사용하세요key프리미엄 API 키와 함께 제공key평균 지연단어 사용 횟수요청 유형
리더 APIhttps://r.jina.aiURL을 큰 모델 친화적 텍스트로 변환20 RPM500 RPM500 RPMtrending_up5000 RPM7.9s출력 응답의 토큰 수를 기준으로 합니다.GET/POST
리더 APIhttps://s.jina.ai웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다.block100 RPM100 RPMtrending_up1000 RPM2.5s각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다.GET/POST
벡터 모델 APIhttps://api.jina.ai/v1/embeddings텍스트/이미지를 고정 길이 벡터로 변환block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
입력 크기에 따라 다름
help
입력 요청의 토큰 수를 기준으로 합니다.POST
재정렬 APIhttps://api.jina.ai/v1/rerank쿼리로 문서 구체화block100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
입력 크기에 따라 다름
help
입력 요청의 토큰 수를 기준으로 합니다.POST
분류자 APIhttps://api.jina.ai/v1/train훈련 샘플을 사용하여 분류기 훈련block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
입력 크기에 따라 다름
단어 수는 입력 단어 × 반복 횟수입니다.POST
분류자 API (작은 샘플)https://api.jina.ai/v1/classify훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다.block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
입력 크기에 따라 다름
토큰 개수는 다음과 같습니다. 입력 토큰POST
분류자 API (제로 샘플)https://api.jina.ai/v1/classify제로샷 분류를 사용하여 입력 분류block25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
입력 크기에 따라 다름
단어 수는: 입력 단어와 태그 단어입니다.POST
분할기 APIhttps://api.jina.ai/v1/segment긴 텍스트를 단어와 문장으로 분할20 RPM200 RPM200 RPM1,000 RPM0.3s토큰 사용은 계산되지 않습니다.GET/POST
심층 검색https://deepsearch.jina.ai/v1/chat/completions추론하고, 검색하고, 반복하여 최상의 답을 찾으세요block50 RPM50 RPM500 RPM56.7s전체 프로세스에서 총 토큰 수를 계산합니다.POST

상업용 라이센스가 필요합니까?

CC BY-NC 라이센스 자가 점검

play_arrow
Azure, AWS 또는 GCP에서 당사의 공식 API 또는 공식 이미지를 사용하고 계십니까?
play_arrow
예
아무런 제한 사항이 없습니다. 웹사이트 또는 클라우드 마켓플레이스를 통해 간단히 등록하고 결제하시면 됩니다.
play_arrow
아니요
play_arrow
당신은 Elastic의 유료 고객이십니까?
play_arrow
예
귀하의 Elastic 라이선스에는 이미 상업적 사용이 포함되어 있을 수 있습니다. 궁금한 점이 있으면 Elastic 영업 담당자에게 문의하십시오.
영업팀에 문의
play_arrow
아니요
현재로서는 개별 상업 라이선스 계약을 체결할 수 없습니다. 자세한 내용은 Elastic 영업팀에 문의하십시오.
영업팀에 문의

기타 질문

독자에 대해 자주 묻는 질문
Reader API 사용과 관련된 비용은 얼마입니까?
keyboard_arrow_down
리더 API의 기본 기능은 무료입니다. URL 앞에 "https://r.jina.ai/"를 추가하기만 하면 됩니다. 더 높은 사용량 제한이 필요한 경우 API 키를 제공할 수 있으며, 콘텐츠 길이에 따라 요금이 부과됩니다. 사용량 제한에 대한 자세한 내용은 질문 16을 참조하세요.
리더 API는 어떻게 작동하나요?
keyboard_arrow_down
Reader API는 프록시를 사용하여 모든 URL을 가져오고 브라우저에서 해당 콘텐츠를 렌더링하여 고품질 기본 콘텐츠를 추출합니다.
리더 API는 오픈 소스인가요?
keyboard_arrow_down
예, 리더 API는 오픈 소스이며 Jina AI GitHub 저장소에서 찾을 수 있습니다.
Reader API의 일반적인 대기 시간은 얼마나 됩니까?
keyboard_arrow_down
Reader API는 일반적으로 URL을 처리하고 2초 이내에 콘텐츠를 반환하지만 복잡하거나 동적 페이지는 시간이 더 걸릴 수 있습니다.
페이지를 직접 스크랩하는 대신 Reader API를 사용해야 하는 이유는 무엇입니까?
keyboard_arrow_down
스크래핑은 복잡하고 신뢰할 수 없을 수 있으며, 특히 복잡하거나 동적인 페이지의 경우 더욱 그렇습니다. 리더 API는 간결하고, 신뢰할 수 있고, 간결한, 깔끔하고 큰 모델 수준의 텍스트 출력을 제공합니다.
Reader API는 여러 언어를 지원합니까?
keyboard_arrow_down
Reader API는 URL의 내용을 원래 언어로 반환합니다. 번역 서비스를 제공하지 않습니다.
웹사이트에서 Reader API를 차단하는 경우 어떻게 해야 합니까?
keyboard_arrow_down
차단 문제가 발생하는 경우 지원팀에 문의하여 도움과 해결 방법을 문의하세요.
Reader API가 PDF 파일에서 콘텐츠를 추출할 수 있습니까?
keyboard_arrow_down
Reader API는 주로 웹 페이지용으로 제작되었지만 arXiv와 같은 사이트에서 HTML로 표시된 PDF에서 콘텐츠를 추출할 수 있지만 일반 PDF 추출에는 최적화되어 있지 않습니다.
Reader API가 웹페이지의 미디어 콘텐츠를 처리할 수 있나요?
keyboard_arrow_down
네, Reader는 `x-with-generated-alt` 헤더를 사용하여 웹 페이지의 이미지에 설명 텍스트를 추가할 수 있습니다. 이를 통해 alt 태그가 없는 이미지에 설명 텍스트가 추가되어 언어 학습자가 시각적 콘텐츠를 더 쉽게 이해할 수 있습니다. 동영상 요약 기능은 향후 릴리스에서 제공될 예정입니다.
로컬 HTML 파일에서 Reader API를 사용할 수 있습니까?
keyboard_arrow_down
아니요, Reader API는 공개적으로 액세스 가능한 URL의 콘텐츠만 처리할 수 있습니다.
Reader API는 콘텐츠를 캐시합니까?
keyboard_arrow_down
5분 이내에 동일한 URL을 요청하면 Reader API가 캐시된 콘텐츠를 반환합니다.
로그인 후 Reader API를 사용하여 콘텐츠에 액세스할 수 있나요?
keyboard_arrow_down
불행하게도.
Reader API를 사용하여 arXiv의 PDF에 액세스할 수 있나요?
keyboard_arrow_down
예, 리더에서 기본 PDF 지원을 사용하거나(https://r.jina.ai/https://arxiv.org/pdf/2310.19923v4) arXiv에서 HTML 버전을 사용할 수 있습니다(https://r. jina.ai/https://arxiv.org/html/2310.19923v4)
리더에서 이미지 주석이 어떻게 작동하나요?
keyboard_arrow_down
Reader는 지정된 URL에 있는 모든 이미지에 캡션을 추가하고, 처음에 캡션이 없으면 `이미지 [idx]: [캡션]`을 alt 태그로 추가합니다. 이를 통해 대규모 다운스트림 모델이 추론, 요약 등을 위해 이미지와 상호 작용할 수 있습니다.
리더는 얼마나 확장 가능합니까? 이것을 프로덕션에 사용할 수 있나요?
keyboard_arrow_down
Reader API는 확장성이 뛰어나도록 설계되었습니다. 실시간 트래픽을 기반으로 자동으로 확장되며, 최대 동시 요청 수는 현재 약 4,000개입니다. 진아AI의 핵심 제품 중 하나로 적극적으로 유지하고 있습니다. 그러니 제작에 자유롭게 사용해 보세요.
Reader API의 속도 제한은 무엇입니까?
keyboard_arrow_down
아래 표에서 최신 속도 제한 정보를 확인하세요. 우리는 Reader API의 속도 제한과 성능을 개선하기 위해 적극적으로 노력하고 있으므로 이에 따라 이 표도 업데이트될 예정입니다.
speed비율 제한
리더-LM이란? 그것을 사용하는 방법?
keyboard_arrow_down
`ReaderLM-v2`는 원시 HTML을 간결한 Markdown 또는 JSON으로 변환하는 최신 소형 언어 모델(SLM)입니다. v1 대비 3배 향상된 품질을 제공하며 JSON 스키마 또는 자연어 명령어를 사용하여 구조화된 데이터를 추출할 수 있습니다. `x-respond-with: readerlm-v2` 헤더를 추가하여 Reader API를 통해 직접 사용하거나 클라우드 마켓플레이스(AWS, Azure, GCP)에서 배포할 수 있습니다.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
웹 페이지에서 구조화된 데이터를 추출하는 방법은 무엇인가요?
keyboard_arrow_down
JSON 스키마 정의를 사용하려면 `x-json-schema` 헤더를, 자연어 명령어를 사용하려면 `x-instruction` 헤더를 사용하십시오. 이 두 기능 모두 ReaderLM-v2와 함께 작동하여 모든 웹페이지에서 특정 필드(예: 가격, 제목, 날짜 등)를 구조화된 JSON 형식으로 추출합니다.
독자가 웹사이트의 봇 방지 시스템을 능동적으로 우회할까요?
keyboard_arrow_down
아니요. Reader는 웹사이트의 방어 체계, 봇 방지 시스템 또는 접근 제어를 적극적으로 우회하지 않습니다. 웹사이트에서 저희 서비스를 봇으로 감지하여 요청을 차단하는 경우, 저희는 해당 결과를 존중합니다. 저희는 표준 웹 클라이언트로 작동하며 탐지 시스템을 우회하기 위한 어떠한 기술도 사용하지 않습니다.
무료 API 키에서 유료 API 키로 업그레이드하면 더 많은 웹사이트에 접속할 수 있나요?
keyboard_arrow_down
아니요. 무료 API 키에서 유료 API 키로 업그레이드한다고 해서 다른 웹사이트에 접속할 수 있거나 웹사이트 접속 제한을 우회할 수 있는 것은 아닙니다. 두 등급의 주요 차이점은 요청 처리량 제한과 성능 최적화입니다. 유료 API 키는 더 높은 요청 처리량과 더 빠른 처리 속도를 제공하지만, 당사 서비스를 차단한 웹사이트에 접속할 수 있도록 허용하지는 않습니다.
벡터 모델에 대해 자주 묻는 질문(FAQ)
지나 임베딩 모델은 어떻게 학습되나요?
keyboard_arrow_down
훈련 과정, 데이터 소스 및 평가에 대한 자세한 내용은 arXiv에 게시된 기술 보고서 ​​jina-embeddings-v3 및 jina-embeddings-v4를 참조하십시오.
launcharXiv
귀사의 멀티모달 임베딩 모델은 무엇입니까?
keyboard_arrow_down
`jina-embeddings-v4`는 텍스트와 이미지를 모두 지원하는 최신 범용 멀티모달 모델(38억 개의 파라미터)로, 32,000개의 컨텍스트 정보를 포함하고 있으며, 집중적 및 지연형 대화형 검색을 지원하고 시각적으로 풍부한 문서에서 최첨단 성능을 달성합니다. `jina-clip-v2`는 89개 언어를 지원하고 512x512 해상도의 이미지를 사용하며 마트료시카 표기법을 채택한 보다 경량화된 모델(8억 6,500만 개의 파라미터)입니다. 두 모델 모두 텍스트-텍스트, 텍스트-이미지 및 이미지-이미지 검색 작업에서 탁월한 성능을 보여줍니다.
launcharXiv
귀하의 모델은 어떤 언어를 지원합니까?
keyboard_arrow_down
`jina-embeddings-v4`와 `jina-embeddings-v3` 모두 89개 언어를 지원하며 강력한 다국어 기능을 자랑합니다. 지원되는 상위 30개 언어에는 아랍어, 벵골어, 중국어, 덴마크어, 네덜란드어, 영어, 핀란드어, 프랑스어, 조지아어, 독일어, 그리스어, 힌디어, 인도네시아어, 이탈리아어, 일본어, 한국어, 라트비아어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 슬로바키아어, 스페인어, 스웨덴어, 태국어, 터키어, 우크라이나어, 우르두어, 베트남어가 포함됩니다. `jina-clip-v2` 또한 89개 언어를 지원하며 멀티모달 작업에 사용할 수 있습니다.
launcharXiv
단일 문장 입력의 최대 길이는 얼마입니까?
keyboard_arrow_down
컨텍스트 길이는 모델에 따라 다릅니다. `jina-embeddings-v4`는 최대 32,000개의 토큰을 지원하는 반면, `jina-embeddings-v3`와 `jina-clip-v2`는 최대 8,192개의 토큰을 지원합니다. 토큰은 단일 문자 또는 완전한 단어일 수 있습니다. 이러한 확장된 컨텍스트를 통해 대량의 텍스트 데이터에 대한 보다 포괄적인 문서 분석이 가능해지고 컨텍스트 이해의 정확도가 향상됩니다.
단일 요청에 몇 개의 문장을 포함할 수 있나요?
keyboard_arrow_down
요청에 포함할 수 있는 항목 수에는 엄격한 제한이 없습니다. API는 GPU 활용도를 최적화하기 위해 토큰 수를 기준으로 입력을 내부적으로 일괄 처리합니다. 따라서 단일 요청에 원하는 만큼의 텍스트나 이미지를 보낼 수 있습니다.
이미지를 멀티모달 임베딩 모델로 보내는 방법은 무엇인가요?
keyboard_arrow_down
`jina-embeddings-v4`, `jina-clip-v2`, `jina-clip-v1`의 경우, API 요청의 `input` 필드에 `url` 또는 `bytes`를 사용할 수 있습니다. `url`에는 처리할 이미지의 URL을 제공하고, `bytes`에는 이미지를 base64 형식으로 인코딩합니다. `jina-embeddings-v4`는 PDF URL 또는 base64로 인코딩된 PDF 바이트를 전달하여 PDF 문서에 직접 삽입할 수도 있습니다.
Jina Embeddings 모델은 OpenAI 및 Cohere의 최신 벡터 모델과 어떻게 비교됩니까?
keyboard_arrow_down
`jina-embeddings-v4`는 시각적으로 풍부한 문서 검색(ViDoRe) 및 멀티모달 벤치마크 모두에서 최첨단(SOTA) 성능을 달성한 최신 플래그십 모델입니다. 일반 텍스트 작업의 경우, `jina-embeddings-v3`는 MTEB 영어 및 다국어 벤치마크에서 OpenAI 및 Cohere보다 우수한 성능을 보이면서도 더 작고 효율적입니다. 두 모델 모두 마트료시카 표현 학습(MRL)을 지원하여 성능 저하 없이 차원 축소가 가능합니다(v3는 32차원, v4는 128차원까지 축소 가능).
OpenAI의 text-embedding-3-large에서 Jina Embeddings 모델로 마이그레이션하는 방법은 무엇입니까?
keyboard_arrow_down
우리의 API 엔드포인트가 OpenAI의 text-embeddings와 호환되므로 마이그레이션 프로세스가 원활했습니다. -3-large 모델의 입력 및 출력 JSON 스키마가 일치합니다. 이러한 호환성을 통해 사용자는 OpenAI 엔드포인트를 사용할 때 OpenAI 모델을 우리 모델로 쉽게 교체할 수 있습니다.
jina-clip 모델을 사용할 때 토큰을 어떻게 계산하나요?
keyboard_arrow_down
토큰은 텍스트 길이와 이미지 크기를 기반으로 계산됩니다. 요청의 텍스트에 대해서는 토큰이 표준 방식으로 계산됩니다. 이미지에 대해서는 다음 단계를 수행합니다. 1. 타일 크기: 각 이미지는 타일로 나뉩니다. jina-embeddings-v4의 경우 타일 크기는 28x28픽셀이고, jina-clip-v2의 경우 타일 크기는 512x512픽셀이며, jina-clip-v1의 경우 타일 크기는 224x224픽셀입니다. 2. 적용 범위: 입력 이미지를 덮는 데 필요한 타일 수를 계산합니다. 이미지 크기가 타일 크기로 정확히 나누어 떨어지지 않더라도 일부 타일은 전체 타일로 계산됩니다. 3. 총 타일 수: 이미지를 덮는 총 타일 수에 따라 비용이 결정됩니다. 예를 들어, 600x600 픽셀 이미지는 jina-embeddings-v4에서는 22x22 타일(484개), jina-clip-v2에서는 2x2 타일(4개), jina-clip-v1에서는 3x3 타일(9개)로 구성됩니다. 4. 비용 계산: jina-embeddings-v4의 경우 타일당 10개 토큰, jina-clip-v2의 경우 타일당 4000개 토큰, jina-clip-v1의 경우 타일당 1000개 토큰입니다. 예: 600x600 픽셀 이미지의 경우: • jina-embeddings-v4 사용 • 이미지는 28x28 픽셀 타일로 분할됩니다. • 필요한 총 타일 개수는 가로 22개 x 세로 22개 = 484개입니다. • jina-embeddings-v4의 비용은 484*10 = 4840개 토큰입니다. • jina-clip-v2 사용 • 이미지는 512x512픽셀 타일로 분할됩니다. • 필요한 총 타일 개수는 가로 2개 x 세로 2개 = 4개 타일입니다. • jina-clip-v2의 비용은 4*4000 = 16000개 토큰입니다. • jina-clip-v1 사용 • 이미지는 224x224픽셀 타일로 분할됩니다. • 필요한 총 타일 개수는 가로 3개 x 세로 3개 = 9개 타일입니다. • jina-clip-v1의 비용은 9*1000 = 9000 토큰입니다.
벡터 모델 이미지나 오디오 모델을 제공하시나요?
keyboard_arrow_down
네, jina-clip-v2와 jina-clip-v1은 이미지와 텍스트를 지원할 수 있습니다. 더 많은 모달리티의 벡터 모델이 곧 발표될 예정입니다!
개인 또는 회사 데이터를 사용하여 Jina 벡터 모델 모델을 미세 조정할 수 있습니까?
keyboard_arrow_down
특정 데이터로 모델을 미세 조정하는 방법에 대한 질문이 있는 경우 당사에 문의하여 요구 사항을 논의하세요. 우리는 귀하의 요구 사항에 맞게 모델을 어떻게 조정할 수 있는지 알아보고 싶습니다.
문의하기
귀하의 서비스를 AWS, Azure 또는 GCP에 비공개로 배포할 수 있나요?
keyboard_arrow_down
예. AWS, Azure 및 GCP 마켓플레이스에서 당사 서비스를 사용할 수 있습니다. 특정 요구 사항이 있는 경우 jina.ai 영업 담당자에게 문의하세요.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
"task" 매개변수란 무엇인가요? 어떤 상황에서 사용해야 하나요?
keyboard_arrow_down
`jina-embeddings-v3`와 `jina-embeddings-v4` 모두에서 `task` 매개변수는 특정 작업에 대해 LoRA 어댑터를 활성화하여 최적의 성능을 달성하는 데 사용됩니다. 여기에는 검색 쿼리를 위한 `retrieval.query`, 문서 검색을 위한 `retrieval.passage`, 의미 유사도 계산을 위한 `text-matching`, 텍스트 분류를 위한 `classification`, 클러스터링 작업을 위한 `separation`이 포함됩니다.
지연형 대화형 검색이란 무엇인가요? 어떤 모델들이 이 검색 방식을 지원하나요?
keyboard_arrow_down
`jina-embeddings-v4`는 `output_type` 매개변수를 통해 밀집 검색(단일 벡터)과 지연 상호 작용 검색(다중 벡터)을 지원합니다. 지연 상호 작용 검색은 단어 수준의 세부 정보를 보존하여 복잡한 쿼리에서 검색 정확도를 높입니다. `jina-colbert-v2`는 지연 상호 작용 검색 전용 모델입니다.
지연 청킹이란 무엇인가요? 어떤 상황에서 사용해야 하나요?
keyboard_arrow_down
지연 청킹은 먼저 긴 컨텍스트 모델을 사용하여 전체 문서를 임베딩한 다음, 어휘 수준 표현에서 청크 임베딩을 추출하는 기술입니다. 단순 청킹(먼저 청킹한 후 임베딩)과 달리, 지연 청킹은 청크 간 컨텍스트를 보존하여 RAG 애플리케이션의 검색 성능을 향상시킵니다. 이 기능은 `jina-embeddings-v3`의 `late_chunking` 매개변수를 통해 활성화할 수 있습니다.
API에서 지원하는 컨텍스트 길이가 모델의 최대 용량과 다른 이유는 무엇입니까?
keyboard_arrow_down
일부 임베딩 모델은 아키텍처적으로 더 긴 컨텍스트 길이를 처리할 수 있지만, 추론 인프라의 GPU 메모리 제약으로 인해 API에서 더 낮은 제한을 적용할 수 있습니다. 매우 긴 시퀀스를 처리하려면 상당한 메모리가 필요하며, 대부분의 사용 사례에 대해 처리량, 지연 시간 및 비용의 균형을 맞추도록 서비스 구성을 최적화했습니다. 더 긴 컨텍스트 길이에 대한 지원이 필요한 경우, 당사 영업팀에 문의하여 맞춤형 배포 솔루션을 논의하십시오.
jina-embeddings-v4는 무료인데 왜 이렇게 느린가요?
keyboard_arrow_down
`jina-embeddings-v4` API는 Qwen 연구 라이선스(Qwen Research License)에 따라 배포되는 Qwen2-VL 기본 모델을 기반으로 구축되었습니다. 이 라이선스는 연구 및 비상업적 용도로만 사용 가능하므로 `jina-embeddings-v4`를 상업용 제품으로 제공할 수 없습니다. 따라서 이 모델은 API를 통해 무료로 제공됩니다. `jina-embeddings-v4`는 두 가지 이유로 다른 모델보다 속도가 느릴 수 있습니다. 첫째, `jina-embeddings-v4` 모델은 `jina-embeddings-v3`보다 훨씬 크기 때문에 요청당 계산 시간이 더 오래 걸립니다. 둘째, 이 모델을 상용화할 수 없기 때문에 인프라 비용을 관리하기 위해 API 처리량을 의도적으로 제한했습니다. 따라서 `jina-embeddings-v4` API를 사용할 때 높은 처리량이나 상용 수준의 처리량을 기대해서는 안 됩니다. 더 높은 처리량이 필요한 프로덕션 워크로드의 경우 `jina-embeddings-v3`을 사용하거나 Hugging Face를 통해 자체 인프라에 `jina-embeddings-v4`를 배포하는 것이 좋습니다.
임베딩 API의 사용량 제한은 얼마인가요?
keyboard_arrow_down
API 키 유형에 따라 요청 제한이 다릅니다.

무료 버전: 100 RPM, 10만 TPM, 동시 요청 2개
유료 버전: 500 RPM, 200만 TPM, 동시 요청 50개
프리미엄 버전: 5,000 RPM, 5천만 TPM, 동시 요청 500개

또한, 악용을 방지하기 위해 IP 주소 기반 요청 제한도 적용되며, 60초당 최대 1만 건의 요청으로 제한됩니다. 더 높은 제한이 필요한 경우 영업팀에 문의하십시오.
각 임베딩 모델의 컨텍스트 길이 제한은 얼마인가요?
keyboard_arrow_down
각 모델에는 입력마다 최대 컨텍스트 길이 제한이 있습니다.

jina-embeddings-v4: 32,768 토큰
jina-embeddings-v3: 8,192 토큰
jina-embeddings-v2-*: 8,192 토큰
jina-clip-v1/v2: 8,192 토큰
jina-colbert-v1/v2: 8,192 토큰
jina-code-embeddings-*: 32,768 토큰

truncate: true가 설정되지 않은 경우, 제한을 초과하는 입력은 오류를 반환합니다. 이 값을 설정하면 입력이 자동으로 최대 길이로 잘립니다.
이미지 및 PDF 파일의 크기 제한은 어떻게 되나요?
keyboard_arrow_down
최대 파일 크기는 다음과 같습니다. 이미지: 5MB, PDF: 8MB. 이 제한을 초과하는 파일은 거부되고 오류 메시지가 표시됩니다.
Reranker 관련 자주 묻는 질문
Reranker API 비용은 얼마입니까?
keyboard_arrow_down
Reranker API의 가격은 Embedding API의 가격 구조와 일치합니다. 새로운 API 키 하나당 1,000만 개의 무료 토큰이 제공됩니다. 무료 토큰 외에도 다양한 패키지를 구매할 수 있습니다. 자세한 내용은 가격 섹션을 방문하세요.
지나 재배열 프로그램들 간의 차이점은 무엇인가요?
keyboard_arrow_down
`jina-reranker-v3`는 최신 플래그십 리랭커로, 혁신적인 리스트 기반 아키텍처를 채택하여 131,000개의 컨텍스트 길이로 최첨단 다국어 검색 성능을 제공합니다. `jina-reranker-m0`는 다양한 언어의 시각적 문서를 순위 매기는 멀티모달 리랭커입니다. `jina-reranker-v2-base-multilingual`은 100개 이상의 언어를 지원하는 크로스 인코더로, 함수 호출 및 코드 검색 기능을 제공합니다. `jina-colbert-v2`는 지연 상호작용 기술을 사용하고 89개 언어를 지원하며 사용자가 임베딩 크기를 제어할 수 있습니다.
Jina Rerankers는 오픈 소스인가요?
keyboard_arrow_down
네, 저희의 모든 순위 재조정 도구(jina-reranker-v3, jina-reranker-m0, jina-reranker-v2-base-multilingual, jina-colbert-v2)는 오픈 소스이며 CC-BY-NC 4.0 라이선스에 따라 배포됩니다. 이러한 모델은 비상업적 목적으로만 자유롭게 사용, 공유 및 수정할 수 있습니다.
리시퀀서는 여러 언어를 지원합니까?
keyboard_arrow_down
네, 저희의 모든 재순위화 도구는 다국어 검색을 지원합니다. `jina-reranker-v3`와 `jina-reranker-v2-base-multilingual`은 100개 이상의 언어를 지원합니다. `jina-reranker-m0`은 다국어 시각적 문서 순위 지정을 지원합니다. `jina-colbert-v2`는 89개 언어를 지원합니다.
각 재정렬 모델의 최대 컨텍스트 길이는 얼마입니까?
keyboard_arrow_down
컨텍스트 길이는 모델에 따라 다릅니다.

jina-reranker-v3: 131,072 토큰(쿼리 + 모든 문서 합계), 자동 잘림 활성화
jina-reranker-m0: 10,000 토큰
jina-reranker-v2-base-multilingual: 1,024 토큰, 긴 문서에 대한 자동 청킹 활성화
jina-reranker-v1-*: 1,024 토큰, 자동 청킹 활성화
jina-colbert-v2: 8,192 토큰

v1/v2 리랭커의 경우 쿼리는 자동으로 잘리고, 긴 문서는 청크로 나뉘며, 청크 간에는 최대 풀링이 수행됩니다.
한 번의 쿼리로 재정렬할 수 있는 문서 수에 제한이 있나요?
keyboard_arrow_down
요청당 문서 수에는 엄격한 제한이 없습니다. 임베딩 API와 마찬가지로, 리랭커 API는 GPU 활용도를 최적화하기 위해 토큰 수를 기준으로 입력을 일괄 처리합니다. 따라서 단일 요청에 필요한 만큼의 문서를 전송할 수 있습니다.
100개의 문서를 리플로우할 때 예상되는 대기 시간은 얼마나 됩니까?
keyboard_arrow_down
지연 시간은 문서 및 쿼리의 길이에 따라 100밀리초에서 7초까지입니다. 예를 들어 64개 용어 쿼리를 사용하여 256개의 토큰이 있는 100개의 문서를 재정렬하는 데 약 150밀리초가 걸립니다. 문서 길이를 토큰 4096개로 늘리면 시간이 3.5초로 늘어납니다. 쿼리 길이를 512개 토큰으로 늘리면 시간은 7초로 더 늘어납니다.
쿼리와 100개의 문서를 재정렬하는 데 드는 시간 비용(밀리초)은 다음과 같습니다.
각 문서의 토큰 수
쿼리의 토큰 수256512102420484096
64156323136621073571
128194369137721233598
256273475139721554299
5124681385211435367068
귀하의 서비스를 AWS, Azure 또는 GCP에 비공개로 배포할 수 있습니까?
keyboard_arrow_down
예. AWS, Azure 및 GCP 마켓플레이스에서 당사 서비스를 사용할 수 있습니다. 특정 요구사항이 있는 경우 jina.ai 영업팀에 문의하세요.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
도메인별 데이터에 대해 미세 조정된 재배열기를 제공합니까?
keyboard_arrow_down
귀하의 특정 도메인 데이터에 맞춰 미세 조정된 리포머에 관심이 있으시면 영업팀에 문의해 주세요. 우리 팀은 귀하의 문의에 신속하게 답변해 드리겠습니다.
문의하기
문서의 최소 이미지 크기는 얼마입니까?
keyboard_arrow_down
jina-reranker-m0 모델이 허용하는 최소 이미지 크기는 28x28픽셀입니다.
리스트 재정렬이란 무엇인가요? 점 재정렬과는 어떻게 다른가요?
keyboard_arrow_down
`jina-reranker-v3`는 모든 문서를 한 번의 순방향 패스로 평가하는 새로운 리스트 기반 아키텍처를 채택하여 문서 간 비교를 가능하게 합니다. 기존의 포인트 기반 재순위 지정 도구(예: v2)는 쿼리에 따라 각 문서에 독립적으로 점수를 매깁니다. 리스트 기반 재순위 지정은 전체 후보 집합에서 문서의 상대적 관련성을 파악함으로써 더 높은 정확도를 달성합니다.
API에서 지원하는 컨텍스트 길이가 모델의 최대 용량과 다른 이유는 무엇입니까?
keyboard_arrow_down
일부 재정렬 모델은 아키텍처적으로 더 긴 컨텍스트 길이를 처리할 수 있지만, 추론 인프라의 GPU 메모리 제약으로 인해 API에서 더 낮은 제한을 적용할 수 있습니다. 매우 긴 시퀀스를 처리하려면 상당한 메모리가 필요하며, 대부분의 사용 사례에 대해 처리량, 지연 시간 및 비용의 균형을 맞추도록 서비스 구성을 최적화했습니다. 더 긴 컨텍스트 길이에 대한 지원이 필요한 경우, 구체적인 배포 옵션에 대해 논의하려면 영업팀에 문의하십시오.
Reranker API의 사용량 제한은 얼마인가요?
keyboard_arrow_down
API 키 유형에 따라 요청 제한이 다릅니다.

무료 버전: 100 RPM, 10만 TPM, 동시 요청 2개
유료 버전: 500 RPM, 200만 TPM, 동시 요청 50개
프리미엄 버전: 5,000 RPM, 5천만 TPM, 동시 요청 500개

또한, IP 기반 요청 제한으로 60초당 1만 건의 요청이 적용됩니다. 이러한 요청 제한은 임베딩 API와 리랭커 API에도 적용됩니다.
API 관련 FAQ
code
Reader, Embedding, Reranker, Classifier 및 Fine-Tuned Model API에 동일한 API 키를 사용할 수 있습니까?
keyboard_arrow_down
예. Jina AI의 모든 검색 기반 제품에 동일한 API 키가 작동합니다. 여기에는 모든 서비스 간에 토큰이 공유되는 Reader, Embedding, Reranker, Classifier 및 Fine-Tune Model API가 포함됩니다.
code
API 키의 토큰 사용량을 볼 수 있나요?
keyboard_arrow_down
예, 키 및 청구 탭에 API 키를 입력하면 최근 토큰 사용량과 남은 토큰 잔액을 볼 수 있습니다. API 키 제어판에 로그인한 경우 API 키 관리 탭에서도 이러한 세부정보를 볼 수 있습니다.
code
API 키를 잊어버린 경우 어떻게 해야 합니까?
keyboard_arrow_down
재충전 키를 분실하여 되찾고 싶으신 경우 등록된 이메일을 사용하여 jina.ai 지원팀에 문의해 도움을 받으세요. API Key의 안전한 보관과 손쉬운 접근을 위해 로그인을 권장합니다.
문의하기
code
API 키가 만료되나요?
keyboard_arrow_down
아니요, API 키에는 만료일이 없습니다. 그러나 키가 손상되었다고 의심되어 이를 비활성화하려는 경우 지원 팀에 문의하여 도움을 받으십시오. API 키 제어판에서 키를 자체 폐기할 수도 있습니다.
문의하기
code
API 키 간에 토큰 잔액을 전송할 수 있나요?
keyboard_arrow_down
예, 한 프리미엄 키에서 다른 프리미엄 키로 남은 유료 토큰 잔액을 이전할 수 있습니다. API 키 제어판에서 계정에 로그인한 후 키 설정 인터페이스로 이동하세요. 유료 토큰 잔액.
code
내 API 키를 파기할 수 있나요?
keyboard_arrow_down
예. API 키가 손상되었다고 생각되면 파기할 수 있습니다. 키를 파기하면 이를 저장한 모든 사용자에 대해 키가 즉시 비활성화되며, 남아 있는 모든 토큰 잔액 및 관련 자산은 영구적으로 사용할 수 없게 됩니다. 프리미엄 키가 있는 경우, 소각하기 전에 남은 유료 토큰 잔액을 다른 키로 이전하도록 선택할 수 있습니다. 이 작업은 취소할 수 없습니다. 키를 파기하려면 API 키 대시보드의 키 설정으로 이동하세요.
code
일부 모델을 처음 요청할 때 속도가 느린 이유는 무엇입니까?
keyboard_arrow_down
이는 서버리스 아키텍처가 사용량이 낮을 때 특정 모델을 오프로드하기 때문입니다. 초기 요청은 모델을 활성화하거나 "준비"하는데 몇 초 정도 걸릴 수 있습니다. 초기 활성화 후 후속 요청은 훨씬 빠르게 처리됩니다.
code
제 API 데이터가 모델 학습에 사용되었나요?
keyboard_arrow_down
아니요. 저희는 귀하의 API 요청, 입력 또는 출력을 임베딩 모델, 재정렬 모델 또는 기타 어떤 모델 학습에도 사용하지 않습니다. 귀하의 데이터는 항상 귀하의 소유입니다. 저희는 SOC 2 Type I 및 Type II 표준을 준수합니다.
code
Jina API의 사용량 제한은 얼마인가요?
keyboard_arrow_down
각 API 키에는 다음과 같은 요청 제한이 있습니다.

무료 버전: 100 RPM, 100K TPM, 동시 요청 2개
유료 버전: 500 RPM, 2M TPM, 동시 요청 50개
프리미엄 버전: 5,000 RPM, 50M TPM, 동시 요청 500개

또한, IP 기반 요청 제한으로 60초당 10,000건의 요청이 적용됩니다. 이러한 제한은 모든 Jina API(내장 API, 주문 재정렬 API, 리더 API 등)에 적용됩니다.
code
API에 배치 크기 제한이 있나요?
keyboard_arrow_down
임베딩 API와 리랭커 API 모두 배치 크기 제한이 없습니다. 필요에 따라 요청당 원하는 만큼의 항목이나 문서를 전송할 수 있습니다. 두 API 모두 최적의 GPU 활용을 위해 토큰 수를 기준으로 입력을 내부적으로 배치 처리합니다.
청구 관련 자주 묻는 질문
attach_money
API 요금은 문장 수나 요청 수에 따라 청구되나요?
keyboard_arrow_down
우리의 가격 모델은 처리된 총 토큰 수를 기반으로 하므로 사용자는 이러한 토큰을 원하는 수의 문장에 유연하게 할당할 수 있으며 다양한 텍스트 분석 요구에 맞는 비용 효율적인 솔루션을 제공합니다.
attach_money
신규 사용자가 무료 평가판을 받을 수 있나요?
keyboard_arrow_down
저희는 신규 사용자를 대상으로 무료 체험판을 제공하는데, 여기에는 모든 모델에서 사용할 수 있는 1,000만 개의 토큰이 포함되어 있으며, 자동 생성된 API 키를 통해 교환할 수 있습니다. 무료 토큰을 모두 사용하면 사용자는 "토큰 구매" 탭을 통해 API 키와 함께 사용할 추가 토큰을 쉽게 구매할 수 있습니다.
attach_money
실패한 요청에 대해 토큰이 차감되나요?
keyboard_arrow_down
아니요, 실패한 요청에 대해서는 토큰이 차감되지 않습니다.
attach_money
어떤 결제 방법이 허용되나요?
keyboard_arrow_down
결제는 Stripe을 통해 처리되며 귀하의 편의를 위해 신용 카드, Google Pay, PayPal을 포함한 다양한 결제 방법을 지원합니다.
attach_money
Ci Yuan 구매 후 송장을 발행할 수 있나요?
keyboard_arrow_down
예, 토큰을 구매한 후 Stripe 계정과 연결된 이메일 주소로 청구서가 전송됩니다.
Deep Search에 대한 자주 묻는 질문
심층 검색이란?
keyboard_arrow_down
Deep Search는 쿼리에 대한 정확한 답을 찾거나 토큰 예산 한도에 도달할 때까지 반복적인 검색, 읽기, 추론을 수행하는 대규모 모델 API입니다.
Deep Search는 OpenAI와 Gemini의 심층 연구 기능과 어떻게 다릅니까?
keyboard_arrow_down
OpenAI와 Gemini와는 달리 DeepSearch는 긴 기사를 생성하는 것보다 반복 작업을 통해 정확한 답변을 제공하는 데 중점을 둡니다. 이 기능은 포괄적인 보고서를 만드는 것이 아니라, 심층적인 웹 검색에서 빠르고 정확한 답변을 제공하는 데 최적화되어 있습니다.
DeepResearch를 사용하려면 어떤 API 키가 필요한가요?
keyboard_arrow_down
Jina API 키가 필요합니다. 새로운 API 키에 대해 1,000만 개의 무료 토큰을 제공합니다.
심층 검색이 토큰 예산에 도달하면 어떻게 되나요? 불완전한 답변이 반환되나요?
keyboard_arrow_down
단순히 포기하거나 불완전한 답변을 반환하는 것이 아니라, 축적된 모든 지식을 토대로 최종 답변을 생성합니다.
심층 검색을 통해 답변의 정확성을 보장할 수 있나요?
keyboard_arrow_down
아니요. 정확도를 높이기 위해 반복적인 검색 프로세스를 사용하지만, 평가 결과 시험 문제에서 통과율 75%를 달성하는 것으로 나타났습니다. 이는 0% 기준선(gemini-2.0-flash)보다 상당히 높지만 완벽하지는 않습니다.
일반적으로 심층 검색을 수행하는 데 얼마나 걸리나요?
keyboard_arrow_down
단계 수는 매우 다양합니다. 평가 데이터에 따르면 쿼리는 1~42단계로 구성될 수 있으며 평균적으로 4단계가 소요됩니다. 20초입니다. 간단한 질문은 빠르게 해결될 수 있지만, 복잡한 연구 질문은 여러 번 반복해야 하며 최대 120초가 걸릴 수 있습니다.
Deep Search는 Chatwise, CherryStudio, ChatBox와 같은 OpenAI 호환 클라이언트와 함께 작동합니까?
keyboard_arrow_down
네, deepsearch.jina.ai/v1/chat/completions에 있는 공식 Deep Search API는 모델 이름으로 "jina-deepsearch-v1"을 사용하여 OpenAI API 아키텍처와 완벽하게 호환됩니다. 따라서 OpenAI에서 Deep Search로 전환하고 로컬 클라이언트나 OpenAI 호환 클라이언트와 함께 사용하는 것이 매우 쉽습니다. 원활한 고객 경험을 위해 Chatwise를 적극 추천합니다.
API의 속도 제한은 무엇입니까?
keyboard_arrow_down
속도 제한은 API 키 계층에 따라 다르며 10RPM에서 30RPM까지입니다. 이는 쿼리가 많은 애플리케이션에 중요합니다.
태그 안에는 무엇이 들어있나요?
keyboard_arrow_down
심층 검색은 생각의 단계를 XML 태그 ...로 묶은 다음 OpenAI 흐름 형식을 따르지만 생각의 사슬을 표현하기 위해 이러한 특수 태그를 사용하여 최종 답변을 제공합니다.
Deep Search는 웹 검색과 읽기에 Jina Reader를 사용합니까?
keyboard_arrow_down
예. 지나 리더는 웹 페이지 검색 및 읽기에 사용되며, 시스템이 웹 페이지 콘텐츠에 효율적으로 접근하여 처리할 수 있는 기능을 제공합니다.
심층 검색에서 내 쿼리에 대해 왜 그렇게 많은 태그를 사용하나요?
keyboard_arrow_down
네, 복잡한 쿼리에서 Deep Search의 토큰 사용량은 평균 70,000토큰으로, 기본 대형 모델 응답의 500토큰과 비교했을 때 상당히 높습니다. 이는 연구의 심도를 보여주지만, 비용에도 영향을 미칩니다.
걸음 수를 조절하거나 제한할 수 있는 방법이 있나요?
keyboard_arrow_down
이 시스템은 단계의 개수보다는 주로 예산이라는 단어에 의해 제어됩니다. 단어 단위 예산을 초과하면 시스템은 최종 답변을 생성하기 위해 Beast 모드로 전환됩니다. 자세한 내용은 reasoning_effort를 참조하세요.
답변에 나와 있는 참고문헌은 얼마나 신뢰할 수 있나요?
keyboard_arrow_down
참고문헌은 매우 중요하며, 답변이 명확한 것으로 간주되지만 참고문헌이 부족한 경우 시스템은 답변을 수락하지 않고 검색을 계속합니다.
심층 검색을 통해 미래 이벤트에 대한 질문을 처리할 수 있나요?
keyboard_arrow_down
네, 하지만 많은 조사가 필요합니다. "2028년 대통령은 누구일까"라는 사례는 여러 차례의 연구 반복을 통해 추측적 의문을 처리하는 것이 가능함을 보여주지만, 이러한 예측의 정확성을 보장할 수는 없습니다.
분류자에 대해 자주 묻는 질문(FAQ)
제로 샘플 레이블과 작은 샘플 레이블의 차이점은 무엇입니까?
keyboard_arrow_down
제로 샷 분류에는 의미 체계 라벨이 필요하지만 훈련 중에는 필요하지 않으며, 소수 샷 분류에는 훈련 중에 레이블이 필요하지만 분류 중에는 필요하지 않습니다. 이는 제로샷 분류가 유연하고 즉각적인 분류 요구에 더 적합한 반면, 퓨샷 분류는 시간이 지남에 따라 발전할 수 있는 고정된 도메인별 범주에 더 적합하다는 것을 의미합니다.
num_iters는 무엇을 위해 사용되며 어떻게 사용합니까?
keyboard_arrow_down
num_iters는 훈련 강도를 제어합니다. 값이 높을수록 중요한 예가 강조되고 값이 낮을수록 신뢰성이 떨어지는 데이터의 영향이 최소화됩니다. 최근 예제에 더 많은 반복 횟수를 제공하여 시간 인식 학습을 달성하는 데 사용할 수 있으므로 데이터 패턴을 발전시키는 데 유용합니다.
공개 분류자 공유는 어떻게 작동하나요?
keyboard_arrow_down
classifier_id가 있는 사람은 누구나 공개 분류자를 사용하고 자신의 토큰 할당량을 사용할 수 있습니다. 사용자는 교육 데이터 또는 구성에 액세스할 수 없으며 다른 사람의 분류 요청을 볼 수 없으므로 안전한 분류자 공유가 가능합니다.
소규모 표본 연구가 제대로 작동하려면 얼마나 많은 데이터가 필요합니까?
keyboard_arrow_down
소수의 샘플이 제로샷 분류를 능가하려면 200-400개의 훈련 샘플이 필요합니다. 결국 더 높은 정확도를 달성하게 되지만 효과적이려면 이 준비 기간이 필요합니다. 제로샷은 훈련 데이터 없이도 일관된 성능을 제공합니다.
여러 언어와 텍스트/이미지를 처리할 수 있나요?
keyboard_arrow_down
예, API는 `jina-embeddings-v3`를 사용한 다국어 쿼리와 `jina-clip-v2` 또는 `jina-embeddings-v4`를 사용한 멀티모달(텍스트/이미지) 분류를 지원하며, 동일한 요청에서 URL 인코딩 또는 base64 인코딩된 이미지를 사용할 수 있습니다.
내가 알아야 할 엄격한 제한은 무엇입니까?
keyboard_arrow_down
제로샷은 분류자 제한 없이 256개 카테고리를 지원하는 반면, 퓨샷은 16개 카테고리와 16개 분류자로 제한됩니다. 둘 다 요청당 1,024개의 입력과 입력당 8,192개의 토큰을 지원합니다.
시간이 지남에 따라 데이터 변경 사항을 어떻게 처리합니까?
keyboard_arrow_down
소수 샘플 패턴을 사용하면 /train 엔드포인트를 통해 지속적인 업데이트를 통해 변화하는 데이터 패턴에 적응할 수 있습니다. 데이터 분포가 변경되면 전체 분류기를 다시 구축하지 않고도 새로운 예시나 카테고리를 점진적으로 추가할 수 있습니다.
훈련 데이터를 보낸 후에는 어떻게 되나요?
keyboard_arrow_down
API는 일회성 온라인 학습을 사용합니다. 훈련 예제는 분류기 가중치를 업데이트하지만 나중에 저장되지는 ​​않습니다. 즉, 과거 훈련 데이터를 검색할 수는 없지만 개인정보 보호와 리소스 효율성은 보장됩니다.
제로 샘플과 작은 샘플 - 언제 어느 것을 사용해야 합니까?
keyboard_arrow_down
의미 체계 레이블을 사용하여 유연한 분류가 필요한 경우 즉각적인 결과를 얻으려면 0개의 샘플로 시작하세요. 200~400개의 예시가 있거나 더 높은 정확도가 필요하거나 도메인별/시간에 민감한 데이터를 처리해야 하는 경우 몇 가지 샘플로 전환하세요.
언어/작업별로 다른 모델을 사용할 수 있나요?
keyboard_arrow_down
네, 텍스트 분류(특히 다국어에 적합)에는 jina-embeddings-v3, 멀티모달 분류(89개 언어 지원)에는 jina-clip-v2, 일반적인 멀티모달 및 다국어 분류에는 jina-embeddings-v4 중에서 선택하실 수 있습니다.
세그먼트화기에 대해 자주 묻는 질문
슬라이서 비용은 얼마입니까?
keyboard_arrow_down
슬라이서는 무료로 사용할 수 있습니다. API 키를 제공하면 더 높은 요금 한도에 액세스할 수 있으며 키에 요금이 청구되지 않습니다.
API 키를 제공하지 않는 경우 속도 제한은 어떻게 됩니까?
keyboard_arrow_down
API 키가 없으면 20RPM 속도 제한으로 슬라이서에 액세스할 수 있습니다.
API 키를 제공하는 경우 비율 제한은 어떻게 됩니까?
keyboard_arrow_down
API 키를 사용하면 200RPM 속도 제한으로 슬라이서에 액세스할 수 있습니다. 프리미엄 유료 사용자의 경우 속도 제한은 1000RPM입니다.
내 API 키로 토큰을 청구하나요?
keyboard_arrow_down
아니요. API 키는 더 높은 비율 제한에 액세스하는 데에만 사용됩니다.
슬라이서는 여러 언어를 지원합니까?
keyboard_arrow_down
예, 슬라이서는 다국어이며 100개 이상의 언어를 지원합니다.
GET 요청과 POST 요청의 차이점은 무엇입니까?
keyboard_arrow_down
GET 요청은 텍스트의 토큰 수를 계산하는 데만 사용되므로 이를 애플리케이션에 카운터로 쉽게 통합할 수 있습니다. POST 요청은 첫 번째/마지막 N 토큰 반환과 같은 더 많은 매개변수와 기능을 지원합니다.
요청당 분할할 수 있는 최대 단어 길이는 얼마입니까?
keyboard_arrow_down
요청당 최대 64,000자를 보낼 수 있습니다.
다이싱 기능은 어떻게 작동하나요? 시맨틱 다이싱인가요?
keyboard_arrow_down
타일 ​​기능은 긴 문서를 일반적인 구조적 단서에 따라 작은 덩어리로 분할하여 텍스트가 의미 있는 덩어리로 정확하게 분할되도록 합니다. 본질적으로 이는 일반적으로 의미 경계(예: 문장 끝, 단락 구분 기호, 구두점 및 특정 접속사)와 일치하는 특정 구문 기능을 기반으로 텍스트를 분할하는 (큰!) 정규식 패턴입니다. 의미론적 다이싱이 아닙니다. 이 (큰) 정규식은 정규식의 한계 내에서 최대한 강력합니다. 복잡성과 성능의 균형을 유지합니다. 정규식은 진정한 의미론적 이해를 얻을 수는 없지만 일반적인 구조적 단서를 통해 컨텍스트에 대한 좋은 근사치를 제공할 수 있습니다.
토크나이저에서 `endoftext`와 같은 특수 토큰을 처리하는 방법은 무엇입니까?
keyboard_arrow_down
입력에 특수 토큰이 포함된 경우, 토크나이저가 이를 `special_tokens` 필드에 입력합니다. 이렇게 하면 특수 토큰을 쉽게 식별하고 후속 작업에서 적절하게 처리할 수 있습니다. 예를 들어, 텍스트를 대형 모델에 입력하기 전에 토큰을 제거하여 주입 공격을 방지할 수 있습니다.
청킹은 영어 이외의 언어도 지원하나요?
keyboard_arrow_down
청킹 기술은 서양 언어 외에도 중국어, 일본어, 한국어에도 적용됩니다.
자체 튜닝에 관해 자주 묻는 질문(FAQ)
API를 미세 조정하는 데 비용이 얼마나 드나요?
keyboard_arrow_down
이 기능은 현재 베타 버전이며, 미세 조정된 모델 하나당 100만 토큰이 필요합니다. Embedding/Reranker API에 충분한 토큰이 있으면 기존 API 키를 사용하거나 1,000만 개의 무료 토큰이 포함된 새 키를 만들 수 있습니다.
무엇을 입력해야 합니까? 훈련 데이터를 제공해야 합니까?
keyboard_arrow_down
학습 데이터를 제공할 필요가 없습니다. 대상 도메인(미세 조정된 벡터 모델을 최적화하려는 도메인)을 자연어로 설명하거나 URL을 참조로 사용하기만 하면 당사 시스템이 모델 학습을 위한 합성 데이터를 생성합니다.
모델을 미세 조정하는 데 시간이 얼마나 걸리나요?
keyboard_arrow_down
약 30분.
미세 조정된 모델은 어디에 저장되나요?
keyboard_arrow_down
미세 조정된 모델과 합성 데이터는 Hugging Face Model Center에 공개적으로 저장됩니다.
참조 URL을 제공하면 시스템에서 이를 어떻게 사용합니까?
keyboard_arrow_down
시스템은 Reader API를 사용하여 URL에서 콘텐츠를 가져옵니다. 그런 다음 내용을 분석하여 어조와 영역을 요약하고 종합 데이터를 생성하기 위한 지침으로 사용했습니다. 따라서 URL은 공개적으로 액세스할 수 있어야 하며 대상 도메인을 나타내야 합니다.
특정 언어에 맞게 모델을 미세 조정할 수 있나요?
keyboard_arrow_down
예, 영어가 아닌 언어에 맞게 모델을 미세 조정할 수 있습니다. 시스템은 도메인 명령의 언어를 자동으로 감지하고 그에 따라 합성 데이터를 생성합니다. 또한 대상 언어에 적합한 기본 모델을 선택하는 것이 좋습니다. 예를 들어 독일 도메인을 대상으로 하는 경우 "jina-embeddings-v2-base-de"를 기본 모델로 선택해야 합니다.
bge-M3와 같은 Jina가 아닌 벡터 모델을 미세 조정할 수 있나요?
keyboard_arrow_down
아니요. 미세 조정 API는 Jina v2 모델만 지원합니다.
미세 조정된 모델의 품질을 보장하는 방법은 무엇입니까?
keyboard_arrow_down
미세 조정 프로세스가 끝나면 유지 테스트 세트를 사용하여 모델이 평가되고 성능 지표가 보고됩니다. 이 테스트 세트의 성능 전후에 대해 자세히 설명하는 이메일을 받게 됩니다. 또한 품질을 보장하기 위해 자체 테스트 세트에서 모델을 평가하는 것이 좋습니다.
합성 데이터를 생성하는 방법은 무엇입니까?
keyboard_arrow_down
이 시스템은 사용자가 제공한 타겟 도메인 명령어와 대규모 모델 에이전트의 추론을 결합하여 합성 데이터를 생성합니다. 이 알고리즘은 고품질 벡터 기반 모델을 훈련하는 데 중요한 까다로운 트리플릿을 생성합니다. 자세한 내용은 Arxiv에 게시될 예정인 연구 논문을 참조하세요.
미세 조정된 모델과 합성 데이터를 비공개로 유지할 수 있나요?
keyboard_arrow_down
지금은 아무것도 없다. 이 기능은 아직 베타 버전입니다. Hugging Face Model Center에 미세 조정된 모델과 합성 데이터를 공개적으로 저장하면 우리와 커뮤니티가 교육 품질을 평가하는 데 도움이 됩니다. 앞으로는 개인 저장소 옵션을 제공할 계획입니다.
미세 조정된 모델을 사용하는 방법은 무엇입니까?
keyboard_arrow_down
미세 조정된 모든 모델은 이미 Hugging Face에 업로드되어 있으므로 SentenceTransformers를 통해 액세스하려면 모델 이름만 지정하면 됩니다.
평가 결과가 포함된 이메일을 받은 적이 없습니다. 나는 무엇을 해야 합니까?
keyboard_arrow_down
스팸 폴더를 확인해 보세요. 그래도 찾을 수 없으면 제공한 이메일 주소를 사용하여 지원팀에 문의하세요.
문의하기
사무실
location_on
캘리포니아주 서니베일
710 Lakeway Dr, Ste 200, Sunnyvale, California 94085, United States
location_on
베를린, 독일
Prinzessinnenstraße 19-20, 10969 베를린, 독일
검색 기반
리더
벡터 모델
재배열자
Jina API 키 받기
비율 제한
API 상태
회사
회사 소개
영업팀에 문의
소식
인턴십 프로그램
지나 로고 다운로드
open_in_new
Elastic 로고 다운로드
open_in_new
자귀
안전
이용약관
은둔
쿠키 관리
email
탄력적인 지나 AI © 2020-2026.