리더
URL을 대규모 모델 친화적인 입력으로 변환하려면 앞에
r.jina.ai를 추가하기만 하면 됩니다.리더 API
URL을 대규모 모델 친화적인 입력으로 변환하려면 앞에
r.jina.ai를 추가하기만 하면 됩니다.chevron_leftchevron_right
globe_book
r.jina.ai를 사용하여 URL을 읽고 해당 내용을 가져옵니다.travel_explore
s.jina.ai로 웹을 검색하고 SERP를 얻으세요콘텐츠 형식
과도한 필터링을 방지하기 위해 응답의 세부 정보 수준을 제어할 수 있습니다. 기본 파이프라인은 대부분의 사이트와 대규모 모델 입력에 맞게 최적화되어 있습니다.
기본
arrow_drop_down
JSON 응답
응답은 JSON 형식이며 URL, 헤더, 콘텐츠 및 타임스탬프(사용 가능한 경우)를 포함합니다. 검색 모드에서는 각각 설명된 JSON 구조를 따르는 5개의 항목 목록을 반환합니다.
타임아웃(초)
페이지 로딩 최대 대기 시간입니다. 페이지 로딩 속도가 느린 경우 이 값을 늘리고, 단순하고 정적인 페이지의 경우 이 값을 줄이세요.
토큰예산
이 요청에 사용되는 최대 토큰 수를 제한합니다. 이 제한을 초과하면 요청이 실패하게 됩니다.
ReaderLM-v2 사용
실험
ReaderLM-v2를 사용하여 HTML을 Markdown으로 변환하면 구조와 콘텐츠가 복잡한 웹 사이트에 고품질 결과를 제공할 수 있습니다. 다른 엔진보다 3배 더 많은 토큰을 소모합니다!open_in_new더 알아보기
(CSS 선택자만) 추출
다음 CSS 선택자와 일치하는 콘텐츠만 추출하세요. 예: article, .main-content, #post-body
대기 중 (CSS 선택기)
이러한 요소들이 나타난 후에만 콘텐츠를 추출하세요. 이는 동적으로 로드되는 콘텐츠에 매우 유용합니다.
제외(CSS 선택기)
추출하기 전에 내비게이션 바, 푸터, 사이드바 및 #광고 요소를 제거해 주세요.
모든 사진 삭제
출력에서 모든 이미지를 제거합니다. 이렇게 하면 이미지가 필요하지 않을 때 토큰 사용량을 줄일 수 있습니다.
OpenAI 인용 형식
OpenAI 웹 브라우징 도구에 맞는 링크 형식을 지정하세요. GPT 모델과 호환되는 특수 참조 태그를 사용하세요.open_in_new더 알아보기
링크 요약 섹션
마지막으로 "버튼 및 링크" 섹션이 생성됩니다. 이는 다운스트림의 대규모 모델이나 웹 에이전트가 페이지를 탐색하거나 추가 작업을 수행하는 데 도움이 될 수 있습니다.
없음
arrow_drop_down
이미지 요약 섹션
마지막으로 "그림" 섹션이 생성됩니다. 이를 통해 다운스트림의 대규모 모델이 페이지의 모든 시각적 요소를 살펴볼 수 있어 추론 능력이 향상됩니다.
없음
arrow_drop_down
브라우저 뷰포트 크기
POST
브라우저 창 크기를 설정합니다. 반응형 레이아웃 및 콘텐츠 표시 여부에 영향을 미칩니다.open_in_new더 알아보기
쿠키 전달
당사의 API 서버는 URL에 액세스할 때 사용자 정의 쿠키 설정을 전달할 수 있으며 이는 추가 인증이 필요한 페이지에 유용합니다. 쿠키가 포함된 요청은 캐시되지 않습니다.open_in_new더 알아보기
설명하다
지정된 URL에 있는 모든 이미지에 캡션을 추가하고, 캡션이 없는 이미지에 "이미지 [idx]: [캡션]"을 alt 태그로 추가합니다. 이를 통해 대규모 다운스트림 모델은 추론 및 요약과 같은 활동 중에 이미지와 상호 작용할 수 있습니다.
프록시 서버 사용
당사의 API 서버는 귀하의 프록시를 활용하여 URL에 액세스할 수 있는데, 이는 특정 프록시를 통해서만 액세스할 수 있는 페이지에 유용합니다.open_in_new더 알아보기
국가별 프록시 서버를 사용하세요
위치 기반 프록시 서버의 국가 코드를 설정합니다. 최적의 선택을 위해 자동을 사용하거나 비활성화하려면 없음을 선택하세요.
캐싱 우회
당사의 API 서버는 일정 기간 동안 읽기 및 검색 모드를 위해 콘텐츠를 캐시합니다. 이 캐시를 우회하려면 이 헤더를 true로 설정하세요.
캐시 오류 허용 시간(초)
캐시된 콘텐츠가 N초 이내에 게시된 경우 캐시된 콘텐츠가 허용됩니다. 값을 0으로 설정하면 최신 콘텐츠를 허용하는 것(캐시를 무시하는 것과 동일)이며, 더 높은 값으로 설정하면 캐시에서 더 빠른 응답을 가져올 수 있습니다.
페이지 준비 시간
페이지가 완전히 로드된 것으로 간주되는 시점은 언제인가요? 후자의 타이밍 측정 방식은 시간이 더 오래 걸리지만 더 많은 동적 콘텐츠를 포착합니다.
기본
arrow_drop_down
사용자 지정 사용자 에이전트
브라우저 사용자 에이전트 문자열을 재정의합니다. 특정 브라우저를 필요로 하거나 웹 크롤러를 차단하는 웹사이트에 접속할 때 매우 유용합니다.
맞춤형 추천
HTTP Referer 헤더를 설정하세요. 일부 웹사이트는 트래픽이 예상한 출처에서 왔는지 확인하기 위해 이 헤더를 확인합니다.
Base64 이미지 저장
인라인으로 삽입된 base64 인코딩 이미지를 외부 URL로 변환하는 대신, 마크다운 출력에 그대로 유지하세요.
캐시 또는 추적을 하지 마세요.
이 요청이 서버에 캐시되거나 로그되지 않도록 방지합니다. 민감한 URL에만 적용됩니다.
Github 스타일 마크다운
GFM(Github Flavored Markdown) 기능을 옵트인/아웃합니다.
활성화됨
arrow_drop_down
스트리밍 모드
스트리밍 모드는 더 큰 대상 페이지를 지원하므로 페이지가 완전히 렌더링되는 데 더 많은 시간을 허용합니다. 표준 모드로 인해 콘텐츠가 불완전한 경우 스트리밍 모드 사용을 고려해 보세요.open_in_new더 알아보기
브라우저 로케일 사용자 지정
페이지 렌더링을 위한 브라우저 로캘 설정을 제어합니다. 많은 웹사이트는 로캘 설정에 따라 다양한 콘텐츠를 제공합니다.open_in_new더 알아보기
로봇을 존중하세요.txt
리소스를 스크래핑하기 전에 robots.txt 파일의 규칙을 확인하십시오. 검사할 로봇의 이름을 지정하십시오.
iframe 콘텐츠 포함
내장된 iframe에서 콘텐츠를 추출합니다. 이 기능은 페이지 콘텐츠가 iframe 내에 로드된 경우에만 사용할 수 있습니다.
Shadow DOM이 포함됩니다.
Shadow DOM 컴포넌트에서 콘텐츠를 추출합니다. 웹 컴포넌트를 사용하는 페이지에 적합합니다.
최종 URL을 기준으로 삼으세요.
상대 URL을 해석할 때는 원래 URL이 아닌 리디렉션 후 최종 대상 URL을 사용하십시오.
로컬 PDF/HTML 파일
POST
리더를 사용하여 로컬 PDF 및 HTML 파일을 업로드하여 읽습니다. pdf 및 html 파일만 지원됩니다.
upload
추출 전에 JavaScript를 실행하세요
POST
콘텐츠를 추출하기 전에 사용자 지정 JavaScript 코드를 실행하여 페이지를 수정하세요. 이 코드는 인라인 코드이거나 스크립트 파일을 가리키는 URL일 수 있습니다.open_in_new더 알아보기
제목 스타일
마크다운 제목 형식을 설정합니다(Turndown에 전달됨).
해시 스타일
arrow_drop_down
수평선 스타일
마크다운 수평 획 형식을 정의합니다(Turndown에 전달됨).
총알 스타일
글머리 기호 목록 표시 문자를 설정합니다(Turndown에 전달됨).
*
arrow_drop_down
스타일 강조
마크다운 강조 구분 기호를 정의합니다(Turndown에 전달됨).
_
arrow_drop_down
스타일 강조
마크다운 강조 구분 기호를 설정합니다(Turndown에 전달됨).
**
arrow_drop_down
링크 스타일
마크다운 링크 형식을 결정합니다(Turndown에 전달됨).
인라인
arrow_drop_down
EU 규정을 준수합니다
실험
모든 인프라와 데이터 처리 작업은 전적으로 EU 관할권 내에 있습니다.
upload
묻다
GET
Bash
언어
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
API 키
visibility_off
남은 토큰 금액
0
Jina VLM: 소규모 다국어 시각 언어 모델
24억 개의 매개변수를 가진 시각 언어 모델이 개방형 20억 개 매개변수 시각 언어 모델 내에서 최첨단 다국어 시각 질의응답 성능을 달성했습니다.
ReaderLM v2: HTML에서 Markdown 및 JSON까지의 작은 언어 모델
ReaderLM-v2는 HTML에서 Markdown으로의 변환과 HTML에서 JSON으로의 추출을 위해 특별히 설계된 1.5B 매개변수 언어 모델입니다. 29개 언어로 최대 512K 토큰의 문서를 지원하며 이전 버전보다 20% 더 정확합니다.
더 큰 모델에 네트워크 정보를 공급하는 것은 좋은 기반을 구축하는 데 중요한 단계이지만, 어려울 수도 있습니다. 가장 쉬운 방법은 웹 페이지를 스크래핑하여 원시 HTML을 입력하는 것입니다. 그러나 크롤링은 복잡하고 종종 차단될 수 있으며, 원시 HTML은 태그 및 스크립트와 같은 불필요한 요소로 가득 차 있습니다. Reader API는 URL에서 핵심 내용을 추출하고 이를 깔끔하고 큰 모델 친화적 텍스트로 변환하여 이러한 문제를 해결하며, 이를 통해 Agent 및 RAG 시스템에 고품질 입력을 보장합니다.
URL을 입력하세요
독자 URL
원시 HTML
리더 출력
질문하기
Reader는 SERP API 역할을 합니다. 검색 엔진 결과의 콘텐츠를 LLM에 입력할 수 있습니다. 쿼리 앞에
https://s.jina.ai/?q=를 추가하기만 하면 Reader가 웹을 검색하여 상위 5개 결과와 URL, 콘텐츠를 표시해 줍니다. 각 결과는 깔끔하고 빅 모델 친화적인 텍스트로 표시됩니다. 이렇게 하면 빅 모델을 항상 최신 상태로 유지하여 신뢰성을 높이고 오해를 줄일 수 있습니다.쿼리를 입력하세요
독자 URL
info 위의 설명과는 달리, 실제로는 원래 질문의 근거를 알아내기 위해 웹을 검색하지 않습니다. 사람들이 종종 하는 일은 원래 문제를 다시 쓰거나 멀티홉 문제를 사용하는 것입니다. 그들은 검색된 결과를 읽고 필요에 따라 추가 쿼리를 생성하여 더 많은 정보를 수집한 후 최종 답에 도달합니다.
웹상의 이미지에는 리더의 시각 언어 모델을 사용하여 자동으로 캡션이 붙고, 출력물에서는 이미지 alt 태그로 포맷됩니다. 이는 다운스트림의 대규모 모델이 이러한 그림을 추론 및 요약 프로세스에 통합하는 데 충분한 힌트를 제공합니다. 즉, 이미지에 대한 질문을 하고, 특정 이미지를 선택하고, 심지어 심층 분석을 위해 더욱 강력한 VLM에 URL을 전달할 수도 있습니다!
네, Reader는 기본적으로 PDF 읽기를 지원합니다. 많은 이미지가 포함된 PDF를 포함한 대부분의 PDF와 호환되며 놀라울 정도로 빠릅니다! 대규모 모델과 결합하면 ChatPDF나 문서 분석 AI를 쉽고 빠르게 구축할 수 있습니다.
그리고 그것은 실제로 무료입니다!
Reader API는 무료로 사용할 수 있으며 유연한 요금 한도와 가격을 제공합니다. 높은 접근성, 동시성, 안정성을 갖춘 확장 가능한 인프라 기반으로 구축되었습니다. 우리는 대형 모델에 대한 고객이 선호하는 기초 솔루션이 되기 위해 노력합니다.
비율 제한
속도 제한은 세 가지 방법, 즉 RPM(분당 요청 수)과 TPM(분당 단어 수)으로 추적됩니다. 제한은 IP/API 키별로 적용되며 RPM 또는 TPM 임계값에 먼저 도달하면 트리거됩니다. 요청 헤더에 API 키를 제공하면 IP 주소 대신 키별로 요금 제한을 추적합니다.
Columns
arrow_drop_down
| 제품 | API 포트 | 설명하다arrow_upward | API 키 없음key_off | 무료 API 키key | 유료 API 키를 사용하세요key | 프리미엄 API 키와 함께 제공key | 평균 지연 | 단어 사용 횟수 | 요청 유형 | |
|---|---|---|---|---|---|---|---|---|---|---|
| 리더 API | https://r.jina.ai | URL을 큰 모델 친화적 텍스트로 변환 | 20 RPM | 500 RPM | 500 RPM | trending_up5000 RPM | 7.9s | 출력 응답의 토큰 수를 기준으로 합니다. | GET/POST | |
| 리더 API | https://s.jina.ai | 웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다. | block | 100 RPM | 100 RPM | trending_up1000 RPM | 2.5s | 각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다. | GET/POST | |
| 벡터 모델 API | https://api.jina.ai/v1/embeddings | 텍스트/이미지를 고정 길이 벡터로 변환 | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
| 재정렬 API | https://api.jina.ai/v1/rerank | 쿼리로 문서 구체화 | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
| 분류자 API | https://api.jina.ai/v1/train | 훈련 샘플을 사용하여 분류기 훈련 | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는 입력 단어 × 반복 횟수입니다. | POST | |
| 분류자 API (작은 샘플) | https://api.jina.ai/v1/classify | 훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다. | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 토큰 개수는 다음과 같습니다. 입력 토큰 | POST | |
| 분류자 API (제로 샘플) | https://api.jina.ai/v1/classify | 제로샷 분류를 사용하여 입력 분류 | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는: 입력 단어와 태그 단어입니다. | POST | |
| 분할기 API | https://api.jina.ai/v1/segment | 긴 텍스트를 단어와 문장으로 분할 | 20 RPM | 200 RPM | 200 RPM | 1,000 RPM | 0.3s | 토큰 사용은 계산되지 않습니다. | GET/POST | |
| 심층 검색 | https://deepsearch.jina.ai/v1/chat/completions | 추론하고, 검색하고, 반복하여 최상의 답을 찾으세요 | block | 50 RPM | 50 RPM | 500 RPM | 56.7s | 전체 프로세스에서 총 토큰 수를 계산합니다. | POST |
당황하지 말 것! 모든 새로운 API 키에는 1,000만 개의 무료 토큰이 포함되어 있습니다!
API 가격표
API 가격은 토큰 사용량에 따라 결정됩니다. 하나의 API 키로 모든 Search Essentials 제품에 액세스할 수 있습니다.
Reader API 사용과 관련된 비용은 얼마입니까?
keyboard_arrow_down
리더 API는 어떻게 작동하나요?
keyboard_arrow_down
리더 API는 오픈 소스인가요?
keyboard_arrow_down
Reader API의 일반적인 대기 시간은 얼마나 됩니까?
keyboard_arrow_down
페이지를 직접 스크랩하는 대신 Reader API를 사용해야 하는 이유는 무엇입니까?
keyboard_arrow_down
Reader API는 여러 언어를 지원합니까?
keyboard_arrow_down
웹사이트에서 Reader API를 차단하는 경우 어떻게 해야 합니까?
keyboard_arrow_down
Reader API가 PDF 파일에서 콘텐츠를 추출할 수 있습니까?
keyboard_arrow_down
Reader API가 웹페이지의 미디어 콘텐츠를 처리할 수 있나요?
keyboard_arrow_down
로컬 HTML 파일에서 Reader API를 사용할 수 있습니까?
keyboard_arrow_down
Reader API는 콘텐츠를 캐시합니까?
keyboard_arrow_down
로그인 후 Reader API를 사용하여 콘텐츠에 액세스할 수 있나요?
keyboard_arrow_down
Reader API를 사용하여 arXiv의 PDF에 액세스할 수 있나요?
keyboard_arrow_down
리더에서 이미지 주석이 어떻게 작동하나요?
keyboard_arrow_down
리더는 얼마나 확장 가능합니까? 이것을 프로덕션에 사용할 수 있나요?
keyboard_arrow_down
Reader API의 속도 제한은 무엇입니까?
keyboard_arrow_down
리더-LM이란? 그것을 사용하는 방법?
keyboard_arrow_down
웹 페이지에서 구조화된 데이터를 추출하는 방법은 무엇인가요?
keyboard_arrow_down
독자가 웹사이트의 봇 방지 시스템을 능동적으로 우회할까요?
keyboard_arrow_down
무료 API 키에서 유료 API 키로 업그레이드하면 더 많은 웹사이트에 접속할 수 있나요?
keyboard_arrow_down
비율 제한
속도 제한은 세 가지 방법, 즉 RPM(분당 요청 수)과 TPM(분당 단어 수)으로 추적됩니다. 제한은 IP/API 키별로 적용되며 RPM 또는 TPM 임계값에 먼저 도달하면 트리거됩니다. 요청 헤더에 API 키를 제공하면 IP 주소 대신 키별로 요금 제한을 추적합니다.
Columns
arrow_drop_down
| 제품 | API 포트 | 설명하다arrow_upward | API 키 없음key_off | 무료 API 키key | 유료 API 키를 사용하세요key | 프리미엄 API 키와 함께 제공key | 평균 지연 | 단어 사용 횟수 | 요청 유형 | |
|---|---|---|---|---|---|---|---|---|---|---|
| 리더 API | https://r.jina.ai | URL을 큰 모델 친화적 텍스트로 변환 | 20 RPM | 500 RPM | 500 RPM | trending_up5000 RPM | 7.9s | 출력 응답의 토큰 수를 기준으로 합니다. | GET/POST | |
| 리더 API | https://s.jina.ai | 웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다. | block | 100 RPM | 100 RPM | trending_up1000 RPM | 2.5s | 각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다. | GET/POST | |
| 벡터 모델 API | https://api.jina.ai/v1/embeddings | 텍스트/이미지를 고정 길이 벡터로 변환 | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
| 재정렬 API | https://api.jina.ai/v1/rerank | 쿼리로 문서 구체화 | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
| 분류자 API | https://api.jina.ai/v1/train | 훈련 샘플을 사용하여 분류기 훈련 | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는 입력 단어 × 반복 횟수입니다. | POST | |
| 분류자 API (작은 샘플) | https://api.jina.ai/v1/classify | 훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다. | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 토큰 개수는 다음과 같습니다. 입력 토큰 | POST | |
| 분류자 API (제로 샘플) | https://api.jina.ai/v1/classify | 제로샷 분류를 사용하여 입력 분류 | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는: 입력 단어와 태그 단어입니다. | POST | |
| 분할기 API | https://api.jina.ai/v1/segment | 긴 텍스트를 단어와 문장으로 분할 | 20 RPM | 200 RPM | 200 RPM | 1,000 RPM | 0.3s | 토큰 사용은 계산되지 않습니다. | GET/POST | |
| 심층 검색 | https://deepsearch.jina.ai/v1/chat/completions | 추론하고, 검색하고, 반복하여 최상의 답을 찾으세요 | block | 50 RPM | 50 RPM | 500 RPM | 56.7s | 전체 프로세스에서 총 토큰 수를 계산합니다. | POST |
API 관련 FAQ
code
Reader, Embedding, Reranker, Classifier 및 Fine-Tuned Model API에 동일한 API 키를 사용할 수 있습니까?
keyboard_arrow_down
code
API 키의 토큰 사용량을 볼 수 있나요?
keyboard_arrow_down
code
API 키를 잊어버린 경우 어떻게 해야 합니까?
keyboard_arrow_down
code
API 키가 만료되나요?
keyboard_arrow_down
code
API 키 간에 토큰 잔액을 전송할 수 있나요?
keyboard_arrow_down
code
내 API 키를 파기할 수 있나요?
keyboard_arrow_down
code
일부 모델을 처음 요청할 때 속도가 느린 이유는 무엇입니까?
keyboard_arrow_down
code
제 API 데이터가 모델 학습에 사용되었나요?
keyboard_arrow_down
code
Jina API의 사용량 제한은 얼마인가요?
keyboard_arrow_down
code
API에 배치 크기 제한이 있나요?
keyboard_arrow_down
청구 관련 자주 묻는 질문
attach_money
API 요금은 문장 수나 요청 수에 따라 청구되나요?
keyboard_arrow_down
attach_money
신규 사용자가 무료 평가판을 받을 수 있나요?
keyboard_arrow_down
attach_money
실패한 요청에 대해 토큰이 차감되나요?
keyboard_arrow_down
attach_money
어떤 결제 방법이 허용되나요?
keyboard_arrow_down
attach_money
Ci Yuan 구매 후 송장을 발행할 수 있나요?
keyboard_arrow_down


