리더
URL을 대규모 모델 친화적인 입력으로 변환하려면 앞에
r.jina.ai
를 추가하기만 하면 됩니다.리더 API
URL을 대규모 모델 친화적인 입력으로 변환하려면 앞에
r.jina.ai
를 추가하기만 하면 됩니다. chevron_leftchevron_right
globe_book
r.jina.ai
를 사용하여 URL을 읽고 해당 내용을 가져옵니다.travel_explore
s.jina.ai
로 웹을 검색하고 SERP를 얻으세요콘텐츠 형식
과도한 필터링을 방지하기 위해 응답의 세부 정보 수준을 제어할 수 있습니다. 기본 파이프라인은 대부분의 사이트와 대규모 모델 입력에 맞게 최적화되어 있습니다.
기본
arrow_drop_down
JSON 응답
응답은 JSON 형식이며 URL, 헤더, 콘텐츠 및 타임스탬프(사용 가능한 경우)를 포함합니다. 검색 모드에서는 각각 설명된 JSON 구조를 따르는 5개의 항목 목록을 반환합니다.
시간 초과
최대 페이지 로드 대기 시간(총 요청 처리 시간이 아님)
토큰예산
이 요청에 사용되는 최대 토큰 수를 제한합니다. 이 제한을 초과하면 요청이 실패하게 됩니다.
ReaderLM-v2 사용
실험
ReaderLM-v2를 사용하여 HTML을 Markdown으로 변환하면 구조와 콘텐츠가 복잡한 웹 사이트에 고품질 결과를 제공할 수 있습니다. 다른 엔진보다 3배 더 많은 토큰을 소모합니다!
CSS 선택자:만
특정 페이지 요소를 타겟으로 하는 CSS 선택기 목록입니다.
CSS 선택기: 대기
결과를 반환하기 전에 기다릴 CSS 선택기.
CSS 선택자: 제외
제거할 요소의 CSS 선택기(헤더, 푸터 등).
모든 사진 삭제
응답에서 모든 이미지를 제거하세요.
모든 링크를 끝까지 그룹화
마지막으로 "버튼 및 링크" 섹션이 생성되었습니다. 이를 통해 다운스트림의 대규모 모델이나 웹 에이전트가 페이지를 탐색하거나 추가 작업을 수행하는 데 도움이 될 수 있습니다.
없음
arrow_drop_down
마지막에 모든 사진을 모으세요
마지막으로 "그림" 섹션이 생성됩니다. 이를 통해 다운스트림의 대규모 모델이 페이지의 모든 시각적 요소를 살펴볼 수 있어 추론 능력이 향상됩니다.
없음
arrow_drop_down
쿠키 전달
당사의 API 서버는 URL에 액세스할 때 사용자 정의 쿠키 설정을 전달할 수 있으며 이는 추가 인증이 필요한 페이지에 유용합니다. 쿠키가 포함된 요청은 캐시되지 않습니다.
설명하다
지정된 URL에 있는 모든 이미지에 캡션을 추가하고, 캡션이 없는 이미지에 "이미지 [idx]: [캡션]"을 alt 태그로 추가합니다. 이를 통해 대규모 다운스트림 모델은 추론 및 요약과 같은 활동 중에 이미지와 상호 작용할 수 있습니다.
프록시 서버 사용
당사의 API 서버는 귀하의 프록시를 활용하여 URL에 액세스할 수 있는데, 이는 특정 프록시를 통해서만 액세스할 수 있는 페이지에 유용합니다.
국가별 프록시 서버를 사용하세요
위치 기반 프록시 서버의 국가 코드를 설정합니다. 최적의 선택을 위해 자동을 사용하거나 비활성화하려면 없음을 선택하세요.
캐싱 우회
당사의 API 서버는 일정 기간 동안 읽기 및 검색 모드를 위해 콘텐츠를 캐시합니다. 이 캐시를 우회하려면 이 헤더를 true로 설정하세요.
캐싱/추적하지 마세요!
이 기능을 활성화하면, 요청 결과가 서버에 캐시되지 않습니다.
Github 스타일 마크다운
GFM(Github Flavored Markdown) 기능을 옵트인/아웃합니다.
활성화됨
arrow_drop_down
스트리밍 모드
스트리밍 모드는 더 큰 대상 페이지를 지원하므로 페이지가 완전히 렌더링되는 데 더 많은 시간을 허용합니다. 표준 모드로 인해 콘텐츠가 불완전한 경우 스트리밍 모드 사용을 고려해 보세요.
로봇 정책을 엄격히 준수하세요
콘텐츠를 가져오기 전에 robots.txt와 비교하여 확인되는 로봇 사용자 에이전트를 정의합니다.
iframe 추출
DOM 트리에서 iframe에 포함된 모든 콘텐츠를 처리합니다.
Shadow DOM 추출
문서의 모든 Shadow DOM 루트에서 콘텐츠를 추출합니다.
리디렉트 페이지를 따르세요
모든 리디렉션을 따른 후 최종 도착 URL로 확인할지 여부를 선택합니다. 전체 리디렉션 체인을 따르려면 활성화하세요.
로컬 PDF/HTML 파일
POST
리더를 사용하여 로컬 PDF 및 HTML 파일을 업로드하여 읽습니다. pdf 및 html 파일만 지원됩니다.
upload
제목 스타일
마크다운 제목 형식을 설정합니다(Turndown에 전달됨).
대체 제목 구문
arrow_drop_down
수평선 스타일
마크다운 수평 획 형식을 정의합니다(Turndown에 전달됨).
총알 스타일
글머리 기호 목록 표시 문자를 설정합니다(Turndown에 전달됨).
*
arrow_drop_down
스타일 강조
마크다운 강조 구분 기호를 정의합니다(Turndown에 전달됨).
_
arrow_drop_down
스타일 강조
마크다운 강조 구분 기호를 설정합니다(Turndown에 전달됨).
**
arrow_drop_down
링크 스타일
마크다운 링크 형식을 결정합니다(Turndown에 전달됨).
인라인
arrow_drop_down
EU 규정을 준수합니다
모든 인프라와 데이터 처리 작업은 전적으로 EU 관할권 내에 있습니다.
upload
묻다
GET
Bash
언어
arrow_drop_down
curl "https://r.jina.ai/https://example.com"
key
API 키
visibility_off
남은 토큰 금액
0
ReaderLM v2: HTML에서 Markdown 및 JSON까지의 작은 언어 모델
ReaderLM-v2는 HTML에서 Markdown으로의 변환과 HTML에서 JSON으로의 추출을 위해 특별히 설계된 1.5B 매개변수 언어 모델입니다. 29개 언어로 최대 512K 토큰의 문서를 지원하며 이전 버전보다 20% 더 정확합니다.
더 큰 모델에 네트워크 정보를 공급하는 것은 좋은 기반을 구축하는 데 중요한 단계이지만, 어려울 수도 있습니다. 가장 쉬운 방법은 웹 페이지를 스크래핑하여 원시 HTML을 입력하는 것입니다. 그러나 크롤링은 복잡하고 종종 차단될 수 있으며, 원시 HTML은 태그 및 스크립트와 같은 불필요한 요소로 가득 차 있습니다. Reader API는 URL에서 핵심 내용을 추출하고 이를 깔끔하고 큰 모델 친화적 텍스트로 변환하여 이러한 문제를 해결하며, 이를 통해 Agent 및 RAG 시스템에 고품질 입력을 보장합니다.
URL을 입력하세요
독자 URL
원시 HTML
리더 출력
질문하기
Reader는 SERP API로 사용될 수 있습니다. 이를 통해 LLM에 SERP 뒤에 있는 콘텐츠를 제공할 수 있습니다. 쿼리 앞에
https://s.jina.ai/?q=
를 추가하기만 하면 Reader가 웹을 검색하여 URL과 콘텐츠가 포함된 상위 5개 결과를 반환합니다. 각 결과는 LLM에 친화적인 깔끔한 텍스트로 표시됩니다. 이렇게 하면 LLM을 항상 최신 상태로 유지하고, 신뢰성을 높이고, 오해를 줄일 수 있습니다.쿼리를 입력하세요
독자 URL
info 위의 설명과는 달리, 실제로는 원래 질문의 근거를 알아내기 위해 웹을 검색하지 않습니다. 사람들이 종종 하는 일은 원래 문제를 다시 쓰거나 멀티홉 문제를 사용하는 것입니다. 그들은 검색된 결과를 읽고 필요에 따라 추가 쿼리를 생성하여 더 많은 정보를 수집한 후 최종 답에 도달합니다.
웹상의 이미지에는 리더의 시각 언어 모델을 사용하여 자동으로 캡션이 붙고, 출력물에서는 이미지 alt 태그로 포맷됩니다. 이는 다운스트림의 대규모 모델이 이러한 그림을 추론 및 요약 프로세스에 통합하는 데 충분한 힌트를 제공합니다. 즉, 이미지에 대한 질문을 하고, 특정 이미지를 선택하고, 심지어 심층 분석을 위해 더욱 강력한 VLM에 URL을 전달할 수도 있습니다!
네, Reader는 기본적으로 PDF 읽기를 지원합니다. 많은 이미지가 포함된 PDF를 포함한 대부분의 PDF와 호환되며 놀라울 정도로 빠릅니다! 대규모 모델과 결합하면 ChatPDF나 문서 분석 AI를 쉽고 빠르게 구축할 수 있습니다.
그리고 그것은 실제로 무료입니다!
Reader API는 무료로 사용할 수 있으며 유연한 요금 한도와 가격을 제공합니다. 높은 접근성, 동시성, 안정성을 갖춘 확장 가능한 인프라 기반으로 구축되었습니다. 우리는 대형 모델에 대한 고객이 선호하는 기초 솔루션이 되기 위해 노력합니다.
비율 제한
속도 제한은 세 가지 방법으로 추적됩니다. QPS(초당 요청 수), RPM(분당 요청 수), TPM(분당 토큰 수). 유료 플랜에 관계없이 IP당 100 QPS의 고정 제한이 있으며, 이를 통해 많은 수의 동시 요청으로 인해 시스템이 과부하되는 것을 방지할 수 있습니다. 기타 제한은 IP/API 키별로 적용되며 RPM 또는 TPM 임계값에 처음 도달하면 트리거됩니다. 요청 헤더에 API 키를 제공하는 경우 IP 주소 대신 키를 기준으로 요금 제한을 추적합니다.
Columns
arrow_drop_down
제품 | API 포트 | 설명하다arrow_upward | API 키 없음key_off | API 키 사용key | 프리미엄 API 키와 함께 제공key | 평균 지연 | 단어 사용 횟수 | 요청 유형 | |
---|---|---|---|---|---|---|---|---|---|
리더 API | https://r.jina.ai | URL을 큰 모델 친화적 텍스트로 변환 | 20 RPM | 200 RPM | trending_up2000 RPM | 4.6s | 출력 응답의 토큰 수를 기준으로 합니다. | GET/POST | |
리더 API | https://s.jina.ai | 웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다. | block | 40 RPM | trending_up400 RPM | 5.7s | 각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다. | GET/POST | |
심층 검색 | https://deepsearch.jina.ai/v1/chat/completions | 추론하고, 검색하고, 반복하여 최상의 답을 찾으세요 | 0.5 RPM | 10 RPM | 100 RPM | 56.7s | 전체 프로세스에서 총 토큰 수를 계산합니다. | POST | |
벡터 모델 API | https://api.jina.ai/v1/embeddings | 텍스트/이미지를 고정 길이 벡터로 변환 | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
재정렬 API | https://api.jina.ai/v1/rerank | 쿼리로 문서 구체화 | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
분류자 API | https://api.jina.ai/v1/train | 훈련 샘플을 사용하여 분류기 훈련 | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는 입력 단어 × 반복 횟수입니다. | POST | |
분류자 API (작은 샘플) | https://api.jina.ai/v1/classify | 훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다. | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 토큰 개수는 다음과 같습니다. 입력 토큰 | POST | |
분류자 API (제로 샘플) | https://api.jina.ai/v1/classify | 제로샷 분류를 사용하여 입력 분류 | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는: 입력 단어와 태그 단어입니다. | POST | |
분할기 API | https://api.jina.ai/v1/segment | 긴 텍스트를 단어와 문장으로 분할 | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | 토큰 사용은 계산되지 않습니다. | GET/POST |
공포에 질리지 말 것! 모든 새로운 API 키에는 백만 개의 무료 토큰이 포함되어 있습니다!
API 가격표
API 가격은 토큰 사용량에 따라 결정됩니다. 하나의 API 키로 모든 Search Essentials 제품에 액세스할 수 있습니다.
Reader API 사용과 관련된 비용은 얼마입니까?
keyboard_arrow_down
리더 API는 어떻게 작동하나요?
keyboard_arrow_down
리더 API는 오픈 소스인가요?
keyboard_arrow_down
Reader API의 일반적인 대기 시간은 얼마나 됩니까?
keyboard_arrow_down
페이지를 직접 스크랩하는 대신 Reader API를 사용해야 하는 이유는 무엇입니까?
keyboard_arrow_down
Reader API는 여러 언어를 지원합니까?
keyboard_arrow_down
웹사이트에서 Reader API를 차단하는 경우 어떻게 해야 합니까?
keyboard_arrow_down
Reader API가 PDF 파일에서 콘텐츠를 추출할 수 있습니까?
keyboard_arrow_down
Reader API가 웹페이지의 미디어 콘텐츠를 처리할 수 있나요?
keyboard_arrow_down
로컬 HTML 파일에서 Reader API를 사용할 수 있습니까?
keyboard_arrow_down
Reader API는 콘텐츠를 캐시합니까?
keyboard_arrow_down
로그인 후 Reader API를 사용하여 콘텐츠에 액세스할 수 있나요?
keyboard_arrow_down
Reader API를 사용하여 arXiv의 PDF에 액세스할 수 있나요?
keyboard_arrow_down
리더에서 이미지 주석이 어떻게 작동하나요?
keyboard_arrow_down
리더는 얼마나 확장 가능합니까? 이것을 프로덕션에 사용할 수 있나요?
keyboard_arrow_down
Reader API의 속도 제한은 무엇입니까?
keyboard_arrow_down
리더-LM이란? 그것을 사용하는 방법?
keyboard_arrow_down
비율 제한
속도 제한은 세 가지 방법으로 추적됩니다. QPS(초당 요청 수), RPM(분당 요청 수), TPM(분당 토큰 수). 유료 플랜에 관계없이 IP당 100 QPS의 고정 제한이 있으며, 이를 통해 많은 수의 동시 요청으로 인해 시스템이 과부하되는 것을 방지할 수 있습니다. 기타 제한은 IP/API 키별로 적용되며 RPM 또는 TPM 임계값에 처음 도달하면 트리거됩니다. 요청 헤더에 API 키를 제공하는 경우 IP 주소 대신 키를 기준으로 요금 제한을 추적합니다.
Columns
arrow_drop_down
제품 | API 포트 | 설명하다arrow_upward | API 키 없음key_off | API 키 사용key | 프리미엄 API 키와 함께 제공key | 평균 지연 | 단어 사용 횟수 | 요청 유형 | |
---|---|---|---|---|---|---|---|---|---|
리더 API | https://r.jina.ai | URL을 큰 모델 친화적 텍스트로 변환 | 20 RPM | 200 RPM | trending_up2000 RPM | 4.6s | 출력 응답의 토큰 수를 기준으로 합니다. | GET/POST | |
리더 API | https://s.jina.ai | 웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다. | block | 40 RPM | trending_up400 RPM | 5.7s | 각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다. | GET/POST | |
심층 검색 | https://deepsearch.jina.ai/v1/chat/completions | 추론하고, 검색하고, 반복하여 최상의 답을 찾으세요 | 0.5 RPM | 10 RPM | 100 RPM | 56.7s | 전체 프로세스에서 총 토큰 수를 계산합니다. | POST | |
벡터 모델 API | https://api.jina.ai/v1/embeddings | 텍스트/이미지를 고정 길이 벡터로 변환 | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
재정렬 API | https://api.jina.ai/v1/rerank | 쿼리로 문서 구체화 | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
분류자 API | https://api.jina.ai/v1/train | 훈련 샘플을 사용하여 분류기 훈련 | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는 입력 단어 × 반복 횟수입니다. | POST | |
분류자 API (작은 샘플) | https://api.jina.ai/v1/classify | 훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다. | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 토큰 개수는 다음과 같습니다. 입력 토큰 | POST | |
분류자 API (제로 샘플) | https://api.jina.ai/v1/classify | 제로샷 분류를 사용하여 입력 분류 | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는: 입력 단어와 태그 단어입니다. | POST | |
분할기 API | https://api.jina.ai/v1/segment | 긴 텍스트를 단어와 문장으로 분할 | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | 토큰 사용은 계산되지 않습니다. | GET/POST |
API 관련 FAQ
code
Reader, Vector Model, Rearranger, Classifier 및 Fine-Tuned Model API에 동일한 API 키를 사용할 수 있습니까?
keyboard_arrow_down
code
API 키의 토큰 사용량을 볼 수 있나요?
keyboard_arrow_down
code
API 키를 잊어버린 경우 어떻게 해야 합니까?
keyboard_arrow_down
code
API 키가 만료되나요?
keyboard_arrow_down
code
API 키 간에 토큰 잔액을 전송할 수 있나요?
keyboard_arrow_down
code
내 API 키를 파기할 수 있나요?
keyboard_arrow_down
code
일부 모델을 처음 요청할 때 속도가 느린 이유는 무엇입니까?
keyboard_arrow_down
code
모델을 훈련하는 데 사용자 입력 데이터가 사용됩니까?
keyboard_arrow_down
청구 관련 자주 묻는 질문
attach_money
API 요금은 문장 수나 요청 수에 따라 청구되나요?
keyboard_arrow_down
attach_money
신규 사용자가 무료 평가판을 받을 수 있나요?
keyboard_arrow_down
attach_money
실패한 요청에 대해 토큰이 차감되나요?
keyboard_arrow_down
attach_money
어떤 결제 방법이 허용되나요?
keyboard_arrow_down
attach_money
Ci Yuan 구매 후 송장을 발행할 수 있나요?
keyboard_arrow_down