심층 검색 API
api.openai.com
을 deepsearch.jina.ai
로 바꾸기만 하면 됩니다.reasoning_effort
매개변수를 재정의합니다.reasoning_effort
매개변수를 재정의합니다.{
"role": "user",
"content": "hi"
}
curl https://deepsearch.jina.ai/v1/chat/completions \
-H "Content-Type: application/json"\
-H "Authorization: Bearer " \
-d @- <<EOFEOF
{
"model": "jina-deepsearch-v1",
"messages": [
{
"role": "user",
"content": "Hi!"
},
{
"role": "assistant",
"content": "Hi, how can I help you?"
},
{
"role": "user",
"content": "what's the latest blog post from jina ai?"
}
],
"stream": true,
"reasoning_effort": "medium"
}
EOFEOF
{
"id": "1742181758589",
"object": "chat.completion.chunk",
"created": 1742181758,
"model": "jina-deepsearch-v1",
"system_fingerprint": "fp_1742181758589",
"choices": [
{
"index": 0,
"delta": {
"content": "The latest blog post from Jina AI is titled \"Snippet Selection and URL Ranking in DeepSearch/DeepResearch,\" published on March 12, 2025 [^1]. This post discusses how to improve the quality of DeepSearch by using late-chunking embeddings for snippet selection and rerankers to prioritize URLs before crawling. You can read the full post here: https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch\n\n[^1]: Since our DeepSearch release on February 2nd 2025 we ve discovered two implementation details that greatly improved quality In both cases multilingual embeddings and rerankers are used in an in context manner operating at a much smaller scale than the traditional pre computed indices these models typically require [jina.ai](https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch)",
"type": "text",
"annotations": [
{
"type": "url_citation",
"url_citation": {
"title": "Snippet Selection and URL Ranking in DeepSearch/DeepResearch",
"exactQuote": "Since our DeepSearch release on February 2nd 2025, we've discovered two implementation details that greatly improved quality. In both cases, multilingual embeddings and rerankers are used in an _\"in-context\"_ manner - operating at a much smaller scale than the traditional pre-computed indices these models typically require.",
"url": "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
"dateTime": "2025-03-13 06:48:01"
}
}
]
},
"logprobs": null,
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 169670,
"completion_tokens": 27285,
"total_tokens": 196526
},
"visitedURLs": [
"https://github.com/jina-ai/node-DeepResearch/blob/main/src/utils/url-tools.ts",
"https://huggingface.co/jinaai/jina-embeddings-v3",
"https://github.com/jina-ai/reader",
"https://zilliz.com/blog/training-text-embeddings-with-jina-ai",
"https://threads.net/@unwind_ai/post/DGmhWCVswbe/media",
"https://twitter.com/JinaAI_/status/1899840196507820173",
"https://jina.ai/news?tag=tech-blog",
"https://docs.llamaindex.ai/en/stable/examples/embeddings/jinaai_embeddings",
"https://x.com/jinaai_",
"https://x.com/JinaAI_/status/1899840202358784170",
"https://tracxn.com/d/companies/jina-ai/__IQ81fOnU0FsDpagFjG-LrG0DMWHELqI6znTumZBQF-A/funding-and-investors",
"https://jina.ai/models",
"https://linkedin.com/posts/imohitmayank_jinaai-has-unveiled-the-ultimate-developer-activity-7300401711242711040-VD64",
"https://medium.com/@tossy21/trying-out-jina-ais-node-deepresearch-c5b55d630ea6",
"https://huggingface.co/jinaai/jina-clip-v2",
"https://arxiv.org/abs/2409.10173",
"https://milvus.io/docs/embed-with-jina.md",
"https://seedtable.com/best-startups-in-china",
"https://threads.net/@sung.kim.mw/post/DGhG-J_vREu/jina-ais-a-practical-guide-to-implementing-deepsearchdeepresearchthey-cover-desi",
"https://elastic.co/search-labs/blog/jina-ai-embeddings-rerank-model-open-inference-api",
"http://status.jina.ai/",
"https://apidog.com/blog/recreate-openai-deep-research",
"https://youtube.com/watch?v=QxHE4af5BQE",
"https://sdxcentral.com/articles/news/cisco-engages-businesses-on-ai-strategies-at-greater-bay-area-2025/2025/02",
"https://aws.amazon.com/blogs/machine-learning/build-rag-applications-using-jina-embeddings-v2-on-amazon-sagemaker-jumpstart",
"https://reddit.com/r/perplexity_ai/comments/1ejbdqa/fastest_open_source_ai_search_engine",
"https://search.jina.ai/",
"https://sebastian-petrus.medium.com/build-openais-deep-research-open-source-alternative-4f21aed6d9f0",
"https://medium.com/@elmo92/jina-reader-transforming-web-content-to-feed-llms-d238e827cc27",
"https://openai.com/index/introducing-deep-research",
"https://python.langchain.com/docs/integrations/tools/jina_search",
"https://varindia.com/news/meta-is-in-talks-for-usd200-billion-ai-data-center-project",
"https://varindia.com/news/Mira-Murati%E2%80%99s-new-AI-venture-eyes-$9-billion-valuation",
"https://53ai.com/news/RAG/2025031401342.html",
"https://arxiv.org/abs/2409.04701",
"https://bigdatawire.com/this-just-in/together-ai-raises-305m-series-b-to-power-ai-model-training-and-inference",
"https://github.blog/",
"https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/MvwT9enRT7gOESHA_tpRj.jpeg",
"https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/JNs_DrpFbr6ok_pSRUK4j.jpeg",
"https://app.dealroom.co/lists/33530",
"https://api-docs.deepseek.com/news/news250120",
"https://sdxcentral.com/articles/news/ninjaone-raises-500-million-valued-at-5-billion/2025/02",
"https://linkedin.com/sharing/share-offsite?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://twitter.com/intent/tweet?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://platform.openai.com/docs/api-reference/chat/create",
"https://mp.weixin.qq.com/s/-pPhHDi2nz8hp5R3Lm_mww",
"https://huggingface.us17.list-manage.com/subscribe?id=9ed45a3ef6&u=7f57e683fa28b51bfc493d048",
"https://automatio.ai/",
"https://sdk.vercel.ai/docs/introduction",
"https://app.eu.vanta.com/jinaai/trust/vz7f4mohp0847aho84lmva",
"https://apply.workable.com/huggingface/j/AF1D4E3FEB",
"https://facebook.com/sharer/sharer.php?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://facebook.com/sharer/sharer.php?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
"https://reddit.com/submit?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://apply.workable.com/huggingface",
"https://news.ycombinator.com/submitlink?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
"https://news.ycombinator.com/submitlink?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
"https://docs.github.com/site-policy/privacy-policies/github-privacy-statement",
"https://discord.jina.ai/",
"https://docs.github.com/site-policy/github-terms/github-terms-of-service",
"https://bigdatawire.com/this-just-in/qumulo-announces-30-million-funding",
"https://x.ai/blog/grok-3",
"https://m-ric-open-deep-research.hf.space/",
"https://youtu.be/sal78ACtGTc?feature=shared&t=52",
"https://mp.weixin.qq.com/s/apnorBj4TZs3-Mo23xUReQ",
"https://perplexity.ai/hub/blog/introducing-perplexity-deep-research",
"https://githubstatus.com/",
"https://github.blog/changelog/2021-09-30-footnotes-now-supported-in-markdown-fields",
"https://openai.com/index/introducing-operator",
"mailto:[email protected]",
"https://resources.github.com/learn/pathways",
"https://status.jina.ai/",
"https://reuters.com/technology/artificial-intelligence/tencents-messaging-app-weixin-launches-beta-testing-with-deepseek-2025-02-16",
"https://scmp.com/tech/big-tech/article/3298981/baidu-adopts-deepseek-ai-models-chasing-tencent-race-embrace-hot-start",
"https://microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks",
"javascript:UC_UI.showSecondLayer();",
"https://resources.github.com/",
"https://storm-project.stanford.edu/research/storm",
"https://blog.google/products/gemini/google-gemini-deep-research",
"https://youtu.be/vrpraFiPUyA",
"https://chat.baidu.com/search?extParamsJson=%7B%22enter_type%22%3A%22ai_explore_home%22%7D&isShowHello=1&pd=csaitab&setype=csaitab&usedModel=%7B%22modelName%22%3A%22DeepSeek-R1%22%7D",
"https://app.dover.com/jobs/jinaai",
"http://localhost:3000/",
"https://docs.cherry-ai.com/",
"https://en.wikipedia.org/wiki/Delayed_gratification",
"https://support.github.com/?tags=dotcom-footer",
"https://docs.jina.ai/",
"https://skills.github.com/",
"https://partner.github.com/",
"https://help.x.com/resources/accessibility",
"https://business.twitter.com/en/help/troubleshooting/how-twitter-ads-work.html",
"https://business.x.com/en/help/troubleshooting/how-twitter-ads-work.html",
"https://support.twitter.com/articles/20170514",
"https://support.x.com/articles/20170514",
"https://t.co/jnxcxPzndy",
"https://t.co/6EtEMa9P05",
"https://help.x.com/using-x/x-supported-browsers",
"https://legal.twitter.com/imprint.html"
],
"readURLs": [
"https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch",
"https://github.com/jina-ai/node-DeepResearch",
"https://huggingface.co/blog/open-deep-research",
"https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
"https://x.com/jinaai_?lang=en",
"https://jina.ai/news",
"https://x.com/joedevon/status/1896984525210837081",
"https://github.com/jina-ai/node-DeepResearch/blob/main/src/tools/jina-latechunk.ts"
],
"numURLs": 98
}
DeepSearch 매개변수 가이드
품질 관리
심층 검색에는 일반적으로 상충 관계가 있습니다. 시스템이 수행하는 단계가 많을수록 결과의 품질은 높아지지만, 토큰 소모량도 늘어납니다. 이러한 품질 향상은 더 광범위하고 철저한 검색과 더 깊은 성찰에서 비롯됩니다. 심층 검색의 품질을 제어하는 네 가지 주요 매개변수는 budget_tokens
, max_attempts
, team_size
, reasoning_effort
입니다. reasoning_effort
매개변수는 기본적으로 신중하게 조정된 budget_tokens
와 max_attempts
사전 설정의 조합입니다. 대부분의 사용자에게는 reasoning_effort
를 조정하는 것이 가장 쉬운 방법입니다.
예산 토큰
budget_tokens
는 심층 검색 프로세스 전체에서 허용되는 최대 토큰 수를 설정합니다. 여기에는 웹 검색, 웹 페이지 읽기, 성찰, 요약 및 인코딩을 포함한 모든 작업이 포함됩니다. 예산이 클수록 응답 품질이 향상됩니다. 심층 검색 프로세스는 예산이 소진되거나 만족스러운 답변이 발견되면(둘 중 먼저 발생하는 경우) 중단됩니다. 예산이 먼저 소진되더라도 답변은 얻을 수 있지만, max_attempts
에 정의된 모든 품질 검사를 통과하지 못했기 때문에 최종적이고 완전히 최적화된 답변이 아닐 수 있습니다.
최대 시도 횟수
max_attempts
는 심층 검색 중 시스템이 문제를 해결하기 위해 재시도하는 횟수를 결정합니다. 심층 검색에서 답변을 생성할 때마다 내부 평가자가 정의한 특정 품질 테스트를 통과해야 합니다. 답변이 이러한 테스트에 실패하면 평가자가 피드백을 제공하고, 시스템은 이 피드백을 사용하여 답변을 계속 검색하고 개선합니다. max_attempts
를 너무 낮게 설정하면 결과를 빠르게 얻을 수 있지만, 답변이 모든 품질 검사를 통과하지 못할 수 있으므로 품질이 저하될 수 있습니다. 너무 높게 설정하면 프로세스가 끝없는 재시도 루프에 빠져 끊임없이 시도하고 실패할 수 있습니다.
시스템은 budget_tokens
또는 max_attempts
를 초과하거나(둘 중 먼저 발생하는 경우), 모든 테스트를 통과하고 예산과 시도 횟수가 남아 있을 때 최종 답변을 반환합니다.
팀 크기
team_size
는 max_attempts
및 budget_tokens
와는 매우 다른 방식으로 품질에 영향을 미칩니다. team_size
가 1보다 크게 설정되면 시스템은 원래 문제를 하위 문제로 나누고 각각을 개별적으로 조사합니다. 이는 대규모 작업을 병렬로 실행되는 작은 작업으로 나누는 Map-Reduce 패턴과 유사합니다. 최종 답변은 각 작업자의 결과를 종합한 것입니다. 여러 에이전트가 동일한 문제의 다양한 측면을 조사하고 최종 보고서를 공동으로 작성하는 연구팀을 시뮬레이션하기 때문에 이를 team_size
라고 합니다.
모든 에이전트의 토큰 소비는 총 budget_tokens
에 포함되지만, 각 에이전트는 독립적인 max_attempts
를 갖습니다. 즉, team_size
가 더 크지만 budget_tokens
가 동일한 경우, 예산 제약으로 인해 상담원이 예상보다 빠르게 답변을 제공할 수 있습니다. 각 상담원이 포괄적인 작업을 완료할 수 있도록 충분한 리소스를 제공하기 위해 team_size
와 budget_tokens
를 모두 늘리는 것이 좋습니다.
마지막으로, team_size는 검색의 폭을 제어하는 것으로 생각할 수 있습니다. 즉, 탐색할 다양한 패싯의 수를 결정합니다. 한편, budget_tokens와 max_attempts는 검색의 깊이, 즉 각 패싯을 얼마나 탐색할지를 제어합니다.
정보 출처 제어
DeepSearch는 실제 정보, 즉 사용하는 정보 출처에 크게 의존합니다. 품질은 단순히 알고리즘의 깊이와 폭에만 국한되지 않습니다. DeepSearch가 정보를 얻는 출처 또한 마찬가지로 중요하며, 종종 결정적인 역할을 합니다. 이를 제어하는 주요 매개변수를 살펴보겠습니다.
직접 답변 없음
no_direct_answer
는 시스템이 1단계에서 답변을 반환하지 않도록 하는 간단한 스위치입니다. 이 기능을 활성화하면 시스템이 내부 지식을 사용하는 기능을 비활성화하고 항상 웹을 먼저 검색하도록 합니다. 이 기능을 활성화하면 시스템은 “오늘은 무슨 요일인가요?”, "잘 지내세요?"와 같은 간단한 질문이나 "미국의 40대 대통령은 누구인가요?"와 같은 기본적인 사실 지식에 대해서도 "너무 많이 생각"하게 되는데, 이러한 사실 지식은 모델의 학습 데이터에 분명히 존재합니다.
도메인 이름 제어
세 가지 매개변수(boost_hostnames
, bad_hostnames
, only_hostnames
)는 DeepSearch에 어떤 웹 페이지를 우선적으로 처리해야 하는지, 어떤 웹 페이지를 제외해야 하는지, 또는 어떤 웹 페이지를 단독으로 사용해야 하는지 알려줍니다. 이러한 메커니즘의 작동 방식을 이해하려면 DeepSearch의 검색 및 읽기 프로세스를 생각해 보세요.
-
검색 단계: 시스템은 웹을 검색하여 스니펫이 포함된 웹사이트 URL 목록을 가져옵니다.
-
선택 단계: 시스템은 실제로 방문할 URL을 결정합니다(시간 및 비용 제약으로 인해 모든 URL을 방문하지는 않습니다).
-
boost_hostnames
: 여기에 나열된 도메인은 우선 순위가 지정되어 방문 가능성이 더 높습니다. -
bad_hostnames
: 이러한 도메인은 방문하지 않습니다. -
only_hostnames
: 정의된 후에는 이러한 도메인과 일치하는 URL만 방문합니다.
도메인 매개변수에 대한 몇 가지 중요한 참고 사항은 다음과 같습니다. 첫째, 시스템은 항상 검색 엔진에서 반환된 스니펫을 추론 체인을 구축하는 초기 단서로 사용합니다. 이러한 도메인 매개변수는 시스템이 방문하는 웹 페이지에만 영향을 미치며, 검색 쿼리를 구성하는 방식에는 영향을 미치지 않습니다.
둘째, 수집된 URL에 only_hostnames
에 지정된 도메인이 포함되지 않으면 시스템이 웹 페이지 읽기를 완전히 중단할 수 있습니다. 연구 질문에 익숙하고 잠재적인 답변이 어디에 나타날지(또는 어디에 나타나지 않아야 할지) 이해하는 경우에만 이러한 매개변수를 사용하는 것이 좋습니다.
특수 사례: 학술 연구
학술 연구의 경우, 검색 및 읽기를 arxiv.org로 제한할 수 있습니다. 이 경우 "search_provider": "arxiv"
를 설정하면 모든 콘텐츠가 arxiv의 유일한 출처로 제공됩니다. 그러나 이러한 제한은 일반적이거나 간단한 질문에 대한 유효한 답변을 제공하지 못할 수 있으므로, 진지한 학술 연구에만 "search_provider": "arxiv"
를 사용하십시오.
검색 언어 코드
search_language_code
는 웹 리소스에 영향을 미치는 또 다른 매개변수로, 원래 입력이나 중간 추론 단계에 관계없이 시스템이 특정 언어로 쿼리를 생성하도록 합니다. 일반적으로 시스템은 최적의 검색 범위를 위해 쿼리 언어를 자동으로 결정하지만, 경우에 따라 수동 제어가 유용할 수 있습니다.
언어 제어 사용 사례
국제 시장 조사: 국제 시장에서 지역 브랜드 또는 기업의 영향력을 조사할 때, 쿼리가 항상 영어로 작성되도록 강제할 수 있습니다(전 세계적 범위를 조사하려면 "search_language_code": "en"
을 사용). 또는 더욱 구체적인 지역 정보를 얻으려면 현지 언어로 작성되도록 강제할 수 있습니다.
글로벌 조사를 위해 영어가 아닌 프롬프트 사용: 최종 사용자가 주로 중국어 또는 일본어를 사용하기 때문에 입력은 항상 중국어 또는 일본어로 되어 있지만, 조사 범위가 중국 또는 일본어 사이트뿐만 아니라 글로벌인 경우, 시스템은 프롬프트 언어를 자동으로 선호할 수 있습니다. 이 매개변수를 사용하면 더 광범위한 국제적 범위를 조사하기 위해 쿼리를 영어로 강제로 작성할 수 있습니다.
Deep Search와 채팅
심층 검색이란?
대형 모델
RAG 패러다임 및 검색 기능이 있는 대형 모델
심층 검색
API 가격표
제품 | API 포트 | 설명하다arrow_upward | API 키 없음key_off | API 키 사용key | 프리미엄 API 키와 함께 제공key | 평균 지연 | 단어 사용 횟수 | 요청 유형 | |
---|---|---|---|---|---|---|---|---|---|
리더 API | https://r.jina.ai | URL을 큰 모델 친화적 텍스트로 변환 | 20 RPM | 500 RPM | trending_up5000 RPM | 7.9s | 출력 응답의 토큰 수를 기준으로 합니다. | GET/POST | |
리더 API | https://s.jina.ai | 웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다. | block | 100 RPM | trending_up1000 RPM | 2.5s | 각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다. | GET/POST | |
심층 검색 | https://deepsearch.jina.ai/v1/chat/completions | 추론하고, 검색하고, 반복하여 최상의 답을 찾으세요 | block | 50 RPM | 500 RPM | 56.7s | 전체 프로세스에서 총 토큰 수를 계산합니다. | POST | |
벡터 모델 API | https://api.jina.ai/v1/embeddings | 텍스트/이미지를 고정 길이 벡터로 변환 | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
재정렬 API | https://api.jina.ai/v1/rerank | 쿼리로 문서 구체화 | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart 입력 크기에 따라 다름 help | 입력 요청의 토큰 수를 기준으로 합니다. | POST | |
분류자 API | https://api.jina.ai/v1/train | 훈련 샘플을 사용하여 분류기 훈련 | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는 입력 단어 × 반복 횟수입니다. | POST | |
분류자 API (작은 샘플) | https://api.jina.ai/v1/classify | 훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다. | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 토큰 개수는 다음과 같습니다. 입력 토큰 | POST | |
분류자 API (제로 샘플) | https://api.jina.ai/v1/classify | 제로샷 분류를 사용하여 입력 분류 | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart 입력 크기에 따라 다름 | 단어 수는: 입력 단어와 태그 단어입니다. | POST | |
분할기 API | https://api.jina.ai/v1/segment | 긴 텍스트를 단어와 문장으로 분할 | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | 토큰 사용은 계산되지 않습니다. | GET/POST |