심층 검색

검색하고, 읽고, 추론하여 가장 좋은 답을 찾으세요.

데모

심층 검색 API

OpenAI의 채팅 API 스키마와 완벽하게 호환됩니다. 시작하려면 api.openai.com을 deepsearch.jina.ai로 바꾸기만 하면 됩니다.

간단한 채팅 인터페이스에서 심층 검색이 제대로 작동하는지 확인하세요. 심층 검색은 반복적 추론, 세계 지식 또는 최신 정보가 필요한 복잡한 문제에 가장 적합합니다.

스트리밍 복귀

서버에서 전송되는 이벤트는 추론 단계와 최종 답변을 포함하여 이벤트가 발생하는 시점에 대한 정보를 전달합니다. 심층 검색 요청은 완료하는 데 시간이 오래 걸릴 수 있으므로 이 옵션을 활성화된 상태로 유지하는 것이 좋습니다. 스트리밍을 비활성화하면 "524 시간 초과" 오류가 발생할 수 있습니다.

추론 강도

추론 모델의 추론 워크로드를 제한합니다. 현재 지원되는 값은 낮음, 중간, 높음입니다. 추론 워크로드를 줄이면 응답이 더 빨라지고 추론에 사용되는 응답의 토큰이 줄어듭니다.

medium

단어 예산

이는 심층 검색 과정에서 허용되는 최대 토큰 수를 결정합니다. 예산이 많을수록 복잡한 질의에 대한 보다 철저한 검색이 가능해져 응답 품질이 향상될 수 있지만, 심층적인 검색에서는 할당된 전체 예산을 사용하지 못할 수도 있습니다. 이는 reasoning_effort 매개변수를 재정의합니다.

최대 시도 횟수

DeepSearch 중에 문제(및 모든 하위 문제)를 해결하기 위한 최대 재시도 횟수입니다. 값이 클수록 심층 검색은 다양한 추론 방법과 문제 해결 전략을 사용하여 문제 해결을 다시 시도할 수 있습니다. 이 매개변수는 reasoning_effort 매개변수를 재정의합니다.

다중 에이전트 팀 규모

심층 탐색에는 분할 정복(divide-and-conquer) 방식을 사용합니다. 문제를 여러 개의 하위 문제로 분할하고, 각 하위 문제를 에이전트가 독립적으로 연구합니다. 모든 에이전트는 토큰 예산을 공유하지만, 각각 독립적인 최대 시도 횟수(max_attempts) 값을 가지며, 최종 답에 도달하기 위해 협력합니다.

직접적인 답변이 없습니다

쿼리가 사소해 보이더라도 모델은 더 많은 생각과 검색 단계를 거쳐야 합니다. 이 기능은 "1+1=?"와 같은 사소한 질문보다는 항상 DeepSearch가 필요한 상황에서 DeepSearch를 사용하는 경우에 유용합니다.

Arxiv 최적화 검색

실험

검색 엔진이 arXiv 연구 논문에 최적화되어 있습니다. 따라서 모든 검색이 arXiv로만 제한됩니다.

구조화된 출력

이를 통해 구조화된 출력이 가능해져 모델의 최종 답변이 제공한 JSON 스키마와 일치하게 됩니다.

검색어 언어

검색 쿼리의 언어를 강제로 지정합니다. 리소스가 특정 언어로 작성될 가능성이 높을 때 유용합니다. 기본적으로 이 설정은 자동으로 지정됩니다.

답변과 사고 언어

답변의 언어를 지정하고, 주어진 언어 코드로 생각하는 것이 필수입니다. 기본적으로 답변 언어는 입력 메시지의 기본 언어에 따라 자동으로 결정됩니다. 답변의 질은 언어에 따라 약간 영향을 받을 수 있습니다.

프리미엄 도메인

콘텐츠 검색 시 우선순위가 높은 도메인 목록입니다. 귀중한 콘텐츠를 제공하는 특정 도메인의 고품질 소스에 유용합니다.

잘못된 도메인 이름

콘텐츠 검색에서 제외할 도메인의 엄격한 목록입니다. 흔히 알려진 정크, 품질이 낮거나 관련성이 없는 웹사이트를 걸러내는 데 사용됩니다.

도메인 이름만 허용

허용된 도메인 목록에서만 검색하고 읽습니다. 다른 모든 필드는 무시됩니다. 주어진 도메인에 접근할 수 없거나, 해당 도메인에 답변이 전혀 없다면 심층 검색의 품질이 크게 떨어질 것입니다.

최대 반환 URL

최종 답변/청크에 포함할 URL의 최대 개수입니다. URL은 관련성과 다른 중요한 요소에 따라 순위가 매겨집니다.

정보

지금까지 사용자와 도우미 간의 대화에서 나온 메시지 목록입니다.

사용자

어시스턴트

사용자

이미지/문서 첨부

텍스트(.txt, .pdf), 이미지(.png, .webp, .jpeg) 등 다양한 메시지 유형(모달리티)을 지원합니다. 지원되는 파일 크기는 최대 10MB이며 데이터 URI로 미리 인코딩되어야 합니다.

일반 텍스트 메시지

{
  "role": "user",
  "content": "hi"
}

묻다

Bash

언어

curl https://deepsearch.jina.ai/v1/chat/completions \
  -H "Content-Type: application/json"\
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "model": "jina-deepsearch-v1",
    "messages": [
        {
            "role": "user",
            "content": "Hi!"
        },
        {
            "role": "assistant",
            "content": "Hi, how can I help you?"
        },
        {
            "role": "user",
            "content": "what's the latest blog post from jina ai?"
        }
    ],
    "stream": true,
    "reasoning_effort": "medium"
  }
EOFEOF

이는 흐름의 마지막 부분으로, 최종 답변, 방문한 URL, 토큰 사용법이 포함되어 있습니다. 실시간 응답을 받으려면 위의 버튼을 클릭하세요.

응답

200 OK

0.0 s

196,526 단어 요소

{
  "id": "1742181758589",
  "object": "chat.completion.chunk",
  "created": 1742181758,
  "model": "jina-deepsearch-v1",
  "system_fingerprint": "fp_1742181758589",
  "choices": [
    {
      "index": 0,
      "delta": {
        "content": "The latest blog post from Jina AI is titled \"Snippet Selection and URL Ranking in DeepSearch/DeepResearch,\" published on March 12, 2025 [^1]. This post discusses how to improve the quality of DeepSearch by using late-chunking embeddings for snippet selection and rerankers to prioritize URLs before crawling. You can read the full post here: https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch\n\n[^1]: Since our DeepSearch release on February 2nd 2025 we ve discovered two implementation details that greatly improved quality In both cases multilingual embeddings and rerankers are used in an in context manner operating at a much smaller scale than the traditional pre computed indices these models typically require  [jina.ai](https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch)",
        "type": "text",
        "annotations": [
          {
            "type": "url_citation",
            "url_citation": {
              "title": "Snippet Selection and URL Ranking in DeepSearch/DeepResearch",
              "exactQuote": "Since our DeepSearch release on February 2nd 2025, we've discovered two implementation details that greatly improved quality. In both cases, multilingual embeddings and rerankers are used in an _\"in-context\"_ manner - operating at a much smaller scale than the traditional pre-computed indices these models typically require.",
              "url": "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
              "dateTime": "2025-03-13 06:48:01"
            }
          }
        ]
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 169670,
    "completion_tokens": 27285,
    "total_tokens": 196526
  },
  "visitedURLs": [
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/utils/url-tools.ts",
    "https://huggingface.co/jinaai/jina-embeddings-v3",
    "https://github.com/jina-ai/reader",
    "https://zilliz.com/blog/training-text-embeddings-with-jina-ai",
    "https://threads.net/@unwind_ai/post/DGmhWCVswbe/media",
    "https://twitter.com/JinaAI_/status/1899840196507820173",
    "https://jina.ai/news?tag=tech-blog",
    "https://docs.llamaindex.ai/en/stable/examples/embeddings/jinaai_embeddings",
    "https://x.com/jinaai_",
    "https://x.com/JinaAI_/status/1899840202358784170",
    "https://tracxn.com/d/companies/jina-ai/__IQ81fOnU0FsDpagFjG-LrG0DMWHELqI6znTumZBQF-A/funding-and-investors",
    "https://jina.ai/models",
    "https://linkedin.com/posts/imohitmayank_jinaai-has-unveiled-the-ultimate-developer-activity-7300401711242711040-VD64",
    "https://medium.com/@tossy21/trying-out-jina-ais-node-deepresearch-c5b55d630ea6",
    "https://huggingface.co/jinaai/jina-clip-v2",
    "https://arxiv.org/abs/2409.10173",
    "https://milvus.io/docs/embed-with-jina.md",
    "https://seedtable.com/best-startups-in-china",
    "https://threads.net/@sung.kim.mw/post/DGhG-J_vREu/jina-ais-a-practical-guide-to-implementing-deepsearchdeepresearchthey-cover-desi",
    "https://elastic.co/search-labs/blog/jina-ai-embeddings-rerank-model-open-inference-api",
    "http://status.jina.ai/",
    "https://apidog.com/blog/recreate-openai-deep-research",
    "https://youtube.com/watch?v=QxHE4af5BQE",
    "https://sdxcentral.com/articles/news/cisco-engages-businesses-on-ai-strategies-at-greater-bay-area-2025/2025/02",
    "https://aws.amazon.com/blogs/machine-learning/build-rag-applications-using-jina-embeddings-v2-on-amazon-sagemaker-jumpstart",
    "https://reddit.com/r/perplexity_ai/comments/1ejbdqa/fastest_open_source_ai_search_engine",
    "https://search.jina.ai/",
    "https://sebastian-petrus.medium.com/build-openais-deep-research-open-source-alternative-4f21aed6d9f0",
    "https://medium.com/@elmo92/jina-reader-transforming-web-content-to-feed-llms-d238e827cc27",
    "https://openai.com/index/introducing-deep-research",
    "https://python.langchain.com/docs/integrations/tools/jina_search",
    "https://varindia.com/news/meta-is-in-talks-for-usd200-billion-ai-data-center-project",
    "https://varindia.com/news/Mira-Murati%E2%80%99s-new-AI-venture-eyes-$9-billion-valuation",
    "https://53ai.com/news/RAG/2025031401342.html",
    "https://arxiv.org/abs/2409.04701",
    "https://bigdatawire.com/this-just-in/together-ai-raises-305m-series-b-to-power-ai-model-training-and-inference",
    "https://github.blog/",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/MvwT9enRT7gOESHA_tpRj.jpeg",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/JNs_DrpFbr6ok_pSRUK4j.jpeg",
    "https://app.dealroom.co/lists/33530",
    "https://api-docs.deepseek.com/news/news250120",
    "https://sdxcentral.com/articles/news/ninjaone-raises-500-million-valued-at-5-billion/2025/02",
    "https://linkedin.com/sharing/share-offsite?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://twitter.com/intent/tweet?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://platform.openai.com/docs/api-reference/chat/create",
    "https://mp.weixin.qq.com/s/-pPhHDi2nz8hp5R3Lm_mww",
    "https://huggingface.us17.list-manage.com/subscribe?id=9ed45a3ef6&u=7f57e683fa28b51bfc493d048",
    "https://automatio.ai/",
    "https://sdk.vercel.ai/docs/introduction",
    "https://app.eu.vanta.com/jinaai/trust/vz7f4mohp0847aho84lmva",
    "https://apply.workable.com/huggingface/j/AF1D4E3FEB",
    "https://facebook.com/sharer/sharer.php?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://facebook.com/sharer/sharer.php?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://reddit.com/submit?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://apply.workable.com/huggingface",
    "https://news.ycombinator.com/submitlink?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://news.ycombinator.com/submitlink?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://docs.github.com/site-policy/privacy-policies/github-privacy-statement",
    "https://discord.jina.ai/",
    "https://docs.github.com/site-policy/github-terms/github-terms-of-service",
    "https://bigdatawire.com/this-just-in/qumulo-announces-30-million-funding",
    "https://x.ai/blog/grok-3",
    "https://m-ric-open-deep-research.hf.space/",
    "https://youtu.be/sal78ACtGTc?feature=shared&t=52",
    "https://mp.weixin.qq.com/s/apnorBj4TZs3-Mo23xUReQ",
    "https://perplexity.ai/hub/blog/introducing-perplexity-deep-research",
    "https://githubstatus.com/",
    "https://github.blog/changelog/2021-09-30-footnotes-now-supported-in-markdown-fields",
    "https://openai.com/index/introducing-operator",
    "mailto:[email protected]",
    "https://resources.github.com/learn/pathways",
    "https://status.jina.ai/",
    "https://reuters.com/technology/artificial-intelligence/tencents-messaging-app-weixin-launches-beta-testing-with-deepseek-2025-02-16",
    "https://scmp.com/tech/big-tech/article/3298981/baidu-adopts-deepseek-ai-models-chasing-tencent-race-embrace-hot-start",
    "https://microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks",
    "javascript:UC_UI.showSecondLayer();",
    "https://resources.github.com/",
    "https://storm-project.stanford.edu/research/storm",
    "https://blog.google/products/gemini/google-gemini-deep-research",
    "https://youtu.be/vrpraFiPUyA",
    "https://chat.baidu.com/search?extParamsJson=%7B%22enter_type%22%3A%22ai_explore_home%22%7D&isShowHello=1&pd=csaitab&setype=csaitab&usedModel=%7B%22modelName%22%3A%22DeepSeek-R1%22%7D",
    "https://app.dover.com/jobs/jinaai",
    "http://localhost:3000/",
    "https://docs.cherry-ai.com/",
    "https://en.wikipedia.org/wiki/Delayed_gratification",
    "https://support.github.com/?tags=dotcom-footer",
    "https://docs.jina.ai/",
    "https://skills.github.com/",
    "https://partner.github.com/",
    "https://help.x.com/resources/accessibility",
    "https://business.twitter.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://business.x.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://support.twitter.com/articles/20170514",
    "https://support.x.com/articles/20170514",
    "https://t.co/jnxcxPzndy",
    "https://t.co/6EtEMa9P05",
    "https://help.x.com/using-x/x-supported-browsers",
    "https://legal.twitter.com/imprint.html"
  ],
  "readURLs": [
    "https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch",
    "https://github.com/jina-ai/node-DeepResearch",
    "https://huggingface.co/blog/open-deep-research",
    "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
    "https://x.com/jinaai_?lang=en",
    "https://jina.ai/news",
    "https://x.com/joedevon/status/1896984525210837081",
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/tools/jina-latechunk.ts"
  ],
  "numURLs": 98
}

API 키

남은 토큰 금액

이것이 당신의 고유한 열쇠입니다. 안전하게 보관해주세요!

품질 관리

심층 검색에는 일반적으로 상충 관계가 있습니다. 시스템이 수행하는 단계가 많을수록 결과의 품질은 높아지지만, 토큰 소모량도 늘어납니다. 이러한 품질 향상은 더 광범위하고 철저한 검색과 더 깊은 성찰에서 비롯됩니다. 심층 검색의 품질을 제어하는 네 가지 주요 매개변수는 budget_tokens, max_attempts, team_size, reasoning_effort입니다. reasoning_effort 매개변수는 기본적으로 신중하게 조정된 budget_tokens와 max_attempts 사전 설정의 조합입니다. 대부분의 사용자에게는 reasoning_effort를 조정하는 것이 가장 쉬운 방법입니다.

예산 토큰

budget_tokens는 심층 검색 프로세스 전체에서 허용되는 최대 토큰 수를 설정합니다. 여기에는 웹 검색, 웹 페이지 읽기, 성찰, 요약 및 인코딩을 포함한 모든 작업이 포함됩니다. 예산이 클수록 응답 품질이 향상됩니다. 심층 검색 프로세스는 예산이 소진되거나 만족스러운 답변이 발견되면(둘 중 먼저 발생하는 경우) 중단됩니다. 예산이 먼저 소진되더라도 답변은 얻을 수 있지만, max_attempts에 정의된 모든 품질 검사를 통과하지 못했기 때문에 최종적이고 완전히 최적화된 답변이 아닐 수 있습니다.

최대 시도 횟수

max_attempts는 심층 검색 중 시스템이 문제를 해결하기 위해 재시도하는 횟수를 결정합니다. 심층 검색에서 답변을 생성할 때마다 내부 평가자가 정의한 특정 품질 테스트를 통과해야 합니다. 답변이 이러한 테스트에 실패하면 평가자가 피드백을 제공하고, 시스템은 이 피드백을 사용하여 답변을 계속 검색하고 개선합니다. max_attempts를 너무 낮게 설정하면 결과를 빠르게 얻을 수 있지만, 답변이 모든 품질 검사를 통과하지 못할 수 있으므로 품질이 저하될 수 있습니다. 너무 높게 설정하면 프로세스가 끝없는 재시도 루프에 빠져 끊임없이 시도하고 실패할 수 있습니다.

시스템은 budget_tokens 또는 max_attempts를 초과하거나(둘 중 먼저 발생하는 경우), 모든 테스트를 통과하고 예산과 시도 횟수가 남아 있을 때 최종 답변을 반환합니다.

팀 크기

team_size는 max_attempts 및 budget_tokens와는 매우 다른 방식으로 품질에 영향을 미칩니다. team_size가 1보다 크게 설정되면 시스템은 원래 문제를 하위 문제로 나누고 각각을 개별적으로 조사합니다. 이는 대규모 작업을 병렬로 실행되는 작은 작업으로 나누는 Map-Reduce 패턴과 유사합니다. 최종 답변은 각 작업자의 결과를 종합한 것입니다. 여러 에이전트가 동일한 문제의 다양한 측면을 조사하고 최종 보고서를 공동으로 작성하는 연구팀을 시뮬레이션하기 때문에 이를 team_size라고 합니다.

모든 에이전트의 토큰 소비는 총 budget_tokens에 포함되지만, 각 에이전트는 독립적인 max_attempts를 갖습니다. 즉, team_size가 더 크지만 budget_tokens가 동일한 경우, 예산 제약으로 인해 상담원이 예상보다 빠르게 답변을 제공할 수 있습니다. 각 상담원이 포괄적인 작업을 완료할 수 있도록 충분한 리소스를 제공하기 위해 team_size와 budget_tokens를 모두 늘리는 것이 좋습니다.

마지막으로, team_size는 검색의 폭을 제어하는 것으로 생각할 수 있습니다. 즉, 탐색할 다양한 패싯의 수를 결정합니다. 한편, budget_tokens와 max_attempts는 검색의 깊이, 즉 각 패싯을 얼마나 탐색할지를 제어합니다.

정보 출처 제어

DeepSearch는 실제 정보, 즉 사용하는 정보 출처에 크게 의존합니다. 품질은 단순히 알고리즘의 깊이와 폭에만 국한되지 않습니다. DeepSearch가 정보를 얻는 출처 또한 마찬가지로 중요하며, 종종 결정적인 역할을 합니다. 이를 제어하는 주요 매개변수를 살펴보겠습니다.

직접 답변 없음

no_direct_answer는 시스템이 1단계에서 답변을 반환하지 않도록 하는 간단한 스위치입니다. 이 기능을 활성화하면 시스템이 내부 지식을 사용하는 기능을 비활성화하고 항상 웹을 먼저 검색하도록 합니다. 이 기능을 활성화하면 시스템은 “오늘은 무슨 요일인가요?”, "잘 지내세요?"와 같은 간단한 질문이나 "미국의 40대 대통령은 누구인가요?"와 같은 기본적인 사실 지식에 대해서도 "너무 많이 생각"하게 되는데, 이러한 사실 지식은 모델의 학습 데이터에 분명히 존재합니다.

도메인 이름 제어

세 가지 매개변수(boost_hostnames, bad_hostnames, only_hostnames)는 DeepSearch에 어떤 웹 페이지를 우선적으로 처리해야 하는지, 어떤 웹 페이지를 제외해야 하는지, 또는 어떤 웹 페이지를 단독으로 사용해야 하는지 알려줍니다. 이러한 메커니즘의 작동 방식을 이해하려면 DeepSearch의 검색 및 읽기 프로세스를 생각해 보세요.

검색 단계: 시스템은 웹을 검색하여 스니펫이 포함된 웹사이트 URL 목록을 가져옵니다.
선택 단계: 시스템은 실제로 방문할 URL을 결정합니다(시간 및 비용 제약으로 인해 모든 URL을 방문하지는 않습니다).

boost_hostnames: 여기에 나열된 도메인은 우선 순위가 지정되어 방문 가능성이 더 높습니다.
bad_hostnames: 이러한 도메인은 방문하지 않습니다.
only_hostnames: 정의된 후에는 이러한 도메인과 일치하는 URL만 방문합니다.

도메인 매개변수에 대한 몇 가지 중요한 참고 사항은 다음과 같습니다. 첫째, 시스템은 항상 검색 엔진에서 반환된 스니펫을 추론 체인을 구축하는 초기 단서로 사용합니다. 이러한 도메인 매개변수는 시스템이 방문하는 웹 페이지에만 영향을 미치며, 검색 쿼리를 구성하는 방식에는 영향을 미치지 않습니다.

둘째, 수집된 URL에 only_hostnames에 지정된 도메인이 포함되지 않으면 시스템이 웹 페이지 읽기를 완전히 중단할 수 있습니다. 연구 질문에 익숙하고 잠재적인 답변이 어디에 나타날지(또는 어디에 나타나지 않아야 할지) 이해하는 경우에만 이러한 매개변수를 사용하는 것이 좋습니다.

특수 사례: 학술 연구

학술 연구의 경우, 검색 및 읽기를 arxiv.org로 제한할 수 있습니다. 이 경우 "search_provider": "arxiv"를 설정하면 모든 콘텐츠가 arxiv의 유일한 출처로 제공됩니다. 그러나 이러한 제한은 일반적이거나 간단한 질문에 대한 유효한 답변을 제공하지 못할 수 있으므로, 진지한 학술 연구에만 "search_provider": "arxiv"를 사용하십시오.

검색 언어 코드

search_language_code는 웹 리소스에 영향을 미치는 또 다른 매개변수로, 원래 입력이나 중간 추론 단계에 관계없이 시스템이 특정 언어로 쿼리를 생성하도록 합니다. 일반적으로 시스템은 최적의 검색 범위를 위해 쿼리 언어를 자동으로 결정하지만, 경우에 따라 수동 제어가 유용할 수 있습니다.

언어 제어 사용 사례

국제 시장 조사: 국제 시장에서 지역 브랜드 또는 기업의 영향력을 조사할 때, 쿼리가 항상 영어로 작성되도록 강제할 수 있습니다(전 세계적 범위를 조사하려면 "search_language_code": "en"을 사용). 또는 더욱 구체적인 지역 정보를 얻으려면 현지 언어로 작성되도록 강제할 수 있습니다.

글로벌 조사를 위해 영어가 아닌 프롬프트 사용: 최종 사용자가 주로 중국어 또는 일본어를 사용하기 때문에 입력은 항상 중국어 또는 일본어로 되어 있지만, 조사 범위가 중국 또는 일본어 사이트뿐만 아니라 글로벌인 경우, 시스템은 프롬프트 언어를 자동으로 선호할 수 있습니다. 이 매개변수를 사용하면 더 광범위한 국제적 범위를 조사하기 위해 쿼리를 영어로 강제로 작성할 수 있습니다.

Deep Search와 채팅

우리는 빠르고 간단하며 무료인 새로운 Deep Search UI를 출시했습니다. https://search.jina.ai에서 확인하시거나 아래 버튼을 클릭해 사용해 보세요!새로운 UI에 접근하세요

채팅 클라이언트

최고의 경험을 위해 전문 채팅 클라이언트를 사용하는 것이 좋습니다. DeepSearch는 OpenAI의 채팅 API 아키텍처와 완벽하게 호환되므로 모든 OpenAI 호환 클라이언트에서 쉽게 사용할 수 있습니다.

API 포트

모델명

API 키

Chatwise

Cherry Studio

Chatbox

LobeChat

NextChat

심층 검색이란?

딥 서치는 웹 검색, 읽기, 추론을 결합하여 포괄적인 조사를 수행합니다. 마치 여러분의 조사 과제를 받는 에이전트처럼, 딥 서치는 광범위하게 검색하고 여러 번의 반복을 거쳐 답을 도출합니다.

대형 모델

약 1000 단어

약 1초 정도

일반 지식 질문에 대한 빠른 답변

실시간 또는 훈련된 정보에 대한 접근이 불가능합니다.

답변은 고정된 마감일을 기준으로 사전 훈련된 지식에서 전적으로 생성됩니다.

RAG 패러다임 및 검색 기능이 있는 대형 모델

약 10,000 단어

약 3초

현재 또는 분야별 정보가 필요한 질문

멀티홉 추론이 필요한 복잡한 문제를 해결하세요

개별 검색 결과를 집계하여 생성된 답변

교육기간 이후에도 최신 정보를 얻을 수 있는 능력

심층 검색

약 50만 단어

약 50초

심층적인 조사와 추론이 필요한 복잡한 문제

단순한 대형 모델이나 RAG 방식보다 시간이 더 오래 걸립니다.

반복적으로 검색, 읽기, 추론이 가능한 자율 에이전트

현재 결과를 토대로 다음 작업을 동적으로 결정합니다.

결과를 반환하기 전에 답변의 질을 자체 평가하세요

여러 차례의 검색 및 추론을 통해 주제에 대해 더 깊이 파고들 수 있습니다.

API 가격표

API 가격은 토큰 사용량에 따라 결정됩니다. 하나의 API 키로 모든 Search Essentials 제품에 액세스할 수 있습니다.

Jina를 사용한 검색 기반 API

당사의 모든 제품에 접근할 수 있는 가장 쉬운 방법입니다. 언제든지 토큰을 재충전하세요.

충전하려는 API 키를 입력하세요.

더 많은 토큰으로 이 API 키를 충전하세요

위치에 따라 미국 달러, 유로 또는 기타 통화로 요금이 청구될 수 있습니다. 세금이 적용될 수 있습니다.

재충전하려면 올바른 API 키를 입력하세요.

비율 제한에 대해 알아보기

속도 제한은 1분 동안 IP 주소/API 키(RPM)당 API에 보낼 수 있는 최대 요청 수입니다. 각 제품과 등급의 요금 한도에 대해 자세히 알아보세요.

비율 제한

속도 제한은 세 가지 방법, 즉 RPM(분당 요청 수)과 TPM(분당 단어 수)으로 추적됩니다. 제한은 IP/API 키별로 적용되며 RPM 또는 TPM 임계값에 먼저 도달하면 트리거됩니다. 요청 헤더에 API 키를 제공하면 IP 주소 대신 키별로 요금 제한을 추적합니다.

Columns

제품	API 포트	설명하다	API 키 없음	API 키 사용	프리미엄 API 키와 함께 제공	평균 지연	단어 사용 횟수	요청 유형
리더 API	`https://r.jina.ai`	URL을 큰 모델 친화적 텍스트로 변환	20 RPM	500 RPM	5000 RPM	7.9s	출력 응답의 토큰 수를 기준으로 합니다.	GET/POST
리더 API	`https://s.jina.ai`	웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다.		100 RPM	1000 RPM	2.5s	각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다.	GET/POST
심층 검색	`https://deepsearch.jina.ai/v1/chat/completions`	추론하고, 검색하고, 반복하여 최상의 답을 찾으세요		50 RPM	500 RPM	56.7s	전체 프로세스에서 총 토큰 수를 계산합니다.	POST
벡터 모델 API	`https://api.jina.ai/v1/embeddings`	텍스트/이미지를 고정 길이 벡터로 변환		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	입력 크기에 따라 다름	입력 요청의 토큰 수를 기준으로 합니다.	POST
재정렬 API	`https://api.jina.ai/v1/rerank`	쿼리로 문서 구체화		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	입력 크기에 따라 다름	입력 요청의 토큰 수를 기준으로 합니다.	POST
분류자 API	`https://api.jina.ai/v1/train`	훈련 샘플을 사용하여 분류기 훈련		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	입력 크기에 따라 다름	단어 수는 입력 단어 × 반복 횟수입니다.	POST
분류자 API (작은 샘플)	`https://api.jina.ai/v1/classify`	훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다.		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	입력 크기에 따라 다름	토큰 개수는 다음과 같습니다. 입력 토큰	POST
분류자 API (제로 샘플)	`https://api.jina.ai/v1/classify`	제로샷 분류를 사용하여 입력 분류		200 RPM & 500,000 TPM	1,000 RPM & 3,000,000 TPM	입력 크기에 따라 다름	단어 수는: 입력 단어와 태그 단어입니다.	POST
분할기 API	`https://api.jina.ai/v1/segment`	긴 텍스트를 단어와 문장으로 분할	20 RPM	200 RPM	1,000 RPM	0.3s	토큰 사용은 계산되지 않습니다.	GET/POST

잔액이 부족하면 자동으로 충전됩니다

프로덕션 환경에서 중단 없는 서비스를 위해 권장됩니다. 귀하의 단어 잔액이 설정된 한도 미만으로 떨어지면, 한도에 도달할 때까지 저장된 결제 방법을 사용하여 마지막으로 구매한 패키지를 자동으로 재충전합니다.

2025년 5월 6일에 새로운 가격 모델을 출시했습니다. 이 날짜 이전에 자동 충전을 활성화한 경우, 이전 가격(즉, 구매 시점의 가격)이 계속 청구됩니다. 새로운 가격은 자동 충전 설정을 수정하거나 새로운 API 키를 구매하는 경우에만 적용됩니다.

< 1M 단어 요소

이 값보다 낮으면 재충전하세요

자주하는 질문

심층 검색이란?

Deep Search는 OpenAI와 Gemini의 심층 연구 기능과 어떻게 다릅니까?

DeepResearch를 사용하려면 어떤 API 키가 필요한가요?

심층 검색이 토큰 예산에 도달하면 어떻게 되나요? 불완전한 답변이 반환되나요?

심층 검색을 통해 답변의 정확성을 보장할 수 있나요?

일반적으로 심층 검색을 수행하는 데 얼마나 걸리나요?

Deep Search는 Chatwise, CherryStudio, ChatBox와 같은 OpenAI 호환 클라이언트와 함께 작동합니까?

API의 속도 제한은 무엇입니까?

<think> 태그 안에는 무엇이 들어있나요?

Deep Search는 웹 검색과 읽기에 Jina Reader를 사용합니까?

심층 검색에서 내 쿼리에 대해 왜 그렇게 많은 태그를 사용하나요?

걸음 수를 조절하거나 제한할 수 있는 방법이 있나요?

답변에 나와 있는 참고문헌은 얼마나 신뢰할 수 있나요?

심층 검색을 통해 미래 이벤트에 대한 질문을 처리할 수 있나요?

API 키를 어떻게 얻나요?

속도 제한은 무엇입니까?

비율 제한

Columns

제품	API 포트	설명하다	API 키 없음	API 키 사용	프리미엄 API 키와 함께 제공	평균 지연	단어 사용 횟수	요청 유형
리더 API	`https://r.jina.ai`	URL을 큰 모델 친화적 텍스트로 변환	20 RPM	500 RPM	5000 RPM	7.9s	출력 응답의 토큰 수를 기준으로 합니다.	GET/POST
리더 API	`https://s.jina.ai`	웹을 검색하고 결과를 모델 친화적인 큰 텍스트로 변환합니다.		100 RPM	1000 RPM	2.5s	각 요청에는 10000개의 토큰으로 시작하는 고정된 수의 토큰이 필요합니다.	GET/POST
심층 검색	`https://deepsearch.jina.ai/v1/chat/completions`	추론하고, 검색하고, 반복하여 최상의 답을 찾으세요		50 RPM	500 RPM	56.7s	전체 프로세스에서 총 토큰 수를 계산합니다.	POST
벡터 모델 API	`https://api.jina.ai/v1/embeddings`	텍스트/이미지를 고정 길이 벡터로 변환		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	입력 크기에 따라 다름	입력 요청의 토큰 수를 기준으로 합니다.	POST
재정렬 API	`https://api.jina.ai/v1/rerank`	쿼리로 문서 구체화		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	입력 크기에 따라 다름	입력 요청의 토큰 수를 기준으로 합니다.	POST
분류자 API	`https://api.jina.ai/v1/train`	훈련 샘플을 사용하여 분류기 훈련		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	입력 크기에 따라 다름	단어 수는 입력 단어 × 반복 횟수입니다.	POST
분류자 API (작은 샘플)	`https://api.jina.ai/v1/classify`	훈련된 퓨샷 분류기를 사용하여 입력을 분류합니다.		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	입력 크기에 따라 다름	토큰 개수는 다음과 같습니다. 입력 토큰	POST
분류자 API (제로 샘플)	`https://api.jina.ai/v1/classify`	제로샷 분류를 사용하여 입력 분류		200 RPM & 500,000 TPM	1,000 RPM & 3,000,000 TPM	입력 크기에 따라 다름	단어 수는: 입력 단어와 태그 단어입니다.	POST
분할기 API	`https://api.jina.ai/v1/segment`	긴 텍스트를 단어와 문장으로 분할	20 RPM	200 RPM	1,000 RPM	0.3s	토큰 사용은 계산되지 않습니다.	GET/POST

Reader, Embedding, Reranker, Classifier 및 Fine-Tuned Model API에 동일한 API 키를 사용할 수 있습니까?

API 키의 토큰 사용량을 볼 수 있나요?

API 키를 잊어버린 경우 어떻게 해야 합니까?

API 키가 만료되나요?

API 키 간에 토큰 잔액을 전송할 수 있나요?

내 API 키를 파기할 수 있나요?

일부 모델을 처음 요청할 때 속도가 느린 이유는 무엇입니까?

모델을 훈련하는 데 사용자 입력 데이터가 사용됩니까?

API 요금은 문장 수나 요청 수에 따라 청구되나요?

신규 사용자가 무료 평가판을 받을 수 있나요?

실패한 요청에 대해 토큰이 차감되나요?

어떤 결제 방법이 허용되나요?

Ci Yuan 구매 후 송장을 발행할 수 있나요?