DeepSearch

Suchen, lesen und überlegen, bis die beste Antwort gefunden ist.

DeepSearch-API

Vollständig kompatibel mit dem Chat-API-Schema von OpenAI. Tauschen Sie einfach api.openai.com gegen deepsearch.jina.ai aus, um loszulegen.

Ratenbegrenzung

Problem melden

FAQ

Status

Chatten Sie mit DeepSearch

Stimmungscheck mit einer einfachen Chat-Benutzeroberfläche. DeepSearch eignet sich am besten für komplexe Fragen, die iteratives Denken, Weltwissen oder aktuelle Informationen erfordern.

Streaming

Übermittelt Ereignisse, sobald sie über vom Server gesendete Ereignisse auftreten, einschließlich Argumentationsschritte und endgültiger Antworten. Wir empfohlen dringend, diese Option aktiviert zu lassen, da die Ausführung von DeepSearch-Anfragen viel Zeit in Anspruch nehmen kann. Das Deaktivieren des Streamings kann zu „524 Timeout“-Fehlern führen.

Argumentationsaufwand

Beschränkt den Schlussfolgerungsaufwand für Schlussfolgerungsmodelle. Derzeit unterstützte Werte sind niedrig, mittel und hoch. Eine Reduzierung des Schlussfolgerungsaufwands kann zu schnelleren Antworten und weniger Schlussfolgerungstoken in einer Antwort führen.

medium

Budget-Token

Dies bestimmt die maximale Anzahl an Token, die für den DeepSearch-Prozess verwendet werden dürfen. Größere Budgets können die Antwortqualität verbessern, indem sie eine umfassendere Suche nach komplexen Abfragen ermöglichen, obwohl DeepSearch möglicherweise nicht das gesamte zugewiesene Budget verwendet. Dies überschreibt den Parameter reasoning_effort.

Max. Versuche

Die maximale Anzahl von Wiederholungsversuchen zum Lösen eines Problems (und aller Teilprobleme) im DeepSearch-Prozess. Ein höherer Wert ermöglicht es DeepSearch, das Problem mithilfe verschiedener Denkansätze und Lösungsstrategien erneut zu lösen. Dieser Parameter überschreibt den Parameter reasoning_effort.

Agententeamgröße

Die Anzahl der Agenten, die parallel an dem Problem arbeiten. Alle Agenten teilen sich ein Token-Budget, haben aber unabhängige maximale Versuche und arbeiten zusammen, um eine endgültige Antwort zu erarbeiten.

Keine direkte Antwort

Zwingt das Modell, weitere Denk-/Suchschritte durchzuführen, selbst wenn die Abfrage trivial erscheint. Dies ist nützlich, wenn Sie DeepSearch in Szenarien verwenden, in denen Sie sicher sind, dass die Abfrage immer DeepSearch benötigt, und nicht für triviale Fragen wie „1+1=?“.

Arxiv Optimierte Suche

Experimental

Optimierte Suchmaschine für arXiv-Forschungsartikel. Dadurch wird die Suche ausschließlich auf arXiv beschränkt.

Strukturierte Ausgabe

Dadurch werden strukturierte Ausgaben aktiviert, die sicherstellen, dass die endgültige Antwort des Modells mit Ihrem bereitgestellten JSON-Schema übereinstimmt.

Suchabfragesprache

Erzwingt die Verwendung der Sprache für die Suchanfrage. Nützlich, wenn Ressourcen eher in einer bestimmten Sprache vorliegen. Standardmäßig wird die Sprache automatisch vom System bestimmt.

Antwort- und Denksprache

Erzwingen Sie die Sprache der Antwort und denken Sie mit dem angegebenen Sprachcode. Standardmäßig wird dieser automatisch anhand der Primärsprache der Eingabenachrichten bestimmt. Die Qualität der Antwort kann durch die Sprache geringfügig beeinflusst werden.

Gute Domains

Eine Liste von Domänen, denen beim Abrufen von Inhalten eine höhere Priorität zugewiesen wird. Nützlich für domänenspezifische, hochwertige Quellen mit wertvollem Inhalt.

Ungültige Domänen

Eine Liste von Domänen, die strikt vom Inhaltsabruf ausgeschlossen werden sollen. Wird normalerweise verwendet, um bekannten Spam, minderwertige oder irrelevante Websites herauszufiltern.

Nur Domänen

Eine Liste von Domänen, die ausschließlich in die Inhaltssuche einbezogen werden sollen. Alle anderen Domänen werden ignoriert. Nützlich für domänenspezifische Suchen.

Maximal zurückgegebene URLs

Die maximale Anzahl von URLs, die in die endgültige Antwort/den endgültigen Block aufgenommen werden sollen. URLs werden nach Relevanz und anderen wichtigen Faktoren sortiert.

Nachrichten

Eine Liste der Nachrichten zwischen dem Benutzer und dem Assistenten, die die bisherige Konversation darstellen.

Benutzer

Assistent

Benutzer

Bild/Dokument anhängen

Es werden verschiedene Nachrichtentypen (Modalitäten) unterstützt, wie Text (.txt, .pdf), Bilder (.png, .webp, .jpeg). Dateien bis zu 10 MB werden unterstützt und müssen im Voraus in Daten-URI codiert werden.

Nur-Text-Nachricht

{
  "role": "user",
  "content": "hi"
}

Anfrage

Bash

Sprache

curl https://deepsearch.jina.ai/v1/chat/completions \
  -H "Content-Type: application/json"\
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "model": "jina-deepsearch-v1",
    "messages": [
        {
            "role": "user",
            "content": "Hi!"
        },
        {
            "role": "assistant",
            "content": "Hi, how can I help you?"
        },
        {
            "role": "user",
            "content": "what's the latest blog post from jina ai?"
        }
    ],
    "stream": true,
    "reasoning_effort": "medium"
  }
EOFEOF

Dies ist der letzte Teil des Streams, der die endgültige Antwort, die besuchten URLs und die Token-Nutzung enthält. Klicken Sie auf die Schaltfläche oben, um eine Antwort in Echtzeit zu erhalten.

Antwort

200 OK

0.0 s

196,526 Token

{
  "id": "1742181758589",
  "object": "chat.completion.chunk",
  "created": 1742181758,
  "model": "jina-deepsearch-v1",
  "system_fingerprint": "fp_1742181758589",
  "choices": [
    {
      "index": 0,
      "delta": {
        "content": "The latest blog post from Jina AI is titled \"Snippet Selection and URL Ranking in DeepSearch/DeepResearch,\" published on March 12, 2025 [^1]. This post discusses how to improve the quality of DeepSearch by using late-chunking embeddings for snippet selection and rerankers to prioritize URLs before crawling. You can read the full post here: https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch\n\n[^1]: Since our DeepSearch release on February 2nd 2025 we ve discovered two implementation details that greatly improved quality In both cases multilingual embeddings and rerankers are used in an in context manner operating at a much smaller scale than the traditional pre computed indices these models typically require  [jina.ai](https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch)",
        "type": "text",
        "annotations": [
          {
            "type": "url_citation",
            "url_citation": {
              "title": "Snippet Selection and URL Ranking in DeepSearch/DeepResearch",
              "exactQuote": "Since our DeepSearch release on February 2nd 2025, we've discovered two implementation details that greatly improved quality. In both cases, multilingual embeddings and rerankers are used in an _\"in-context\"_ manner - operating at a much smaller scale than the traditional pre-computed indices these models typically require.",
              "url": "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
              "dateTime": "2025-03-13 06:48:01"
            }
          }
        ]
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 169670,
    "completion_tokens": 27285,
    "total_tokens": 196526
  },
  "visitedURLs": [
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/utils/url-tools.ts",
    "https://huggingface.co/jinaai/jina-embeddings-v3",
    "https://github.com/jina-ai/reader",
    "https://zilliz.com/blog/training-text-embeddings-with-jina-ai",
    "https://threads.net/@unwind_ai/post/DGmhWCVswbe/media",
    "https://twitter.com/JinaAI_/status/1899840196507820173",
    "https://jina.ai/news?tag=tech-blog",
    "https://docs.llamaindex.ai/en/stable/examples/embeddings/jinaai_embeddings",
    "https://x.com/jinaai_",
    "https://x.com/JinaAI_/status/1899840202358784170",
    "https://tracxn.com/d/companies/jina-ai/__IQ81fOnU0FsDpagFjG-LrG0DMWHELqI6znTumZBQF-A/funding-and-investors",
    "https://jina.ai/models",
    "https://linkedin.com/posts/imohitmayank_jinaai-has-unveiled-the-ultimate-developer-activity-7300401711242711040-VD64",
    "https://medium.com/@tossy21/trying-out-jina-ais-node-deepresearch-c5b55d630ea6",
    "https://huggingface.co/jinaai/jina-clip-v2",
    "https://arxiv.org/abs/2409.10173",
    "https://milvus.io/docs/embed-with-jina.md",
    "https://seedtable.com/best-startups-in-china",
    "https://threads.net/@sung.kim.mw/post/DGhG-J_vREu/jina-ais-a-practical-guide-to-implementing-deepsearchdeepresearchthey-cover-desi",
    "https://elastic.co/search-labs/blog/jina-ai-embeddings-rerank-model-open-inference-api",
    "http://status.jina.ai/",
    "https://apidog.com/blog/recreate-openai-deep-research",
    "https://youtube.com/watch?v=QxHE4af5BQE",
    "https://sdxcentral.com/articles/news/cisco-engages-businesses-on-ai-strategies-at-greater-bay-area-2025/2025/02",
    "https://aws.amazon.com/blogs/machine-learning/build-rag-applications-using-jina-embeddings-v2-on-amazon-sagemaker-jumpstart",
    "https://reddit.com/r/perplexity_ai/comments/1ejbdqa/fastest_open_source_ai_search_engine",
    "https://search.jina.ai/",
    "https://sebastian-petrus.medium.com/build-openais-deep-research-open-source-alternative-4f21aed6d9f0",
    "https://medium.com/@elmo92/jina-reader-transforming-web-content-to-feed-llms-d238e827cc27",
    "https://openai.com/index/introducing-deep-research",
    "https://python.langchain.com/docs/integrations/tools/jina_search",
    "https://varindia.com/news/meta-is-in-talks-for-usd200-billion-ai-data-center-project",
    "https://varindia.com/news/Mira-Murati%E2%80%99s-new-AI-venture-eyes-$9-billion-valuation",
    "https://53ai.com/news/RAG/2025031401342.html",
    "https://arxiv.org/abs/2409.04701",
    "https://bigdatawire.com/this-just-in/together-ai-raises-305m-series-b-to-power-ai-model-training-and-inference",
    "https://github.blog/",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/MvwT9enRT7gOESHA_tpRj.jpeg",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/JNs_DrpFbr6ok_pSRUK4j.jpeg",
    "https://app.dealroom.co/lists/33530",
    "https://api-docs.deepseek.com/news/news250120",
    "https://sdxcentral.com/articles/news/ninjaone-raises-500-million-valued-at-5-billion/2025/02",
    "https://linkedin.com/sharing/share-offsite?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://twitter.com/intent/tweet?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://platform.openai.com/docs/api-reference/chat/create",
    "https://mp.weixin.qq.com/s/-pPhHDi2nz8hp5R3Lm_mww",
    "https://huggingface.us17.list-manage.com/subscribe?id=9ed45a3ef6&u=7f57e683fa28b51bfc493d048",
    "https://automatio.ai/",
    "https://sdk.vercel.ai/docs/introduction",
    "https://app.eu.vanta.com/jinaai/trust/vz7f4mohp0847aho84lmva",
    "https://apply.workable.com/huggingface/j/AF1D4E3FEB",
    "https://facebook.com/sharer/sharer.php?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://facebook.com/sharer/sharer.php?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://reddit.com/submit?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://apply.workable.com/huggingface",
    "https://news.ycombinator.com/submitlink?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://news.ycombinator.com/submitlink?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://docs.github.com/site-policy/privacy-policies/github-privacy-statement",
    "https://discord.jina.ai/",
    "https://docs.github.com/site-policy/github-terms/github-terms-of-service",
    "https://bigdatawire.com/this-just-in/qumulo-announces-30-million-funding",
    "https://x.ai/blog/grok-3",
    "https://m-ric-open-deep-research.hf.space/",
    "https://youtu.be/sal78ACtGTc?feature=shared&t=52",
    "https://mp.weixin.qq.com/s/apnorBj4TZs3-Mo23xUReQ",
    "https://perplexity.ai/hub/blog/introducing-perplexity-deep-research",
    "https://githubstatus.com/",
    "https://github.blog/changelog/2021-09-30-footnotes-now-supported-in-markdown-fields",
    "https://openai.com/index/introducing-operator",
    "mailto:[email protected]",
    "https://resources.github.com/learn/pathways",
    "https://status.jina.ai/",
    "https://reuters.com/technology/artificial-intelligence/tencents-messaging-app-weixin-launches-beta-testing-with-deepseek-2025-02-16",
    "https://scmp.com/tech/big-tech/article/3298981/baidu-adopts-deepseek-ai-models-chasing-tencent-race-embrace-hot-start",
    "https://microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks",
    "javascript:UC_UI.showSecondLayer();",
    "https://resources.github.com/",
    "https://storm-project.stanford.edu/research/storm",
    "https://blog.google/products/gemini/google-gemini-deep-research",
    "https://youtu.be/vrpraFiPUyA",
    "https://chat.baidu.com/search?extParamsJson=%7B%22enter_type%22%3A%22ai_explore_home%22%7D&isShowHello=1&pd=csaitab&setype=csaitab&usedModel=%7B%22modelName%22%3A%22DeepSeek-R1%22%7D",
    "https://app.dover.com/jobs/jinaai",
    "http://localhost:3000/",
    "https://docs.cherry-ai.com/",
    "https://en.wikipedia.org/wiki/Delayed_gratification",
    "https://support.github.com/?tags=dotcom-footer",
    "https://docs.jina.ai/",
    "https://skills.github.com/",
    "https://partner.github.com/",
    "https://help.x.com/resources/accessibility",
    "https://business.twitter.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://business.x.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://support.twitter.com/articles/20170514",
    "https://support.x.com/articles/20170514",
    "https://t.co/jnxcxPzndy",
    "https://t.co/6EtEMa9P05",
    "https://help.x.com/using-x/x-supported-browsers",
    "https://legal.twitter.com/imprint.html"
  ],
  "readURLs": [
    "https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch",
    "https://github.com/jina-ai/node-DeepResearch",
    "https://huggingface.co/blog/open-deep-research",
    "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
    "https://x.com/jinaai_?lang=en",
    "https://jina.ai/news",
    "https://x.com/joedevon/status/1896984525210837081",
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/tools/jina-latechunk.ts"
  ],
  "numURLs": 98
}

API-Schlüssel

Verfügbare Token

Dies ist Ihr einzigartiger Schlüssel. Bewahren Sie ihn sicher auf!

DeepSearch-Parameterhandbuch

Erfahren Sie, wie Sie die richtigen Parameter einstellen und die besten Ergebnisse erzielen.

Qualitätskontrolle

Bei DeepSearch gibt es grundsätzlich einen Kompromiss: Je mehr Schritte das System durchführt, desto hochwertigere Ergebnisse erhalten Sie, aber Sie verbrauchen auch mehr Token. Diese verbesserte Qualität resultiert aus umfassenderen, umfassenderen Suchen und einer tieferen Reflexion. Vier Hauptparameter steuern die Qualität von DeepSearch: „budget_tokens“, „max_attempts“, „team_size“ und „reasoning_effort“. Der Parameter „reasoning_effort“ ist im Wesentlichen eine voreingestellte Kombination aus „budget_tokens“ und „max_attempts“, die sorgfältig optimiert wurde. Für die meisten Nutzer ist die Anpassung von „reasoning_effort“ der einfachste Ansatz.

Budget-Token

„budget_tokens“ legt die maximal zulässige Anzahl an Token für den gesamten DeepSearch-Prozess fest. Dies umfasst alle Vorgänge, einschließlich Websuche, Lesen von Webseiten, Reflexion, Zusammenfassung und Codierung. Höhere Budgets führen naturgemäß zu einer besseren Antwortqualität. Der DeepSearch-Prozess wird beendet, sobald das Budget erschöpft ist oder eine zufriedenstellende Antwort gefunden wurde – je nachdem, was zuerst eintritt. Ist das Budget zuerst erschöpft, erhalten Sie zwar eine Antwort, diese ist jedoch möglicherweise nicht die endgültige, vollständig verfeinerte Antwort, da sie nicht alle durch „max_attempts“ definierten Qualitätsprüfungen bestanden hat.

Max. Versuche

„max_attempts“ bestimmt, wie oft das System während des DeepSearch-Prozesses versucht, ein Problem zu lösen. Jedes Mal, wenn DeepSearch eine Antwort liefert, muss es bestimmte, von einem internen Prüfer festgelegte Qualitätstests bestehen. Besteht die Antwort diese Tests nicht, gibt der Prüfer Feedback, das das System nutzt, um die Suche fortzusetzen und die Antwort zu verfeinern. Ein zu niedriger Wert für „max_attempts“ führt zwar zu schnellen Ergebnissen, die Qualität kann jedoch darunter leiden, da die Antwort möglicherweise nicht alle Qualitätsprüfungen besteht. Ein zu hoher Wert kann dazu führen, dass der Prozess in einer Endlosschleife feststeckt und immer wieder versucht, einen Fehler zu machen.

Das System gibt eine endgültige Antwort zurück, wenn entweder die Anzahl der Budgettoken oder die Anzahl der Versuche überschritten wird (je nachdem, was zuerst eintritt) oder wenn die Antwort alle Tests besteht und noch Budget und Versuche verfügbar sind.

Teamgröße

„Teamgröße“ beeinflusst die Qualität grundlegend anders als „Maximale Versuche“ und „Budgettoken“. Wenn „Teamgröße“ auf mehr als eins gesetzt ist, zerlegt das System das ursprüngliche Problem in Teilprobleme und untersucht diese unabhängig voneinander. Stellen Sie sich das wie ein Map-Reduce-Muster vor, bei dem ein großer Auftrag in kleinere, parallel ausgeführte Aufgaben zerlegt wird. Die endgültige Antwort ist dann eine Synthese der Ergebnisse jedes einzelnen Mitarbeiters. Wir nennen es „Teamgröße“, weil es ein Forschungsteam simuliert, in dem mehrere Agenten verschiedene Aspekte desselben Problems untersuchen und gemeinsam an einem Abschlussbericht arbeiten.

Beachten Sie, dass der Tokenverbrauch aller Agenten zu Ihren gesamten Budgettoken zählt, jeder Agent jedoch über unabhängige „Maximale Versuche“ verfügt. Das bedeutet, dass Agenten bei einer größeren Teamgröße, aber gleichen Budgettoken aufgrund von Budgetbeschränkungen möglicherweise früher als erwartet Antworten liefern. Wir empfehlen, sowohl Teamgröße als auch Budgettoken gemeinsam zu erhöhen, um jedem Agenten ausreichend Ressourcen für eine gründliche Arbeit zu geben.

Die Teamgröße bestimmt die Breite der Suche – sie bestimmt, wie viele verschiedene Aspekte untersucht werden. Budgettoken und maximale Versuche bestimmen die Tiefe der Suche – also wie gründlich jeder Aspekt untersucht wird.

Quellcodeverwaltung

DeepSearch setzt stark auf fundierte Informationen – die verwendeten Quellen. Qualität hängt nicht nur von algorithmischer Tiefe und Breite ab; woher DeepSearch seine Informationen bezieht, ist ebenso wichtig und oft der entscheidende Faktor. Sehen wir uns die wichtigsten Parameter an, die dies steuern.

Keine direkte Antwort

„no_direct_answer“ ist ein einfacher Schalter, der verhindert, dass das System in Schritt 1 eine Antwort zurückgibt. Ist dieser Schalter aktiviert, wird die Nutzung internen Wissens deaktiviert und das System wird gezwungen, immer zuerst im Internet zu suchen. Dadurch überdenkt das System selbst einfache Fragen wie „Welcher Tag ist heute?“ oder „Wie geht es Ihnen?“ oder grundlegendes Faktenwissen, das definitiv in den Trainingsdaten des Modells enthalten ist, wie z. B. „Wer war der 40. Präsident der USA?“.

Hostnamen-Kontrolle

Drei Parameter – „boost_hostnames“, „bad_hostnames“ und „only_hostnames“ – geben DeepSearch an, welche Webseiten priorisiert, vermieden oder ausschließlich verwendet werden sollen. Um zu verstehen, wie diese funktionieren, betrachten Sie den Such- und Lesevorgang in DeepSearch:

Suchphase: Das System durchsucht das Web und ruft eine Liste von Website-URLs mit ihren Snippets ab.
Auswahlphase: Das System entscheidet, welche URLs tatsächlich besucht werden (aus Zeit- und Kostengründen werden nicht alle besucht).

boost_hostnames: Die hier aufgeführten Domains erhalten eine höhere Priorität und werden mit höherer Wahrscheinlichkeit besucht.
bad_hostnames: Diese Domains werden nie besucht.
only_hostnames: Wenn definiert, werden nur URLs besucht, die diesen Hostnamen entsprechen.

Hier einige wichtige Hinweise zu Hostnamenparametern: Das System verwendet immer die von Suchmaschinen zurückgegebenen Snippets als erste Anhaltspunkte für den Aufbau von Argumentationsketten. Diese Hostnamenparameter beeinflussen nur, welche Webseiten das System besucht, nicht aber, wie es Suchanfragen formuliert.

Zweitens: Wenn die erfassten URLs nicht die in only_hostnames angegebenen Domänen enthalten, kann das System das Lesen von Webseiten vollständig einstellen. Wir empfehlen, diese Parameter nur zu verwenden, wenn Sie mit Ihrer Forschungsfrage vertraut sind und wissen, wo potenzielle Antworten wahrscheinlich zu finden sind (oder wo sie definitiv nicht zu finden sein sollten).

Sonderfall: Akademische Forschung

Für die akademische Forschung möchten Sie möglicherweise Such- und Lesevorgänge auf arxiv.org beschränken. Setzen Sie in diesem Fall einfach "search_provider": "arxiv", und alles basiert auf arxiv als einziger Quelle. Allgemeine oder triviale Fragen erhalten mit dieser Einschränkung jedoch möglicherweise keine effizienten Antworten. Verwenden Sie "search_provider": "arxiv" daher nur für ernsthafte akademische Forschung.

Suchsprachencode

``search_language_code` ist ein weiterer Parameter, der Webquellen beeinflusst, indem er das System zwingt, Abfragen in einer bestimmten Sprache zu generieren, unabhängig von der ursprünglichen Eingabe oder den dazwischenliegenden Argumentationsschritten. In der Regel wählt das System die Abfragesprache automatisch, um eine optimale Suchabdeckung zu erzielen. Manchmal ist jedoch eine manuelle Steuerung sinnvoll.

Anwendungsfälle für die Sprachsteuerung

Internationale Marktforschung: Wenn Sie den Einfluss einer lokalen Marke oder eines Unternehmens auf internationalen Märkten untersuchen, können Sie Abfragen mit "search_language_code": "en" so konfigurieren, dass sie immer Englisch verwenden, um eine globale Abdeckung zu gewährleisten. Alternativ können Sie die lokale Sprache für spezifischere regionale Informationen verwenden.

Globale Marktforschung mit nicht-englischen Eingabeaufforderungen: Wenn Ihre Eingaben immer auf Chinesisch oder Japanisch erfolgen (da Ihre Endnutzer hauptsächlich diese Sprachen sprechen), Ihr Rechercheumfang aber global und nicht nur auf lokale chinesische oder japanische Websites beschränkt ist, kann das System automatisch die Sprache Ihrer Eingabeaufforderung bevorzugen. Verwenden Sie diesen Parameter, um englische Abfragen für eine breitere internationale Abdeckung zu erzwingen.

Chatten Sie mit DeepSearch

Stimmungscheck mit einer einfachen Chat-Benutzeroberfläche. DeepSearch eignet sich am besten für komplexe Fragen, die iteratives Denken, Weltwissen oder aktuelle Informationen erfordern.

Wir haben gerade eine neue DeepSearch-Benutzeroberfläche eingeführt, die blitzschnell, minimalistisch und KOSTENLOS ist. Sehen Sie sie sich unter https://search.jina.ai an oder klicken Sie auf die Schaltfläche unten, um sie auszuprobieren!Neue Benutzeroberfläche besuchen

Chat-Clients

Für ein optimales Erlebnis empfehlen wir die Verwendung professioneller Chat-Clients. DeepSearch ist vollständig mit dem Chat-API-Schema von OpenAI kompatibel und lässt sich daher problemlos mit jedem OpenAI-kompatiblen Client verwenden.

API-Endpunkt

Modellname

API-Schlüssel

TypingMind

Chatwise

Cherry Studio

Chatbox

LobeChat

NextChat

Was ist DeepSearch?

DeepSearch kombiniert Websuche, Lesen und Argumentation für eine umfassende Untersuchung. Stellen Sie es sich als einen Agenten vor, dem Sie eine Rechercheaufgabe erteilen – er sucht umfassend und durchläuft mehrere Iterationen, bevor er eine Antwort liefert.

Standard-LLM

ca. 1000 Token

ca. 1s

Schnelle Antworten auf Allgemeinwissensfragen

Kein Zugriff auf Echtzeit- oder Nachtrainingsinformationen möglich

Antworten werden ausschließlich aus vorab trainiertem Wissen mit einem festen Stichtag generiert

RAG und Grounded LLMs

etwa 10.000 Token

ca. 3s

Fragen, die aktuelle oder domänenspezifische Informationen erfordern

Hat Probleme mit komplexen Fragen, die Multi-Hop-Argumentation erfordern

Antworten, die durch die Zusammenfassung der Ergebnisse einer Single-Pass-Suche generiert werden

Kann auch nach Trainingsende auf aktuelle Informationen zugreifen

DeepSearch

etwa 500.000 Token

etwa 50er Jahre

Komplexe Fragen, die gründliche Recherche und Argumentation erfordern

Dauert länger als einfache LLM- oder RAG-Ansätze

Autonomer Agent, der iterativ sucht, liest und argumentiert

Entscheidet dynamisch über die nächsten Schritte auf Grundlage aktueller Erkenntnisse

Bewertet die Qualität der Antworten selbst, bevor Ergebnisse zurückgegeben werden

Kann durch mehrere Such- und Argumentationszyklen tief in Themen eintauchen

API-Preise

Die API-Preise basieren auf der Token-Nutzung. Ein API-Schlüssel gibt Ihnen Zugriff auf alle Produkte der Suchgrundlage.

Mit Jina Search Foundation API

Der einfachste Weg, auf alle unsere Produkte zuzugreifen. Laden Sie Tokens unterwegs auf.

Geben Sie den API-Schlüssel ein, den Sie aufladen möchten

Laden Sie diesen API-Schlüssel mit weiteren Token auf

Abhängig von Ihrem Standort werden Ihnen möglicherweise USD, EUR oder andere Währungen in Rechnung gestellt. Es können Steuern anfallen.

Bitte geben Sie zum Aufladen den richtigen API-Schlüssel ein

Verstehen Sie die Ratenbegrenzung

Ratenbegrenzungen sind die maximale Anzahl von Anfragen, die pro Minute pro IP-Adresse/API-Schlüssel (RPM) an eine API gestellt werden können. Nachfolgend erfahren Sie mehr über die Ratenbegrenzungen für jedes Produkt und jede Stufe.

Ratenbegrenzung

Ratenbegrenzungen werden auf drei Arten verfolgt: RPM (Anfragen pro Minute) und TPM (Token pro Minute). Die Begrenzungen werden pro IP/API-Schlüssel erzwungen und ausgelöst, wenn zuerst der RPM- oder TPM-Schwellenwert erreicht wird. Wenn Sie im Anforderungsheader einen API-Schlüssel angeben, verfolgen wir die Ratenbegrenzungen nach Schlüssel und nicht nach IP-Adresse.

Spalten

Produkt	API-Endpunkt	Beschreibung	ohne API-Schlüssel	mit API-Schlüssel	mit Premium-API-Schlüssel	Durchschnittliche Latenz	Zählung der Token-Nutzung	Zulässige Anfrage
Leser-API	`https://r.jina.ai`	URL in LLM-freundlichen Text konvertieren	20 RPM	500 RPM	5000 RPM	7.9s	Zählen Sie die Anzahl der Token in der Ausgabeantwort.	GET/POST
Leser-API	`https://s.jina.ai`	Durchsuchen Sie das Web und konvertieren Sie die Ergebnisse in LLM-freundlichen Text		100 RPM	1000 RPM	2.5s	Jede Anfrage kostet eine feste Anzahl an Token, beginnend bei 10000 Token	GET/POST
DeepSearch	`https://deepsearch.jina.ai/v1/chat/completions`	Überlegen, suchen und iterieren, um die beste Antwort zu finden		50 RPM	500 RPM	56.7s	Zählen Sie die Gesamtzahl der Token im gesamten Vorgang.	POST
Einbettungs-API	`https://api.jina.ai/v1/embeddings`	Konvertieren Sie Text/Bilder in Vektoren mit fester Länge		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	hängt von der Eingangsgröße ab	Zählen Sie die Anzahl der Token in der Eingabeanforderung.	POST
Reranker-API	`https://api.jina.ai/v1/rerank`	Ordnen Sie Dokumente nach Abfrage		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	hängt von der Eingangsgröße ab	Zählen Sie die Anzahl der Token in der Eingabeanforderung.	POST
Klassifizierer-API	`https://api.jina.ai/v1/train`	Trainieren eines Klassifikators anhand gekennzeichneter Beispiele		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens × num_iters	POST
Klassifizierer-API (Nullschuss)	`https://api.jina.ai/v1/classify`	Klassifizieren Sie Eingaben mithilfe der Zero-Shot-Klassifizierung		200 RPM & 500,000 TPM	1,000 RPM & 3,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens + label_tokens	POST
Klassifizierer-API (Wenige Schüsse)	`https://api.jina.ai/v1/classify`	Klassifizieren Sie Eingaben mit einem trainierten Few-Shot-Klassifikator		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens	POST
Segmenter-API	`https://api.jina.ai/v1/segment`	Tokenisieren und Segmentieren von Langtext	20 RPM	200 RPM	1,000 RPM	0.3s	Token werden nicht als Nutzung gezählt.	GET/POST

Automatisches Aufladen bei niedrigem Token-Guthaben

Empfohlen für einen unterbrechungsfreien Betrieb in der Produktion. Wenn Ihr Token-Guthaben unter den festgelegten Schwellenwert fällt, belasten wir Ihre gespeicherte Zahlungsmethode automatisch für das zuletzt gekaufte Paket, bis der Schwellenwert erreicht ist.

Am 6. Mai 2025 haben wir ein neues Preismodell eingeführt. Wenn Sie die automatische Aufladung vor diesem Datum aktiviert haben, zahlen Sie weiterhin den alten Preis (den zum Zeitpunkt des Kaufs). Die neuen Preise gelten nur, wenn Sie Ihre Einstellungen für die automatische Aufladung ändern oder einen neuen API-Schlüssel erwerben.

< 1M Token

Aufladen, wenn

FAQ

Was ist DeepSearch?

Wie unterscheidet sich DeepSearch von den umfassenden Recherchefunktionen von OpenAI und Gemini?

Welchen API-Schlüssel benötige ich, um DeepSearch zu verwenden?

Was passiert, wenn DeepSearch sein Token-Budget erreicht? Gibt es eine unvollständige Antwort zurück?

Garantiert DeepSearch genaue Antworten?

Wie lange dauert eine typische DeepSearch-Abfrage?

Kann DeepSearch mit jedem OpenAI-kompatiblen Client wie Chatwise, CherryStudio oder ChatBox funktionieren?

Was sind die Ratenbegrenzungen für die API?

Was ist der Inhalt des -Tags?

Verwendet DeepSearch Jina Reader für die Websuche und das Lesen?

Warum verwendet DeepSearch so viele Token für meine Abfragen?

Gibt es eine Möglichkeit, die Anzahl der Schritte zu kontrollieren oder zu begrenzen?

Wie zuverlässig sind die Referenzen in den Antworten?

Kann DeepSearch Fragen zu zukünftigen Ereignissen verarbeiten?

Wie erhalte ich meinen API-Schlüssel?

Wie hoch ist die Ratenbegrenzung?

Ratenbegrenzung

Spalten

Produkt	API-Endpunkt	Beschreibung	ohne API-Schlüssel	mit API-Schlüssel	mit Premium-API-Schlüssel	Durchschnittliche Latenz	Zählung der Token-Nutzung	Zulässige Anfrage
Leser-API	`https://r.jina.ai`	URL in LLM-freundlichen Text konvertieren	20 RPM	500 RPM	5000 RPM	7.9s	Zählen Sie die Anzahl der Token in der Ausgabeantwort.	GET/POST
Leser-API	`https://s.jina.ai`	Durchsuchen Sie das Web und konvertieren Sie die Ergebnisse in LLM-freundlichen Text		100 RPM	1000 RPM	2.5s	Jede Anfrage kostet eine feste Anzahl an Token, beginnend bei 10000 Token	GET/POST
DeepSearch	`https://deepsearch.jina.ai/v1/chat/completions`	Überlegen, suchen und iterieren, um die beste Antwort zu finden		50 RPM	500 RPM	56.7s	Zählen Sie die Gesamtzahl der Token im gesamten Vorgang.	POST
Einbettungs-API	`https://api.jina.ai/v1/embeddings`	Konvertieren Sie Text/Bilder in Vektoren mit fester Länge		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	hängt von der Eingangsgröße ab	Zählen Sie die Anzahl der Token in der Eingabeanforderung.	POST
Reranker-API	`https://api.jina.ai/v1/rerank`	Ordnen Sie Dokumente nach Abfrage		500 RPM & 1,000,000 TPM	2,000 RPM & 5,000,000 TPM	hängt von der Eingangsgröße ab	Zählen Sie die Anzahl der Token in der Eingabeanforderung.	POST
Klassifizierer-API	`https://api.jina.ai/v1/train`	Trainieren eines Klassifikators anhand gekennzeichneter Beispiele		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens × num_iters	POST
Klassifizierer-API (Nullschuss)	`https://api.jina.ai/v1/classify`	Klassifizieren Sie Eingaben mithilfe der Zero-Shot-Klassifizierung		200 RPM & 500,000 TPM	1,000 RPM & 3,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens + label_tokens	POST
Klassifizierer-API (Wenige Schüsse)	`https://api.jina.ai/v1/classify`	Klassifizieren Sie Eingaben mit einem trainierten Few-Shot-Klassifikator		20 RPM & 200,000 TPM	60 RPM & 1,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens	POST
Segmenter-API	`https://api.jina.ai/v1/segment`	Tokenisieren und Segmentieren von Langtext	20 RPM	200 RPM	1,000 RPM	0.3s	Token werden nicht als Nutzung gezählt.	GET/POST

Kann ich denselben API-Schlüssel für Reader-, Einbettungs-, Neurang-, Klassifizierungs- und Feinabstimmungs-APIs verwenden?

Kann ich die Token-Nutzung meines API-Schlüssels überwachen?

Was soll ich tun, wenn ich meinen API-Schlüssel vergesse?

Laufen API-Schlüssel ab?

Kann ich Token zwischen API-Schlüsseln übertragen?

Kann ich meinen API-Schlüssel widerrufen?

Warum ist die erste Anfrage für einige Modelle langsam?

Werden Benutzereingabedaten zum Training Ihrer Modelle verwendet?

Erfolgt die Abrechnung nach der Anzahl der Sätze bzw. Anfragen?

Gibt es eine kostenlose Testversion für neue Benutzer?

Werden für fehlgeschlagene Anfragen Token berechnet?

Welche Zahlungsmethoden werden akzeptiert?

Ist eine Rechnungsstellung für Token-Käufe verfügbar?