Ricerca profonda

Cerca, leggi e ragiona finché non trovi la risposta migliore.

API di ricerca profonda

Completamente compatibile con lo schema API Chat di OpenAI, basta sostituire api.openai.com con deepsearch.jina.ai per iniziare.

Limite di velocità

Sollevare la questione

FAQ

Docs

Stato

Chatta con DeepSearch

Controllo delle vibrazioni con una semplice interfaccia utente di chat. DeepSearch è la scelta migliore per domande complesse che richiedono ragionamento iterativo, conoscenza del mondo o informazioni aggiornate.

Streaming

Fornisce gli eventi man mano che si verificano tramite eventi inviati dal server, inclusi i passaggi di ragionamento e le risposte finali. Consigliamo vivamente di mantenere abilitata questa opzione poiché le richieste DeepSearch possono richiedere molto tempo per essere completate. La disattivazione dello streaming potrebbe causare errori di "timeout 524".

Sforzo di ragionamento

Limita lo sforzo di ragionamento per i modelli di ragionamento. I valori attualmente supportati sono basso, medio e alto. Ridurre lo sforzo di ragionamento può comportare risposte più rapide e meno token utilizzati nel ragionamento in una risposta.

medium

Gettoni di bilancio

Ciò determina il numero massimo di token consentiti per il processo DeepSearch. Budget più ampi possono migliorare la qualità della risposta abilitando una ricerca più esaustiva per query complesse, sebbene DeepSearch potrebbe non utilizzare l'intero budget assegnato. Ciò sostituisce il parametro reasoning_effort.

Tentativi massimi

Il numero massimo di tentativi per risolvere un problema (e tutti i sottoproblemi) nel processo DeepSearch. Un valore più grande consente a DeepSearch di riprovare a risolvere il problema utilizzando diversi approcci di ragionamento e strategie di intervento. Questo parametro sostituisce il parametro reasoning_effort.

Dimensione del team Agentic

Il numero di agenti che lavoreranno al problema in parallelo. Tutti gli agenti condivideranno un budget token, ma max_attempts indipendenti, e collaboreranno per produrre una risposta finale.

Nessuna risposta diretta

Forza il modello a compiere ulteriori passi di riflessione/ricerca anche quando la query sembra banale. Questo è utile se si utilizza DeepSearch in scenari in cui si è certi che la query abbia sempre bisogno di DeepSearch, piuttosto che per domande banali come '1+1=?'

Ricerca ottimizzata Arxiv

Sperimentale

Motore di ricerca ottimizzato per gli articoli di ricerca su arXiv. Questo limiterà la ricerca solo ad arXiv.

Output strutturato

In questo modo vengono abilitati gli output strutturati, che garantiscono che la risposta finale del modello corrisponda allo schema JSON fornito.

Linguaggio di query di ricerca

Forza la lingua da utilizzare per la query di ricerca. Utile quando è più probabile che le risorse siano in una lingua specifica. Per impostazione predefinita, viene determinata automaticamente dal sistema.

Rispondi e pensa al linguaggio

Forza la lingua della risposta e pensa con il codice di lingua fornito. Per impostazione predefinita, viene determinato automaticamente dalla lingua principale dei messaggi di input. La qualità della risposta potrebbe essere leggermente influenzata dalla lingua.

Buoni domini

Un elenco di domini a cui viene data una priorità più alta per il recupero dei contenuti. Utile per fonti specifiche per dominio, di alta qualità, che forniscono contenuti di valore.

Domini cattivi

Un elenco di domini da escludere rigorosamente dal recupero dei contenuti. Solitamente utilizzato per filtrare spam noto, siti web di bassa qualità o irrilevanti.

Solo domini

Un elenco di domini da includere esclusivamente nel recupero dei contenuti. Tutti gli altri domini saranno ignorati. Utile per ricerche specifiche per dominio.

URL massimi restituiti

Numero massimo di URL da includere nella risposta/frammento finale. Gli URL sono ordinati in base alla pertinenza e ad altri fattori importanti.

Messaggi

Elenco dei messaggi scambiati tra l'utente e l'assistente durante la conversazione finora avvenuta.

Utente

Assistente

Utente

Allega Immagine/Documento

Sono supportati diversi tipi di messaggi (modalità), come testo (.txt, .pdf), immagini (.png, .webp, .jpeg). Sono supportati file fino a 10 MB e devono essere codificati in anticipo in URI dati.

Messaggio di testo normale

{
  "role": "user",
  "content": "hi"
}

Richiesta

Bash

Lingua

curl https://deepsearch.jina.ai/v1/chat/completions \
  -H "Content-Type: application/json"\
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "model": "jina-deepsearch-v1",
    "messages": [
        {
            "role": "user",
            "content": "Hi!"
        },
        {
            "role": "assistant",
            "content": "Hi, how can I help you?"
        },
        {
            "role": "user",
            "content": "what's the latest blog post from jina ai?"
        }
    ],
    "stream": true,
    "reasoning_effort": "medium"
  }
EOFEOF

Questo è l'ultimo pezzo del flusso che contiene la risposta finale, gli URL visitati e l'utilizzo del token. Fai clic sul pulsante in alto per ottenere una risposta in tempo reale.

Risposta

200 OK

0.0 s

196,526 Gettoni

{
  "id": "1742181758589",
  "object": "chat.completion.chunk",
  "created": 1742181758,
  "model": "jina-deepsearch-v1",
  "system_fingerprint": "fp_1742181758589",
  "choices": [
    {
      "index": 0,
      "delta": {
        "content": "The latest blog post from Jina AI is titled \"Snippet Selection and URL Ranking in DeepSearch/DeepResearch,\" published on March 12, 2025 [^1]. This post discusses how to improve the quality of DeepSearch by using late-chunking embeddings for snippet selection and rerankers to prioritize URLs before crawling. You can read the full post here: https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch\n\n[^1]: Since our DeepSearch release on February 2nd 2025 we ve discovered two implementation details that greatly improved quality In both cases multilingual embeddings and rerankers are used in an in context manner operating at a much smaller scale than the traditional pre computed indices these models typically require  [jina.ai](https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch)",
        "type": "text",
        "annotations": [
          {
            "type": "url_citation",
            "url_citation": {
              "title": "Snippet Selection and URL Ranking in DeepSearch/DeepResearch",
              "exactQuote": "Since our DeepSearch release on February 2nd 2025, we've discovered two implementation details that greatly improved quality. In both cases, multilingual embeddings and rerankers are used in an _\"in-context\"_ manner - operating at a much smaller scale than the traditional pre-computed indices these models typically require.",
              "url": "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
              "dateTime": "2025-03-13 06:48:01"
            }
          }
        ]
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 169670,
    "completion_tokens": 27285,
    "total_tokens": 196526
  },
  "visitedURLs": [
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/utils/url-tools.ts",
    "https://huggingface.co/jinaai/jina-embeddings-v3",
    "https://github.com/jina-ai/reader",
    "https://zilliz.com/blog/training-text-embeddings-with-jina-ai",
    "https://threads.net/@unwind_ai/post/DGmhWCVswbe/media",
    "https://twitter.com/JinaAI_/status/1899840196507820173",
    "https://jina.ai/news?tag=tech-blog",
    "https://docs.llamaindex.ai/en/stable/examples/embeddings/jinaai_embeddings",
    "https://x.com/jinaai_",
    "https://x.com/JinaAI_/status/1899840202358784170",
    "https://tracxn.com/d/companies/jina-ai/__IQ81fOnU0FsDpagFjG-LrG0DMWHELqI6znTumZBQF-A/funding-and-investors",
    "https://jina.ai/models",
    "https://linkedin.com/posts/imohitmayank_jinaai-has-unveiled-the-ultimate-developer-activity-7300401711242711040-VD64",
    "https://medium.com/@tossy21/trying-out-jina-ais-node-deepresearch-c5b55d630ea6",
    "https://huggingface.co/jinaai/jina-clip-v2",
    "https://arxiv.org/abs/2409.10173",
    "https://milvus.io/docs/embed-with-jina.md",
    "https://seedtable.com/best-startups-in-china",
    "https://threads.net/@sung.kim.mw/post/DGhG-J_vREu/jina-ais-a-practical-guide-to-implementing-deepsearchdeepresearchthey-cover-desi",
    "https://elastic.co/search-labs/blog/jina-ai-embeddings-rerank-model-open-inference-api",
    "http://status.jina.ai/",
    "https://apidog.com/blog/recreate-openai-deep-research",
    "https://youtube.com/watch?v=QxHE4af5BQE",
    "https://sdxcentral.com/articles/news/cisco-engages-businesses-on-ai-strategies-at-greater-bay-area-2025/2025/02",
    "https://aws.amazon.com/blogs/machine-learning/build-rag-applications-using-jina-embeddings-v2-on-amazon-sagemaker-jumpstart",
    "https://reddit.com/r/perplexity_ai/comments/1ejbdqa/fastest_open_source_ai_search_engine",
    "https://search.jina.ai/",
    "https://sebastian-petrus.medium.com/build-openais-deep-research-open-source-alternative-4f21aed6d9f0",
    "https://medium.com/@elmo92/jina-reader-transforming-web-content-to-feed-llms-d238e827cc27",
    "https://openai.com/index/introducing-deep-research",
    "https://python.langchain.com/docs/integrations/tools/jina_search",
    "https://varindia.com/news/meta-is-in-talks-for-usd200-billion-ai-data-center-project",
    "https://varindia.com/news/Mira-Murati%E2%80%99s-new-AI-venture-eyes-$9-billion-valuation",
    "https://53ai.com/news/RAG/2025031401342.html",
    "https://arxiv.org/abs/2409.04701",
    "https://bigdatawire.com/this-just-in/together-ai-raises-305m-series-b-to-power-ai-model-training-and-inference",
    "https://github.blog/",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/MvwT9enRT7gOESHA_tpRj.jpeg",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/JNs_DrpFbr6ok_pSRUK4j.jpeg",
    "https://app.dealroom.co/lists/33530",
    "https://api-docs.deepseek.com/news/news250120",
    "https://sdxcentral.com/articles/news/ninjaone-raises-500-million-valued-at-5-billion/2025/02",
    "https://linkedin.com/sharing/share-offsite?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://twitter.com/intent/tweet?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://platform.openai.com/docs/api-reference/chat/create",
    "https://mp.weixin.qq.com/s/-pPhHDi2nz8hp5R3Lm_mww",
    "https://huggingface.us17.list-manage.com/subscribe?id=9ed45a3ef6&u=7f57e683fa28b51bfc493d048",
    "https://automatio.ai/",
    "https://sdk.vercel.ai/docs/introduction",
    "https://app.eu.vanta.com/jinaai/trust/vz7f4mohp0847aho84lmva",
    "https://apply.workable.com/huggingface/j/AF1D4E3FEB",
    "https://facebook.com/sharer/sharer.php?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://facebook.com/sharer/sharer.php?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://reddit.com/submit?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://apply.workable.com/huggingface",
    "https://news.ycombinator.com/submitlink?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://news.ycombinator.com/submitlink?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://docs.github.com/site-policy/privacy-policies/github-privacy-statement",
    "https://discord.jina.ai/",
    "https://docs.github.com/site-policy/github-terms/github-terms-of-service",
    "https://bigdatawire.com/this-just-in/qumulo-announces-30-million-funding",
    "https://x.ai/blog/grok-3",
    "https://m-ric-open-deep-research.hf.space/",
    "https://youtu.be/sal78ACtGTc?feature=shared&t=52",
    "https://mp.weixin.qq.com/s/apnorBj4TZs3-Mo23xUReQ",
    "https://perplexity.ai/hub/blog/introducing-perplexity-deep-research",
    "https://githubstatus.com/",
    "https://github.blog/changelog/2021-09-30-footnotes-now-supported-in-markdown-fields",
    "https://openai.com/index/introducing-operator",
    "mailto:[email protected]",
    "https://resources.github.com/learn/pathways",
    "https://status.jina.ai/",
    "https://reuters.com/technology/artificial-intelligence/tencents-messaging-app-weixin-launches-beta-testing-with-deepseek-2025-02-16",
    "https://scmp.com/tech/big-tech/article/3298981/baidu-adopts-deepseek-ai-models-chasing-tencent-race-embrace-hot-start",
    "https://microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks",
    "javascript:UC_UI.showSecondLayer();",
    "https://resources.github.com/",
    "https://storm-project.stanford.edu/research/storm",
    "https://blog.google/products/gemini/google-gemini-deep-research",
    "https://youtu.be/vrpraFiPUyA",
    "https://chat.baidu.com/search?extParamsJson=%7B%22enter_type%22%3A%22ai_explore_home%22%7D&isShowHello=1&pd=csaitab&setype=csaitab&usedModel=%7B%22modelName%22%3A%22DeepSeek-R1%22%7D",
    "https://app.dover.com/jobs/jinaai",
    "http://localhost:3000/",
    "https://docs.cherry-ai.com/",
    "https://en.wikipedia.org/wiki/Delayed_gratification",
    "https://support.github.com/?tags=dotcom-footer",
    "https://docs.jina.ai/",
    "https://skills.github.com/",
    "https://partner.github.com/",
    "https://help.x.com/resources/accessibility",
    "https://business.twitter.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://business.x.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://support.twitter.com/articles/20170514",
    "https://support.x.com/articles/20170514",
    "https://t.co/jnxcxPzndy",
    "https://t.co/6EtEMa9P05",
    "https://help.x.com/using-x/x-supported-browsers",
    "https://legal.twitter.com/imprint.html"
  ],
  "readURLs": [
    "https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch",
    "https://github.com/jina-ai/node-DeepResearch",
    "https://huggingface.co/blog/open-deep-research",
    "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
    "https://x.com/jinaai_?lang=en",
    "https://jina.ai/news",
    "https://x.com/joedevon/status/1896984525210837081",
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/tools/jina-latechunk.ts"
  ],
  "numURLs": 98
}

Chiave API

Gettoni disponibili

Questa è la tua chiave unica. Conservala in modo sicuro!

Guida ai parametri di DeepSearch

Scopri come impostare i parametri giusti e ottenere i risultati migliori.

Controllo Qualità

In DeepSearch, c’è generalmente un compromesso: più passaggi esegue il sistema, maggiore sarà la qualità dei risultati ottenuti, ma si consumeranno anche più token. Questa qualità migliorata deriva da ricerche più ampie ed esaustive e da una riflessione più approfondita. Quattro parametri principali controllano la qualità di DeepSearch: budget_tokens, max_attempts, team_size e reasoning_effort. Il parametro reasoning_effort è essenzialmente una combinazione preimpostata di budget_tokens e max_attempts che è stata accuratamente ottimizzata. Per la maggior parte degli utenti, regolare reasoning_effort è l’approccio più semplice.

Token di Budget

budget_tokens imposta il numero massimo di token consentiti per l’intero processo di DeepSearch. Questo include tutte le operazioni, incluse ricerche web, lettura di pagine web, riflessione, riepilogo e codifica. Budget più elevati portano naturalmente a una migliore qualità delle risposte. Il processo di DeepSearch si interromperà quando il budget sarà esaurito o quando verrà trovata una risposta soddisfacente, a seconda di quale evento si verifichi per primo. Se il budget si esaurisce prima, si otterrà comunque una risposta, ma potrebbe non essere quella definitiva e completamente perfezionata, poiché non ha superato tutti i controlli di qualità definiti da max_attempts.

Tentativi massimi

max_attempts determina il numero di tentativi che il sistema effettuerà per risolvere un problema durante il processo di DeepSearch. Ogni volta che DeepSearch produce una risposta, deve superare determinati test di qualità definiti da un valutatore interno. Se la risposta non supera questi test, il valutatore fornisce un feedback e il sistema utilizza questo feedback per continuare la ricerca e perfezionare la risposta. Impostando max_attempts troppo basso si otterranno risultati rapidi, ma la qualità potrebbe risentirne, poiché la risposta potrebbe non superare tutti i controlli di qualità. Impostando un valore troppo alto, il processo potrebbe bloccarsi in un ciclo infinito di tentativi, in cui continua a fallire.

Il sistema restituisce una risposta finale quando viene superato il limite di budget_tokens o max_attempts (a seconda di quale evento si verifica per primo), oppure quando la risposta supera tutti i test pur avendo ancora a disposizione budget e tentativi rimanenti.

Dimensione del team

team_size influisce sulla qualità in modo fondamentalmente diverso rispetto a max_attempts e budget_tokens. Quando team_size è impostato su più di uno, il sistema scompone il problema originale in sottoproblemi e li analizza in modo indipendente. Si può pensare a questo come a un modello di riduzione a mappa, in cui un lavoro di grandi dimensioni viene suddiviso in attività più piccole che vengono eseguite in parallelo. La risposta finale è quindi una sintesi dei risultati di ciascun lavoratore. Lo chiamiamo “team_size” perché simula un team di ricerca in cui più agenti indagano diversi aspetti dello stesso problema e collaborano a un report finale.

Tenete presente che il consumo di token di tutti gli agenti contribuisce al totale dei budget_tokens, ma ogni agente ha un valore max_attempts indipendente. Ciò significa che con un valore di team_size più elevato ma con lo stesso valore di budget_tokens, gli agenti potrebbero restituire risposte prima del previsto a causa di vincoli di budget. Consigliamo di aumentare sia team_size che budget_tokens contemporaneamente per fornire a ciascun agente risorse sufficienti per svolgere un lavoro approfondito.

Infine, team_size può essere considerato come il parametro che controlla l’ampiezza della ricerca: determina quanti aspetti diversi verranno analizzati. Allo stesso tempo, budget_tokens e max_attempts controllano la profondità della ricerca, ovvero quanto approfonditamente verrà esplorato ogni aspetto.

Controllo della fonte

DeepSearch si basa fortemente sul grounding, ovvero sulle fonti che utilizza per le informazioni. La qualità non riguarda solo la profondità e l’ampiezza degli algoritmi; la fonte da cui DeepSearch ottiene le sue informazioni è altrettanto importante e spesso il fattore decisivo. Esploriamo i parametri chiave che controllano questo aspetto.

Nessuna risposta diretta

no_direct_answer è un semplice interruttore che impedisce al sistema di restituire una risposta al passaggio 1. Quando abilitato, disabilita la capacità del sistema di utilizzare le informazioni interne e lo obbliga a cercare sempre prima sul web. Attivandolo, il sistema “ripensa” anche a domande semplici come “che giorno è oggi”, “come stai” o a conoscenze di base che sono sicuramente presenti nei dati di addestramento del modello, come “chi è stato il 40° presidente degli Stati Uniti?”.

Controlli dei nomi host

Tre parametri, boost_hostnames, bad_hostnames e only_hostnames, indicano a DeepSearch quali pagine web dare priorità, evitare o utilizzare esclusivamente. Per capire come funzionano, considerate il processo di ricerca e lettura in DeepSearch:

Fase di ricerca: il sistema effettua una ricerca sul web e recupera un elenco di URL di siti web con i relativi snippet
Fase di selezione: il sistema decide quali URL visitare effettivamente (non li visita tutti per motivi di tempo e costi)

boost_hostnames: i domini elencati qui hanno una priorità più alta e hanno maggiori probabilità di essere visitati
bad_hostnames: questi domini non verranno mai visitati
only_hostnames: quando definiti, verranno visitati solo gli URL che corrispondono a questi nomi host

Ecco alcune note importanti sui parametri dei nomi host. In primo luogo, il sistema utilizza sempre gli snippet restituiti dai motori di ricerca come indizi iniziali per la costruzione di catene di ragionamento. Questi parametri relativi ai nomi host influenzano solo le pagine web visitate dal sistema, non il modo in cui formula le query di ricerca.

In secondo luogo, se gli URL raccolti non contengono domini specificati in only_hostnames, il sistema potrebbe interrompere completamente la lettura delle pagine web. Consigliamo di utilizzare questi parametri solo se si ha familiarità con la propria domanda di ricerca e si sa dove è probabile trovare potenziali risposte (o dove sicuramente non dovrebbero essere trovate).

Caso speciale: Ricerca accademica

Per la ricerca accademica, si potrebbe voler limitare le ricerche e le letture ad arxiv.org. In questo caso, è sufficiente impostare "search_provider": "arxiv" e tutto si baserà su arxiv come unica fonte. Tuttavia, domande generiche o banali potrebbero non ottenere risposte efficienti con questa restrizione, quindi utilizzare "search_provider": "arxiv" solo per la ricerca accademica seria.

Codice lingua di ricerca

search_language_code è un altro parametro che influenza le fonti web forzando il sistema a generare query in una lingua specifica, indipendentemente dall’input originale o dai passaggi di ragionamento intermedi. Generalmente, il sistema decide automaticamente la lingua di query per ottenere la migliore copertura di ricerca, ma a volte il controllo manuale è utile.

Casi d’uso per il controllo della lingua

Ricerca di mercato internazionale: quando si studia l’impatto di un marchio o di un’azienda locale sui mercati internazionali, è possibile forzare le query a utilizzare sempre l’inglese con "search_language_code": "en" per una copertura globale, oppure utilizzare la lingua locale per informazioni regionali più personalizzate.

Ricerca globale con prompt in altre lingue: se l’input è sempre in cinese o giapponese (perché i tuoi utenti finali parlano principalmente queste lingue), ma l’ambito di ricerca è globale anziché limitato ai siti web locali cinesi o giapponesi, il sistema potrebbe automaticamente orientarsi verso la lingua del prompt. Utilizza questo parametro per forzare le query in inglese per una copertura internazionale più ampia.

Chatta con DeepSearch

Abbiamo appena lanciato una nuova UI DeepSearch che è veloce come un fulmine, minimalista e GRATUITA. Dai un'occhiata su https://search.jina.ai o clicca sul pulsante qui sotto per provarla!Visita la nuova interfaccia utente

Clienti di chat

Per la migliore esperienza, consigliamo di utilizzare client di chat professionali. DeepSearch è completamente compatibile con lo schema API Chat di OpenAI, rendendolo facile da usare con qualsiasi client compatibile con OpenAI.

Punto finale API

Nome del modello

Chiave API

TypingMind

Chatwise

Cherry Studio

Chatbox

LobeChat

NextChat

Che cos'è DeepSearch?

DeepSearch combina la ricerca sul web, la lettura e il ragionamento per un'indagine completa. Immaginalo come un agente a cui assegni un compito di ricerca: esegue ricerche approfondite e lavora attraverso più iterazioni prima di fornire una risposta.

LLM standard

circa 1000 gettoni

circa 1s

Risposte rapide a domande di cultura generale

Non è possibile accedere alle informazioni in tempo reale o post-allenamento

Le risposte vengono generate esclusivamente da conoscenze pre-addestrate con una data limite fissa

RAG e LLM con messa a terra

circa 10.000 gettoni

circa 3 secondi

Domande che richiedono informazioni attuali o specifiche del dominio

Difficoltà con domande complesse che richiedono ragionamento multi-hop

Risposte generate riassumendo i risultati di una ricerca in un'unica passata

Può accedere alle informazioni correnti oltre il limite di formazione

Ricerca profonda

circa 500.000 token

circa 50 anni

Domande complesse che richiedono una ricerca e un ragionamento approfonditi

Richiede più tempo rispetto ai semplici approcci LLM o RAG

Agente autonomo che ricerca, legge e ragiona in modo iterativo

Decide dinamicamente i passaggi successivi in base ai risultati attuali

Autovaluta la qualità della risposta prima di restituire i risultati

Può effettuare approfondimenti sugli argomenti attraverso molteplici cicli di ricerca e ragionamento

Prezzi dell'API

Il prezzo dell'API si basa sull'utilizzo del token. Una chiave API ti dà accesso a tutti i prodotti della fondazione di ricerca.

Con l'API Jina Search Foundation

Il modo più semplice per accedere a tutti i nostri prodotti. Ricarica i token man mano che procedi.

Inserisci la chiave API che desideri ricaricare

Ricarica questa chiave API con più token

A seconda della tua posizione, l'addebito potrebbe essere effettuato in USD, EUR o altre valute. Potrebbero essere applicate tasse.

Inserisci la chiave API corretta per ricaricare

Comprendere il limite di velocità

I limiti di velocità sono il numero massimo di richieste che possono essere effettuate a un'API entro un minuto per indirizzo IP/chiave API (RPM). Scopri di più sui limiti di velocità per ogni prodotto e livello di seguito.

Limite di velocità

I limiti di velocità vengono monitorati in tre modi: RPM (richieste al minuto) e TPM (token al minuto). I limiti vengono applicati per IP/chiave API e vengono attivati al raggiungimento della soglia RPM o TPM. Quando si fornisce una chiave API nell'intestazione della richiesta, i limiti di velocità vengono monitorati per chiave anziché per indirizzo IP.

Colonne

Prodotto	Punto finale API	Descrizione	senza chiave API	con chiave API gratuita	con chiave API a pagamento	con chiave API Premium	Latenza media	Conteggio dell'utilizzo del token	Richiesta consentita
API del lettore	`https://r.jina.ai`	Convertire l'URL in testo compatibile con LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Contare il numero di token nella risposta di output.	GET/POST
API del lettore	`https://s.jina.ai`	Cerca sul web e converti i risultati in testo compatibile con LLM		100 RPM	100 RPM	1000 RPM	2.5s	Ogni richiesta costa un numero fisso di token, a partire da 10000 token	GET/POST
API di riclassificazione	`https://api.jina.ai/v1/rerank`	Classifica i documenti per query		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dipende dalla dimensione dell'input	Conta il numero di token nella richiesta di input.	POST
Incorporamento dell'API	`https://api.jina.ai/v1/embeddings`	Convertire testo/immagini in vettori di lunghezza fissa		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dipende dalla dimensione dell'input	Conta il numero di token nella richiesta di input.	POST
API del classificatore	`https://api.jina.ai/v1/train`	Addestrare un classificatore utilizzando esempi etichettati		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dipende dalla dimensione dell'input	I token vengono conteggiati come: input_tokens × num_iters	POST
API del classificatore (Colpo zero)	`https://api.jina.ai/v1/classify`	Classificare gli input utilizzando la classificazione zero-shot		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dipende dalla dimensione dell'input	I token vengono conteggiati come: input_tokens + label_tokens	POST
API del classificatore (Pochi colpi)	`https://api.jina.ai/v1/classify`	Classificare gli input utilizzando un classificatore addestrato a pochi scatti		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dipende dalla dimensione dell'input	I token sono conteggiati come: input_tokens	POST
API del segmentatore	`https://api.jina.ai/v1/segment`	Tokenizzare e segmentare il testo lungo	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Il token non viene conteggiato come utilizzo.	GET/POST
Ricerca profonda	`https://deepsearch.jina.ai/v1/chat/completions`	Ragiona, cerca e ripeti per trovare la risposta migliore		50 RPM	50 RPM	500 RPM	56.7s	Contare il numero totale di token nell'intero processo.	POST

Ricarica automatica del saldo basso del token

Consigliato per un servizio ininterrotto in produzione. Quando il saldo del tuo token scende sotto la soglia impostata, ricaricheremo automaticamente il tuo metodo di pagamento salvato per l'ultimo pacchetto acquistato, fino al raggiungimento della soglia.

Abbiamo introdotto un nuovo modello tariffario il 6 maggio 2025. Se hai attivato la ricarica automatica prima di questa data, continuerai a pagare il vecchio prezzo (quello al momento dell'acquisto). Il nuovo prezzo si applica solo se modifichi le impostazioni di ricarica automatica o acquisti una nuova chiave API.

< 1M Gettoni

Ricarica quando

Che cos'è DeepSearch?

In che modo DeepSearch si differenzia dalle capacità di ricerca approfondita di OpenAI e Gemini?

Quale chiave API mi serve per utilizzare DeepSearch?

Cosa succede quando DeepSearch raggiunge il suo budget token? Restituisce una risposta incompleta?

DeepSearch garantisce risposte accurate?

Quanto tempo impiega in genere una query DeepSearch?

DeepSearch può funzionare con qualsiasi client compatibile con OpenAI come Chatwise, CherryStudio o ChatBox?

Quali sono i limiti di velocità per l'API?

Qual è il contenuto all'interno del tag ?

DeepSearch utilizza Jina Reader per la ricerca e la lettura sul web?

Perché DeepSearch utilizza così tanti token per le mie query?

Esiste un modo per controllare o limitare il numero di passaggi?

Quanto sono affidabili i riferimenti nelle risposte?

DeepSearch può gestire domande su eventi futuri?

Come posso ottenere la mia chiave API?

Qual è il limite di tariffa?

Limite di velocità

Colonne

Prodotto	Punto finale API	Descrizione	senza chiave API	con chiave API gratuita	con chiave API a pagamento	con chiave API Premium	Latenza media	Conteggio dell'utilizzo del token	Richiesta consentita
API del lettore	`https://r.jina.ai`	Convertire l'URL in testo compatibile con LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Contare il numero di token nella risposta di output.	GET/POST
API del lettore	`https://s.jina.ai`	Cerca sul web e converti i risultati in testo compatibile con LLM		100 RPM	100 RPM	1000 RPM	2.5s	Ogni richiesta costa un numero fisso di token, a partire da 10000 token	GET/POST
API di riclassificazione	`https://api.jina.ai/v1/rerank`	Classifica i documenti per query		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dipende dalla dimensione dell'input	Conta il numero di token nella richiesta di input.	POST
Incorporamento dell'API	`https://api.jina.ai/v1/embeddings`	Convertire testo/immagini in vettori di lunghezza fissa		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dipende dalla dimensione dell'input	Conta il numero di token nella richiesta di input.	POST
API del classificatore	`https://api.jina.ai/v1/train`	Addestrare un classificatore utilizzando esempi etichettati		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dipende dalla dimensione dell'input	I token vengono conteggiati come: input_tokens × num_iters	POST
API del classificatore (Colpo zero)	`https://api.jina.ai/v1/classify`	Classificare gli input utilizzando la classificazione zero-shot		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dipende dalla dimensione dell'input	I token vengono conteggiati come: input_tokens + label_tokens	POST
API del classificatore (Pochi colpi)	`https://api.jina.ai/v1/classify`	Classificare gli input utilizzando un classificatore addestrato a pochi scatti		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dipende dalla dimensione dell'input	I token sono conteggiati come: input_tokens	POST
API del segmentatore	`https://api.jina.ai/v1/segment`	Tokenizzare e segmentare il testo lungo	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Il token non viene conteggiato come utilizzo.	GET/POST
Ricerca profonda	`https://deepsearch.jina.ai/v1/chat/completions`	Ragiona, cerca e ripeti per trovare la risposta migliore		50 RPM	50 RPM	500 RPM	56.7s	Contare il numero totale di token nell'intero processo.	POST

Posso usare la stessa chiave API per le API di lettura, incorporamento, riclassificazione, classificazione e messa a punto?

Posso monitorare l'utilizzo del token della mia chiave API?

Cosa devo fare se dimentico la mia chiave API?

Le chiavi API scadono?

Posso trasferire token tra chiavi API?

Posso revocare la mia chiave API?

Perché la prima richiesta per alcuni modelli è lenta?

I miei dati API vengono utilizzati per addestrare i vostri modelli?

Quali sono i limiti di velocità per le API Jina?

Esistono limiti alle dimensioni dei batch per le API?

La fatturazione è basata sul numero di frasi o richieste?

È disponibile una prova gratuita per i nuovi utenti?

Vengono addebitati i token per le richieste non riuscite?

Quali metodi di pagamento sono accettati?

È disponibile la fatturazione per gli acquisti di token?