Notizia
Modelli
API
keyboard_arrow_down
Lettore
Leggi gli URL e cerca sul web per ottenere LLM più approfonditi.
Incorporamenti
Incorporamenti multilingue multimodali di livello mondiale.
Riclassificazione
Recupero neurale di livello mondiale per massimizzare la pertinenza della ricerca.
MCP terminalCLIarticlellms.txtsmart_toyAgentidata_objectSchemamenu_bookDocumenti



Login
login

Ricerca profonda

Cerca, leggi e ragiona finché non trovi la risposta migliore.

play_arrowDimostrazione

API di ricerca profonda

Completamente compatibile con lo schema API Chat di OpenAI, basta sostituire api.openai.com con deepsearch.jina.ai per iniziare.
keyChiave API e fatturazione
more_horizDi più
chevron_leftchevron_right

home
speedLimite di velocità
bug_reportSollevare la questione
help_outlineFAQ
menu_bookDocs
Stato
chevron_leftchevron_right

Chatta con DeepSearch
Controllo delle vibrazioni con una semplice interfaccia utente di chat. DeepSearch è la scelta migliore per domande complesse che richiedono ragionamento iterativo, conoscenza del mondo o informazioni aggiornate.
open_in_new
Messaggi
Elenco dei messaggi scambiati tra l'utente e l'assistente durante la conversazione finora avvenuta.
Allega Immagine/Documento
Sono supportati diversi tipi di messaggi (modalità), come testo (.txt, .pdf), immagini (.png, .webp, .jpeg). Sono supportati file fino a 10 MB e devono essere codificati in anticipo in URI dati.
{
  "role": "user",
  "content": "hi"
}

upload
Richiesta
curl https://deepsearch.jina.ai/v1/chat/completions \
  -H "Content-Type: application/json"\
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "model": "jina-deepsearch-v1",
    "messages": [
        {
            "role": "user",
            "content": "Hi!"
        },
        {
            "role": "assistant",
            "content": "Hi, how can I help you?"
        },
        {
            "role": "user",
            "content": "what's the latest blog post from jina ai?"
        }
    ],
    "stream": true,
    "reasoning_effort": "medium"
  }
EOFEOF


info
Questo è l'ultimo pezzo del flusso che contiene la risposta finale, gli URL visitati e l'utilizzo del token. Fai clic sul pulsante in alto per ottenere una risposta in tempo reale.
download
Risposta
fiber_manual_record 200 OK
timer
0.0 s
straighten
196,526 Gettoni
{
  "id": "1742181758589",
  "object": "chat.completion.chunk",
  "created": 1742181758,
  "model": "jina-deepsearch-v1",
  "system_fingerprint": "fp_1742181758589",
  "choices": [
    {
      "index": 0,
      "delta": {
        "content": "The latest blog post from Jina AI is titled \"Snippet Selection and URL Ranking in DeepSearch/DeepResearch,\" published on March 12, 2025 [^1]. This post discusses how to improve the quality of DeepSearch by using late-chunking embeddings for snippet selection and rerankers to prioritize URLs before crawling. You can read the full post here: https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch\n\n[^1]: Since our DeepSearch release on February 2nd 2025 we ve discovered two implementation details that greatly improved quality In both cases multilingual embeddings and rerankers are used in an in context manner operating at a much smaller scale than the traditional pre computed indices these models typically require  [jina.ai](https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch)",
        "type": "text",
        "annotations": [
          {
            "type": "url_citation",
            "url_citation": {
              "title": "Snippet Selection and URL Ranking in DeepSearch/DeepResearch",
              "exactQuote": "Since our DeepSearch release on February 2nd 2025, we've discovered two implementation details that greatly improved quality. In both cases, multilingual embeddings and rerankers are used in an _\"in-context\"_ manner - operating at a much smaller scale than the traditional pre-computed indices these models typically require.",
              "url": "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
              "dateTime": "2025-03-13 06:48:01"
            }
          }
        ]
      },
      "logprobs": null,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 169670,
    "completion_tokens": 27285,
    "total_tokens": 196526
  },
  "visitedURLs": [
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/utils/url-tools.ts",
    "https://huggingface.co/jinaai/jina-embeddings-v3",
    "https://github.com/jina-ai/reader",
    "https://zilliz.com/blog/training-text-embeddings-with-jina-ai",
    "https://threads.net/@unwind_ai/post/DGmhWCVswbe/media",
    "https://twitter.com/JinaAI_/status/1899840196507820173",
    "https://jina.ai/news?tag=tech-blog",
    "https://docs.llamaindex.ai/en/stable/examples/embeddings/jinaai_embeddings",
    "https://x.com/jinaai_",
    "https://x.com/JinaAI_/status/1899840202358784170",
    "https://tracxn.com/d/companies/jina-ai/__IQ81fOnU0FsDpagFjG-LrG0DMWHELqI6znTumZBQF-A/funding-and-investors",
    "https://jina.ai/models",
    "https://linkedin.com/posts/imohitmayank_jinaai-has-unveiled-the-ultimate-developer-activity-7300401711242711040-VD64",
    "https://medium.com/@tossy21/trying-out-jina-ais-node-deepresearch-c5b55d630ea6",
    "https://huggingface.co/jinaai/jina-clip-v2",
    "https://arxiv.org/abs/2409.10173",
    "https://milvus.io/docs/embed-with-jina.md",
    "https://seedtable.com/best-startups-in-china",
    "https://threads.net/@sung.kim.mw/post/DGhG-J_vREu/jina-ais-a-practical-guide-to-implementing-deepsearchdeepresearchthey-cover-desi",
    "https://elastic.co/search-labs/blog/jina-ai-embeddings-rerank-model-open-inference-api",
    "http://status.jina.ai/",
    "https://apidog.com/blog/recreate-openai-deep-research",
    "https://youtube.com/watch?v=QxHE4af5BQE",
    "https://sdxcentral.com/articles/news/cisco-engages-businesses-on-ai-strategies-at-greater-bay-area-2025/2025/02",
    "https://aws.amazon.com/blogs/machine-learning/build-rag-applications-using-jina-embeddings-v2-on-amazon-sagemaker-jumpstart",
    "https://reddit.com/r/perplexity_ai/comments/1ejbdqa/fastest_open_source_ai_search_engine",
    "https://search.jina.ai/",
    "https://sebastian-petrus.medium.com/build-openais-deep-research-open-source-alternative-4f21aed6d9f0",
    "https://medium.com/@elmo92/jina-reader-transforming-web-content-to-feed-llms-d238e827cc27",
    "https://openai.com/index/introducing-deep-research",
    "https://python.langchain.com/docs/integrations/tools/jina_search",
    "https://varindia.com/news/meta-is-in-talks-for-usd200-billion-ai-data-center-project",
    "https://varindia.com/news/Mira-Murati%E2%80%99s-new-AI-venture-eyes-$9-billion-valuation",
    "https://53ai.com/news/RAG/2025031401342.html",
    "https://arxiv.org/abs/2409.04701",
    "https://bigdatawire.com/this-just-in/together-ai-raises-305m-series-b-to-power-ai-model-training-and-inference",
    "https://github.blog/",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/MvwT9enRT7gOESHA_tpRj.jpeg",
    "https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/JNs_DrpFbr6ok_pSRUK4j.jpeg",
    "https://app.dealroom.co/lists/33530",
    "https://api-docs.deepseek.com/news/news250120",
    "https://sdxcentral.com/articles/news/ninjaone-raises-500-million-valued-at-5-billion/2025/02",
    "https://linkedin.com/sharing/share-offsite?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://twitter.com/intent/tweet?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://platform.openai.com/docs/api-reference/chat/create",
    "https://mp.weixin.qq.com/s/-pPhHDi2nz8hp5R3Lm_mww",
    "https://huggingface.us17.list-manage.com/subscribe?id=9ed45a3ef6&u=7f57e683fa28b51bfc493d048",
    "https://automatio.ai/",
    "https://sdk.vercel.ai/docs/introduction",
    "https://app.eu.vanta.com/jinaai/trust/vz7f4mohp0847aho84lmva",
    "https://apply.workable.com/huggingface/j/AF1D4E3FEB",
    "https://facebook.com/sharer/sharer.php?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://facebook.com/sharer/sharer.php?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://reddit.com/submit?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://apply.workable.com/huggingface",
    "https://news.ycombinator.com/submitlink?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F",
    "https://news.ycombinator.com/submitlink?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F",
    "https://docs.github.com/site-policy/privacy-policies/github-privacy-statement",
    "https://discord.jina.ai/",
    "https://docs.github.com/site-policy/github-terms/github-terms-of-service",
    "https://bigdatawire.com/this-just-in/qumulo-announces-30-million-funding",
    "https://x.ai/blog/grok-3",
    "https://m-ric-open-deep-research.hf.space/",
    "https://youtu.be/sal78ACtGTc?feature=shared&t=52",
    "https://mp.weixin.qq.com/s/apnorBj4TZs3-Mo23xUReQ",
    "https://perplexity.ai/hub/blog/introducing-perplexity-deep-research",
    "https://githubstatus.com/",
    "https://github.blog/changelog/2021-09-30-footnotes-now-supported-in-markdown-fields",
    "https://openai.com/index/introducing-operator",
    "mailto:[email protected]",
    "https://resources.github.com/learn/pathways",
    "https://status.jina.ai/",
    "https://reuters.com/technology/artificial-intelligence/tencents-messaging-app-weixin-launches-beta-testing-with-deepseek-2025-02-16",
    "https://scmp.com/tech/big-tech/article/3298981/baidu-adopts-deepseek-ai-models-chasing-tencent-race-embrace-hot-start",
    "https://microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks",
    "javascript:UC_UI.showSecondLayer();",
    "https://resources.github.com/",
    "https://storm-project.stanford.edu/research/storm",
    "https://blog.google/products/gemini/google-gemini-deep-research",
    "https://youtu.be/vrpraFiPUyA",
    "https://chat.baidu.com/search?extParamsJson=%7B%22enter_type%22%3A%22ai_explore_home%22%7D&isShowHello=1&pd=csaitab&setype=csaitab&usedModel=%7B%22modelName%22%3A%22DeepSeek-R1%22%7D",
    "https://app.dover.com/jobs/jinaai",
    "http://localhost:3000/",
    "https://docs.cherry-ai.com/",
    "https://en.wikipedia.org/wiki/Delayed_gratification",
    "https://support.github.com/?tags=dotcom-footer",
    "https://docs.jina.ai/",
    "https://skills.github.com/",
    "https://partner.github.com/",
    "https://help.x.com/resources/accessibility",
    "https://business.twitter.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://business.x.com/en/help/troubleshooting/how-twitter-ads-work.html",
    "https://support.twitter.com/articles/20170514",
    "https://support.x.com/articles/20170514",
    "https://t.co/jnxcxPzndy",
    "https://t.co/6EtEMa9P05",
    "https://help.x.com/using-x/x-supported-browsers",
    "https://legal.twitter.com/imprint.html"
  ],
  "readURLs": [
    "https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch",
    "https://github.com/jina-ai/node-DeepResearch",
    "https://huggingface.co/blog/open-deep-research",
    "https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch",
    "https://x.com/jinaai_?lang=en",
    "https://jina.ai/news",
    "https://x.com/joedevon/status/1896984525210837081",
    "https://github.com/jina-ai/node-DeepResearch/blob/main/src/tools/jina-latechunk.ts"
  ],
  "numURLs": 98
}

Guida ai parametri di DeepSearch

Scopri come impostare i parametri giusti e ottenere i risultati migliori.

Controllo Qualità

In DeepSearch, c’è generalmente un compromesso: più passaggi esegue il sistema, maggiore sarà la qualità dei risultati ottenuti, ma si consumeranno anche più token. Questa qualità migliorata deriva da ricerche più ampie ed esaustive e da una riflessione più approfondita. Quattro parametri principali controllano la qualità di DeepSearch: budget_tokens, max_attempts, team_size e reasoning_effort. Il parametro reasoning_effort è essenzialmente una combinazione preimpostata di budget_tokens e max_attempts che è stata accuratamente ottimizzata. Per la maggior parte degli utenti, regolare reasoning_effort è l’approccio più semplice.

Token di Budget

budget_tokens imposta il numero massimo di token consentiti per l’intero processo di DeepSearch. Questo include tutte le operazioni, incluse ricerche web, lettura di pagine web, riflessione, riepilogo e codifica. Budget più elevati portano naturalmente a una migliore qualità delle risposte. Il processo di DeepSearch si interromperà quando il budget sarà esaurito o quando verrà trovata una risposta soddisfacente, a seconda di quale evento si verifichi per primo. Se il budget si esaurisce prima, si otterrà comunque una risposta, ma potrebbe non essere quella definitiva e completamente perfezionata, poiché non ha superato tutti i controlli di qualità definiti da max_attempts.

Tentativi massimi

max_attempts determina il numero di tentativi che il sistema effettuerà per risolvere un problema durante il processo di DeepSearch. Ogni volta che DeepSearch produce una risposta, deve superare determinati test di qualità definiti da un valutatore interno. Se la risposta non supera questi test, il valutatore fornisce un feedback e il sistema utilizza questo feedback per continuare la ricerca e perfezionare la risposta. Impostando max_attempts troppo basso si otterranno risultati rapidi, ma la qualità potrebbe risentirne, poiché la risposta potrebbe non superare tutti i controlli di qualità. Impostando un valore troppo alto, il processo potrebbe bloccarsi in un ciclo infinito di tentativi, in cui continua a fallire.

Il sistema restituisce una risposta finale quando viene superato il limite di budget_tokens o max_attempts (a seconda di quale evento si verifica per primo), oppure quando la risposta supera tutti i test pur avendo ancora a disposizione budget e tentativi rimanenti.

Dimensione del team

team_size influisce sulla qualità in modo fondamentalmente diverso rispetto a max_attempts e budget_tokens. Quando team_size è impostato su più di uno, il sistema scompone il problema originale in sottoproblemi e li analizza in modo indipendente. Si può pensare a questo come a un modello di riduzione a mappa, in cui un lavoro di grandi dimensioni viene suddiviso in attività più piccole che vengono eseguite in parallelo. La risposta finale è quindi una sintesi dei risultati di ciascun lavoratore. Lo chiamiamo “team_size” perché simula un team di ricerca in cui più agenti indagano diversi aspetti dello stesso problema e collaborano a un report finale.

Tenete presente che il consumo di token di tutti gli agenti contribuisce al totale dei budget_tokens, ma ogni agente ha un valore max_attempts indipendente. Ciò significa che con un valore di team_size più elevato ma con lo stesso valore di budget_tokens, gli agenti potrebbero restituire risposte prima del previsto a causa di vincoli di budget. Consigliamo di aumentare sia team_size che budget_tokens contemporaneamente per fornire a ciascun agente risorse sufficienti per svolgere un lavoro approfondito.

Infine, team_size può essere considerato come il parametro che controlla l’ampiezza della ricerca: determina quanti aspetti diversi verranno analizzati. Allo stesso tempo, budget_tokens e max_attempts controllano la profondità della ricerca, ovvero quanto approfonditamente verrà esplorato ogni aspetto.

Controllo della fonte

DeepSearch si basa fortemente sul grounding, ovvero sulle fonti che utilizza per le informazioni. La qualità non riguarda solo la profondità e l’ampiezza degli algoritmi; la fonte da cui DeepSearch ottiene le sue informazioni è altrettanto importante e spesso il fattore decisivo. Esploriamo i parametri chiave che controllano questo aspetto.

Nessuna risposta diretta

no_direct_answer è un semplice interruttore che impedisce al sistema di restituire una risposta al passaggio 1. Quando abilitato, disabilita la capacità del sistema di utilizzare le informazioni interne e lo obbliga a cercare sempre prima sul web. Attivandolo, il sistema “ripensa” anche a domande semplici come “che giorno è oggi”, “come stai” o a conoscenze di base che sono sicuramente presenti nei dati di addestramento del modello, come “chi è stato il 40° presidente degli Stati Uniti?”.

Controlli dei nomi host

Tre parametri, boost_hostnames, bad_hostnames e only_hostnames, indicano a DeepSearch quali pagine web dare priorità, evitare o utilizzare esclusivamente. Per capire come funzionano, considerate il processo di ricerca e lettura in DeepSearch:

  1. Fase di ricerca: il sistema effettua una ricerca sul web e recupera un elenco di URL di siti web con i relativi snippet
  2. Fase di selezione: il sistema decide quali URL visitare effettivamente (non li visita tutti per motivi di tempo e costi)
  • boost_hostnames: i domini elencati qui hanno una priorità più alta e hanno maggiori probabilità di essere visitati
  • bad_hostnames: questi domini non verranno mai visitati
  • only_hostnames: quando definiti, verranno visitati solo gli URL che corrispondono a questi nomi host

Ecco alcune note importanti sui parametri dei nomi host. In primo luogo, il sistema utilizza sempre gli snippet restituiti dai motori di ricerca come indizi iniziali per la costruzione di catene di ragionamento. Questi parametri relativi ai nomi host influenzano solo le pagine web visitate dal sistema, non il modo in cui formula le query di ricerca.

In secondo luogo, se gli URL raccolti non contengono domini specificati in only_hostnames, il sistema potrebbe interrompere completamente la lettura delle pagine web. Consigliamo di utilizzare questi parametri solo se si ha familiarità con la propria domanda di ricerca e si sa dove è probabile trovare potenziali risposte (o dove sicuramente non dovrebbero essere trovate).

Caso speciale: Ricerca accademica

Per la ricerca accademica, si potrebbe voler limitare le ricerche e le letture ad arxiv.org. In questo caso, è sufficiente impostare "search_provider": "arxiv" e tutto si baserà su arxiv come unica fonte. Tuttavia, domande generiche o banali potrebbero non ottenere risposte efficienti con questa restrizione, quindi utilizzare "search_provider": "arxiv" solo per la ricerca accademica seria.

Codice lingua di ricerca

search_language_code è un altro parametro che influenza le fonti web forzando il sistema a generare query in una lingua specifica, indipendentemente dall’input originale o dai passaggi di ragionamento intermedi. Generalmente, il sistema decide automaticamente la lingua di query per ottenere la migliore copertura di ricerca, ma a volte il controllo manuale è utile.

Casi d’uso per il controllo della lingua

Ricerca di mercato internazionale: quando si studia l’impatto di un marchio o di un’azienda locale sui mercati internazionali, è possibile forzare le query a utilizzare sempre l’inglese con "search_language_code": "en" per una copertura globale, oppure utilizzare la lingua locale per informazioni regionali più personalizzate.

Ricerca globale con prompt in altre lingue: se l’input è sempre in cinese o giapponese (perché i tuoi utenti finali parlano principalmente queste lingue), ma l’ambito di ricerca è globale anziché limitato ai siti web locali cinesi o giapponesi, il sistema potrebbe automaticamente orientarsi verso la lingua del prompt. Utilizza questo parametro per forzare le query in inglese per una copertura internazionale più ampia.

Chatta con DeepSearch

Controllo delle vibrazioni con una semplice interfaccia utente di chat. DeepSearch è la scelta migliore per domande complesse che richiedono ragionamento iterativo, conoscenza del mondo o informazioni aggiornate.
Abbiamo appena lanciato una nuova UI DeepSearch che è veloce come un fulmine, minimalista e GRATUITA. Dai un'occhiata su https://search.jina.ai o clicca sul pulsante qui sotto per provarla!open_in_newVisita la nuova interfaccia utente
Clienti di chat
Per la migliore esperienza, consigliamo di utilizzare client di chat professionali. DeepSearch è completamente compatibile con lo schema API Chat di OpenAI, rendendolo facile da usare con qualsiasi client compatibile con OpenAI.
open_in_new
TypingMind
open_in_new
Chatwise
open_in_new
Cherry Studio
open_in_new
Chatbox
open_in_new
LobeChat
open_in_new
NextChat

Che cos'è DeepSearch?

DeepSearch combina la ricerca sul web, la lettura e il ragionamento per un'indagine completa. Immaginalo come un agente a cui assegni un compito di ricerca: esegue ricerche approfondite e lavora attraverso più iterazioni prima di fornire una risposta.

LLM standard

attach_money
circa 1000 gettoni
access_time
circa 1s
check
Risposte rapide a domande di cultura generale
close
Non è possibile accedere alle informazioni in tempo reale o post-allenamento

Le risposte vengono generate esclusivamente da conoscenze pre-addestrate con una data limite fissa

RAG e LLM con messa a terra

attach_money
circa 10.000 gettoni
access_time
circa 3 secondi
check
Domande che richiedono informazioni attuali o specifiche del dominio
close
Difficoltà con domande complesse che richiedono ragionamento multi-hop

Risposte generate riassumendo i risultati di una ricerca in un'unica passata
Può accedere alle informazioni correnti oltre il limite di formazione

Ricerca profonda

attach_money
circa 500.000 token
access_time
circa 50 anni
check
Domande complesse che richiedono una ricerca e un ragionamento approfonditi
info
Richiede più tempo rispetto ai semplici approcci LLM o RAG

Agente autonomo che ricerca, legge e ragiona in modo iterativo
Decide dinamicamente i passaggi successivi in base ai risultati attuali
Autovaluta la qualità della risposta prima di restituire i risultati
Può effettuare approfondimenti sugli argomenti attraverso molteplici cicli di ricerca e ragionamento

Prezzi dell'API

Il prezzo dell'API si basa sull'utilizzo del token. Una chiave API ti dà accesso a tutti i prodotti della fondazione di ricerca.
Con l'API Jina Search Foundation
Il modo più semplice per accedere a tutti i nostri prodotti. Ricarica i token man mano che procedi.
Ricarica questa chiave API con più token
A seconda della tua posizione, l'addebito potrebbe essere effettuato in USD, EUR o altre valute. Potrebbero essere applicate tasse.
Inserisci la chiave API corretta per ricaricare
Comprendere il limite di velocità
I limiti di velocità sono il numero massimo di richieste che possono essere effettuate a un'API entro un minuto per indirizzo IP/chiave API (RPM). Scopri di più sui limiti di velocità per ogni prodotto e livello di seguito.
keyboard_arrow_down
Limite di velocità
I limiti di velocità vengono monitorati in tre modi: RPM (richieste al minuto) e TPM (token al minuto). I limiti vengono applicati per IP/chiave API e vengono attivati al raggiungimento della soglia RPM o TPM. Quando si fornisce una chiave API nell'intestazione della richiesta, i limiti di velocità vengono monitorati per chiave anziché per indirizzo IP.
ProdottoPunto finale APIDescrizionearrow_upwardsenza chiave APIkey_offcon chiave API gratuitakeycon chiave API a pagamentokeycon chiave API PremiumkeyLatenza mediaConteggio dell'utilizzo del tokenRichiesta consentita
API del lettorehttps://r.jina.aiConvertire l'URL in testo compatibile con LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sContare il numero di token nella risposta di output.GET/POST
API del lettorehttps://s.jina.aiCerca sul web e converti i risultati in testo compatibile con LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sOgni richiesta costa un numero fisso di token, a partire da 10000 tokenGET/POST
API di riclassificazionehttps://api.jina.ai/v1/rerankClassifica i documenti per queryblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
help
Conta il numero di token nella richiesta di input.POST
Incorporamento dell'APIhttps://api.jina.ai/v1/embeddingsConvertire testo/immagini in vettori di lunghezza fissablock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
help
Conta il numero di token nella richiesta di input.POST
API del classificatorehttps://api.jina.ai/v1/trainAddestrare un classificatore utilizzando esempi etichettatiblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
I token vengono conteggiati come: input_tokens × num_itersPOST
API del classificatore (Colpo zero)https://api.jina.ai/v1/classifyClassificare gli input utilizzando la classificazione zero-shotblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
I token vengono conteggiati come: input_tokens + label_tokensPOST
API del classificatore (Pochi colpi)https://api.jina.ai/v1/classifyClassificare gli input utilizzando un classificatore addestrato a pochi scattiblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
I token sono conteggiati come: input_tokensPOST
API del segmentatorehttps://api.jina.ai/v1/segmentTokenizzare e segmentare il testo lungo20 RPM200 RPM200 RPM1,000 RPM0.3sIl token non viene conteggiato come utilizzo.GET/POST
Ricerca profondahttps://deepsearch.jina.ai/v1/chat/completionsRagiona, cerca e ripeti per trovare la risposta miglioreblock50 RPM50 RPM500 RPM56.7sContare il numero totale di token nell'intero processo.POST

Che cos'è DeepSearch?
keyboard_arrow_down
DeepSearch è un'API LLM che esegue ricerche iterative, letture e ragionamenti finché non trova una risposta precisa a una query o raggiunge il limite del budget token.
In che modo DeepSearch si differenzia dalle capacità di ricerca approfondita di OpenAI e Gemini?
keyboard_arrow_down
A differenza di OpenAI e Gemini, DeepSearch si concentra specificamente sulla fornitura di risposte accurate tramite iterazione piuttosto che sulla generazione di articoli lunghi. È ottimizzato per risposte rapide e precise dalla ricerca nel deep web piuttosto che per la creazione di report completi.
Quale chiave API mi serve per utilizzare DeepSearch?
keyboard_arrow_down
Hai bisogno di una chiave API Jina. Offriamo 10 milioni di token gratuiti per le nuove chiavi API.
Cosa succede quando DeepSearch raggiunge il suo budget token? Restituisce una risposta incompleta?
keyboard_arrow_down
Genera una risposta finale basata su tutte le conoscenze accumulate, anziché rinunciare o restituire una risposta incompleta.
DeepSearch garantisce risposte accurate?
keyboard_arrow_down
No. Sebbene utilizzi un processo di ricerca iterativo per migliorare l'accuratezza, la valutazione mostra che raggiunge un tasso di successo del 75% nelle domande del test, significativamente migliore rispetto al valore di base dello 0% (gemini-2.0-flash), ma non perfetto.
Quanto tempo impiega in genere una query DeepSearch?
keyboard_arrow_down
Varia in modo significativo: le query possono richiedere da 1 a 42 passaggi, con una media di 4 passaggi in base ai dati di valutazione. Sono 20 secondi. Le query semplici potrebbero essere risolte rapidamente, mentre le domande di ricerca complesse possono comportare molte iterazioni e fino a 120 secondi.
DeepSearch può funzionare con qualsiasi client compatibile con OpenAI come Chatwise, CherryStudio o ChatBox?
keyboard_arrow_down
Sì, l'API DeepSearch ufficiale su deepsearch.jina.ai/v1/chat/completions è completamente compatibile con lo schema API OpenAI, utilizzando 'jina-deepsearch-v1' come nome modello. Pertanto è semplicissimo passare da OpenAI a DeepSearch e utilizzarlo con client locali o qualsiasi client compatibile con OpenAI. Consigliamo vivamente Chatwise per un'esperienza fluida.
Quali sono i limiti di velocità per l'API?
keyboard_arrow_down
I limiti di velocità variano in base al livello della chiave API, da 10 RPM a 30 RPM. È importante tenerne conto per le applicazioni con volumi di query elevati.
Qual è il contenuto all'interno del tag ?
keyboard_arrow_down
DeepSearch racchiude i passaggi di pensiero nei tag XML ... e fornisce in seguito la risposta finale, seguendo il formato di streaming OpenAI ma con questi marcatori speciali per la catena di pensieri.
DeepSearch utilizza Jina Reader per la ricerca e la lettura sul web?
keyboard_arrow_down
Sì. Jina Reader viene utilizzato per la ricerca e la lettura sul Web, consentendo al sistema di accedere ed elaborare in modo efficiente i contenuti Web.
Perché DeepSearch utilizza così tanti token per le mie query?
keyboard_arrow_down
Sì, l'utilizzo di token di DeepSearch su query complesse è presumibilmente elevato, con una media di 70.000 token rispetto ai 500 per le risposte LLM di base. Ciò dimostra la profondità della ricerca, ma ha anche implicazioni sui costi.
Esiste un modo per controllare o limitare il numero di passaggi?
keyboard_arrow_down
Il sistema è controllato principalmente dal budget token piuttosto che dal conteggio dei passi. Una volta superato il budget token, entra in Beast Mode per la generazione della risposta finale. Controlla reasoning_effort per maggiori dettagli.
Quanto sono affidabili i riferimenti nelle risposte?
keyboard_arrow_down
I riferimenti sono considerati così importanti che se una risposta è ritenuta definitiva ma priva di riferimenti, il sistema continua la ricerca anziché accettare la risposta.
DeepSearch può gestire domande su eventi futuri?
keyboard_arrow_down
Sì, ma con estesi passaggi di ricerca. L'esempio di "chi sarà presidente nel 2028" dimostra che può gestire domande speculative attraverso più iterazioni di ricerca, sebbene l'accuratezza non sia garantita per tali previsioni.

Come posso ottenere la mia chiave API?

video_not_supported

Qual è il limite di tariffa?

Limite di velocità
I limiti di velocità vengono monitorati in tre modi: RPM (richieste al minuto) e TPM (token al minuto). I limiti vengono applicati per IP/chiave API e vengono attivati al raggiungimento della soglia RPM o TPM. Quando si fornisce una chiave API nell'intestazione della richiesta, i limiti di velocità vengono monitorati per chiave anziché per indirizzo IP.
ProdottoPunto finale APIDescrizionearrow_upwardsenza chiave APIkey_offcon chiave API gratuitakeycon chiave API a pagamentokeycon chiave API PremiumkeyLatenza mediaConteggio dell'utilizzo del tokenRichiesta consentita
API del lettorehttps://r.jina.aiConvertire l'URL in testo compatibile con LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sContare il numero di token nella risposta di output.GET/POST
API del lettorehttps://s.jina.aiCerca sul web e converti i risultati in testo compatibile con LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sOgni richiesta costa un numero fisso di token, a partire da 10000 tokenGET/POST
API di riclassificazionehttps://api.jina.ai/v1/rerankClassifica i documenti per queryblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
help
Conta il numero di token nella richiesta di input.POST
Incorporamento dell'APIhttps://api.jina.ai/v1/embeddingsConvertire testo/immagini in vettori di lunghezza fissablock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
help
Conta il numero di token nella richiesta di input.POST
API del classificatorehttps://api.jina.ai/v1/trainAddestrare un classificatore utilizzando esempi etichettatiblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
I token vengono conteggiati come: input_tokens × num_itersPOST
API del classificatore (Colpo zero)https://api.jina.ai/v1/classifyClassificare gli input utilizzando la classificazione zero-shotblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
I token vengono conteggiati come: input_tokens + label_tokensPOST
API del classificatore (Pochi colpi)https://api.jina.ai/v1/classifyClassificare gli input utilizzando un classificatore addestrato a pochi scattiblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dipende dalla dimensione dell'input
I token sono conteggiati come: input_tokensPOST
API del segmentatorehttps://api.jina.ai/v1/segmentTokenizzare e segmentare il testo lungo20 RPM200 RPM200 RPM1,000 RPM0.3sIl token non viene conteggiato come utilizzo.GET/POST
Ricerca profondahttps://deepsearch.jina.ai/v1/chat/completionsRagiona, cerca e ripeti per trovare la risposta miglioreblock50 RPM50 RPM500 RPM56.7sContare il numero totale di token nell'intero processo.POST
Domande comuni relative all'API
code
Posso usare la stessa chiave API per le API di lettura, incorporamento, riclassificazione, classificazione e messa a punto?
keyboard_arrow_down
Sì, la stessa chiave API è valida per tutti i prodotti di base di ricerca di Jina AI. Ciò include le API di lettura, incorporamento, riclassificazione, classificazione e messa a punto, con token condivisi tra tutti i servizi.
code
Posso monitorare l'utilizzo del token della mia chiave API?
keyboard_arrow_down
Sì, l'utilizzo del token può essere monitorato nella scheda "API Key & Billing" inserendo la tua chiave API, consentendoti di visualizzare la cronologia di utilizzo recente e i token rimanenti. Se hai effettuato l'accesso alla dashboard API, questi dettagli possono essere visualizzati anche nella scheda "Manage API Key".
code
Cosa devo fare se dimentico la mia chiave API?
keyboard_arrow_down
Se hai smarrito una chiave ricaricata e desideri recuperarla, contatta il supporto AT jina.ai con la tua email registrata per ricevere assistenza. Si consiglia di effettuare l'accesso per conservare la tua chiave API in modo sicuro e facilmente accessibile.
Contatto
code
Le chiavi API scadono?
keyboard_arrow_down
No, le nostre chiavi API non hanno una data di scadenza. Tuttavia, se sospetti che la tua chiave sia stata compromessa e desideri ritirarla, contatta il nostro team di supporto per ricevere assistenza. Puoi anche revocare la tua chiave nella dashboard API Key Management.
Contatto
code
Posso trasferire token tra chiavi API?
keyboard_arrow_down
Sì, puoi trasferire token da una chiave premium a un'altra. Dopo aver effettuato l'accesso al tuo account sulla dashboard API Key Management, usa le impostazioni della chiave che vuoi trasferire per spostare tutti i token a pagamento rimanenti.
code
Posso revocare la mia chiave API?
keyboard_arrow_down
Sì, puoi revocare la tua chiave API se ritieni che sia stata compromessa. La revoca di una chiave la disabiliterà immediatamente per tutti gli utenti che l'hanno archiviata e tutto il saldo rimanente e le proprietà associate saranno permanentemente inutilizzabili. Se la chiave è una chiave premium, hai la possibilità di trasferire il saldo pagato rimanente a un'altra chiave prima della revoca. Nota che questa azione non può essere annullata. Per revocare una chiave, vai alle impostazioni della chiave nella dashboard Gestione chiavi API.
code
Perché la prima richiesta per alcuni modelli è lenta?
keyboard_arrow_down
Questo perché la nostra architettura serverless scarica determinati modelli durante i periodi di basso utilizzo. La richiesta iniziale attiva o "riscalda" il modello, il che potrebbe richiedere alcuni secondi. Dopo questa attivazione iniziale, le richieste successive vengono elaborate molto più rapidamente.
code
I miei dati API vengono utilizzati per addestrare i vostri modelli?
keyboard_arrow_down
No. Non utilizziamo mai le tue richieste API, i tuoi input o i tuoi output per addestrare i nostri modelli di incorporamento, reranker o altri modelli. I tuoi dati rimangono tuoi. Siamo conformi agli standard SOC 2 Tipo I e Tipo II.
code
Quali sono i limiti di velocità per le API Jina?
keyboard_arrow_down
Si applicano limiti di velocità per chiave API:

Gratuito: 100 RPM, 100.000 TPM, 2 richieste simultanee
A pagamento: 500 RPM, 2 milioni di TPM, 50 richieste simultanee
Premium: 5.000 RPM, 50 milioni di TPM, 500 richieste simultanee

È presente anche un limite di velocità basato su IP di 10.000 richieste ogni 60 secondi. Questi limiti si applicano a tutte le API Jina (Embedding, Reranker, Reader, ecc.).
code
Esistono limiti alle dimensioni dei batch per le API?
keyboard_arrow_down
Non esiste alcun limite di dimensione del batch per le API Embeddings o Reranker. È possibile inviare tutti gli elementi o documenti necessari per richiesta. Entrambe le API elaborano internamente gli input in batch in base al numero di token, per un utilizzo ottimale della GPU.
Domande comuni relative alla fatturazione
attach_money
La fatturazione è basata sul numero di frasi o richieste?
keyboard_arrow_down
Il nostro modello di prezzo si basa sul numero totale di token elaborati, consentendo agli utenti la flessibilità di allocare questi token su qualsiasi numero di frasi, offrendo una soluzione economicamente vantaggiosa per diversi requisiti di analisi del testo.
attach_money
È disponibile una prova gratuita per i nuovi utenti?
keyboard_arrow_down
Offriamo ai nuovi utenti una prova gratuita di benvenuto, che include dieci milioni di token da utilizzare con qualsiasi nostro modello, grazie a una chiave API generata automaticamente. Una volta raggiunto il limite di token gratuiti, gli utenti possono facilmente acquistare token aggiuntivi per le proprie chiavi API tramite la scheda "Acquista token".
attach_money
Vengono addebitati i token per le richieste non riuscite?
keyboard_arrow_down
No, i token non vengono detratti per le richieste non riuscite.
attach_money
Quali metodi di pagamento sono accettati?
keyboard_arrow_down
I pagamenti vengono elaborati tramite Stripe, che supporta una varietà di metodi di pagamento tra cui carte di credito, Google Pay e PayPal per la tua comodità.
attach_money
È disponibile la fatturazione per gli acquisti di token?
keyboard_arrow_down
Sì, al momento dell'acquisto dei token verrà emessa una fattura all'indirizzo e-mail associato al tuo account Stripe.
Uffici
location_on
Sunnyvale, California
710 Lakeway Dr, Ste 200, Sunnyvale, CA 94085, Stati Uniti
location_on
Berlino, Germania
Prinzessinnenstraße 19-20, 10969 Berlino, Germania
Fondazione di ricerca
Lettore
Incorporamenti
Riclassificazione
Ottieni la chiave API Jina
Limite di velocità
Stato dell'API
Azienda
Chi siamo
Contatta le vendite
Sala stampa
Programma di stagista
Scarica il logo Jina
open_in_new
Scarica il logo Elastic
open_in_new
Termini
Sicurezza
Termini & Condizioni
Privacy
Gestisci i cookie
email
Jina AI di Elastic © 2020-2026.