La tua base di ricerca una marcia in più!
Inizia subito: non serve alcuna carta di credito o registrazione!
verified_userSiamo conformi agli standard SOC 2 Tipo 1 e 2 dell'American Institute of Certified Public Accountants (AICPA).open_in_new
chevron_leftchevron_right
globe_book
Utilizzare
r.jina.ai per leggere un URL e recuperarne il contenutotravel_explore
Usa
s.jina.ai per cercare sul web e ottenere SERPAggiungi
mcp.jina.ai come server MCP per accedere alla nostra API in LLMFormato del contenuto
Puoi controllare il livello di dettaglio nella risposta per evitare un filtro eccessivo. La pipeline predefinita è ottimizzata per la maggior parte dei siti Web e per l'input LLM.
Predefinito
arrow_drop_down
Risposta JSON
La risposta sarà in formato JSON, contenente l'URL, il titolo, il contenuto e il timestamp (se disponibile). Nella modalità di ricerca, restituisce un elenco di cinque voci, ciascuna seguendo la struttura JSON descritta.
Timeout (secondi)
Tempo massimo di attesa per il caricamento della pagina. Aumentare per le pagine lente, diminuire per le pagine statiche semplici.
Budget del token
Limita il numero massimo di token utilizzati per questa richiesta. Superare questo limite causerà il fallimento della richiesta.
Utilizzare ReaderLM-v2
Sperimentale
Utilizza ReaderLM-v2 per la conversione da HTML a Markdown, per fornire risultati di alta qualità per siti web con strutture e contenuti complessi. Costa 3x token!open_in_newSaperne di più
Estrai solo (selettore CSS)
Estrai solo i contenuti che corrispondono a questi selettori CSS. Esempio: article, .main-content, #post-body
Attendi (Selettore CSS)
Attendi che questi elementi appaiano prima di estrarre il contenuto. Utile per i contenuti caricati dinamicamente.
Escludi (selettore CSS)
Rimuovere questi elementi prima dell'estrazione. Esempio: nav, footer, .sidebar, #ads
Rimuovi tutte le immagini
Rimuove tutte le immagini dall'output. Riduce l'utilizzo dei token quando le immagini non sono necessarie.
Formato di citazione OpenAI
Formatta i link per lo strumento di navigazione web di OpenAI. Utilizza marcatori di citazione speciali compatibili con i modelli GPT.open_in_newSaperne di più
Sezione Riepilogo Collegamenti
Alla fine verrà creata una sezione "Pulsanti e collegamenti". Ciò aiuta i LLM downstream o gli agenti web a navigare nella pagina o a intraprendere ulteriori azioni.
Nessuno
arrow_drop_down
Sezione Riepilogo Immagini
Alla fine verrà creata una sezione "Immagini". Ciò fornisce ai LLM a valle una panoramica di tutti gli elementi visivi sulla pagina, il che può migliorare il ragionamento.
Nessuno
arrow_drop_down
Dimensione della finestra del browser
POST
Imposta le dimensioni della finestra del browser. Influisce sui layout responsive e sulla visibilità dei contenuti.open_in_newSaperne di più
Cookie in avanti
Il nostro server API può inoltrare le tue impostazioni personalizzate dei cookie quando accedi all'URL, il che è utile per le pagine che richiedono un'autenticazione aggiuntiva. Tieni presente che le richieste con cookie non verranno memorizzate nella cache.open_in_newSaperne di più
Didascalia immagine
Sottotitola tutte le immagini all'URL specificato, aggiungendo "Immagine [idx]: [didascalia]" come tag alt per quelle senza. Ciò consente ai LLM a valle di interagire con le immagini in attività come il ragionamento e il riepilogo.
Utilizza un server proxy
Il nostro server API può utilizzare il tuo proxy per accedere agli URL, il che è utile per le pagine accessibili solo tramite proxy specifici.open_in_newSaperne di più
Utilizzare un server proxy specifico per il paese
Imposta il codice paese per il server proxy basato sulla posizione. Usa 'auto' per una selezione ottimale o 'none' per disabilitare.
Bypassare la cache
Il nostro server API memorizza nella cache sia i contenuti in modalità Lettura che quelli in modalità Ricerca per un certo periodo di tempo. Per ignorare questa cache, imposta questa intestazione su true.
Tolleranza della cache (secondi)
Accetta i contenuti memorizzati nella cache se più giovani di N secondi. Imposta su 0 per i contenuti nuovi (come per Bypass Cache) o su valori più alti per consentire risposte più rapide dalla cache.
Tempi di preparazione della pagina
Quando considerare una pagina completamente carica. Tempi successivi richiedono più tempo ma catturano contenuti più dinamici.
Predefinito
arrow_drop_down
User-Agent personalizzato
Sostituisce la stringa User-Agent del browser. Utile per accedere a siti che richiedono browser specifici o bloccano i crawler.
Referente personalizzato
Imposta l'intestazione HTTP Referer. Alcuni siti controllano questa intestazione per verificare che il traffico provenga dalle fonti previste.
Conserva le immagini Base64
Mantieni le immagini codificate in base64 in linea nell'output markdown anziché convertirle in URL esterni.
Non memorizzare nella cache o tracciare
Impedisci che questa richiesta venga memorizzata nella cache o registrata sui nostri server. Da utilizzare per URL sensibili.
Markdown aromatizzato su Github
Attiva/disattiva le funzionalità di GFM (Github Flavored Markdown).
Abilitato
arrow_drop_down
Modalità flusso
La modalità streaming è vantaggiosa per le pagine di destinazione di grandi dimensioni, poiché consente più tempo per il rendering completo della pagina. Se la modalità standard genera contenuti incompleti, prendi in considerazione l'utilizzo della modalità Stream.open_in_newSaperne di più
Personalizza le impostazioni locali del browser
Controlla le impostazioni locali del browser per il rendering della pagina. Molti siti web offrono contenuti diversi in base alle impostazioni locali.open_in_newSaperne di più
Rispetta robots.txt
Controlla le regole del file robots.txt prima di recuperarlo. Specifica il nome del bot da utilizzare per il controllo.
Includi contenuto iframe
Estrai contenuti da iframe incorporati. Abilita questa opzione per le pagine con contenuti caricati in iframe.
Includi Shadow DOM
Estrai contenuti dai componenti Shadow DOM. Abilita per le pagine che utilizzano componenti web.
Usa URL finale come base
Risolvi gli URL relativi utilizzando l'URL di destinazione finale dopo i reindirizzamenti, anziché l'URL originale.
File PDF/HTML locale
POST
Utilizza Reader sul tuo file PDF e HTML locale caricandoli. Supporta solo file PDF e HTML.
upload
Esegui JavaScript prima dell'estrazione
POST
Esegui codice JS personalizzato per modificare la pagina prima dell'estrazione del contenuto. Può essere codice in linea o un URL a un file script.open_in_newSaperne di più
Stile intestazione
Imposta il formato dell'intestazione Markdown (passato a Turndown).
Stile hash
arrow_drop_down
Stile regola orizzontale
Definisce il formato della regola orizzontale di markdown (passato a Turndown).
Stile punto elenco
Imposta il carattere di indicazione dell'elenco puntato (passato a Turndown).
*
arrow_drop_down
Stile di enfasi
Definisce il delimitatore di enfasi del markdown (passato a Turndown).
_
arrow_drop_down
Stile con forte enfasi
Imposta il delimitatore di enfasi forte del markdown (passato a Turndown).
**
arrow_drop_down
Stile collegamento
Determina il formato del collegamento markdown (passato a Turndown).
In linea
arrow_drop_down
Conformità UE
Sperimentale
Tutte le infrastrutture e le operazioni di elaborazione dei dati risiedono interamente sotto la giurisdizione dell'UE.
upload
Richiesta
GET
Bash
Lingua
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
Chiave API
visibility_off
Gettoni disponibili
0
Per una ricerca migliore
I nostri modelli di frontiera costituiscono la base di ricerca per sistemi di ricerca aziendale e RAG di alta qualità.
Le nostre pubblicazioni
Scopri come i nostri modelli di ricerca di frontiera sono stati addestrati da zero, dai un'occhiata alle nostre ultime pubblicazioni. Incontra il nostro team presso EMNLP, SIGIR, ICLR, NeurIPS e ICML!
febbraio 17, 2026
febbraio 11, 2026
ICLR 2026
gennaio 22, 2026
dicembre 29, 2025
ICLR 2026
dicembre 04, 2025
AAAI 2026
ottobre 01, 2025
NeurIPS 2025
agosto 31, 2025
EMNLP 2025
giugno 24, 2025
ICLR 2025
marzo 04, 2025
ACL 2025
dicembre 17, 2024
ICLR 2025
dicembre 12, 2024
ECIR 2025
settembre 18, 2024
SIGIR 2025
settembre 07, 2024
EMNLP 2024
agosto 30, 2024
WWW 2025
giugno 21, 2024
ICML 2024
maggio 30, 2024
febbraio 26, 2024
ottobre 30, 2023
EMNLP 2023
luglio 20, 2023
19 pubblicazioni in totale.







































