Votre base de recherche survoltée!
Commencez instantanément — aucune carte de crédit ni inscription requise !
verified_userNous sommes conformes aux normes SOC 2 Type 1 et 2 de l'American Institute of Certified Public Accountants (AICPA).open_in_new
chevron_leftchevron_right
globe_book
Utilisez
r.jina.ai pour lire une URL et récupérer son contenutravel_explore
Utilisez
s.jina.ai pour rechercher sur le Web et obtenir le SERPAjoutez
mcp.jina.ai comme serveur MCP pour accéder à notre API dans les LLMFormat du contenu
Vous pouvez contrôler le niveau de détail de la réponse pour éviter un filtrage excessif. Le pipeline par défaut est optimisé pour la plupart des sites Web et des entrées LLM.
Défaut
arrow_drop_down
Réponse JSON
La réponse sera au format JSON, contenant l'URL, le titre, le contenu et l'horodatage (si disponible). En mode Recherche, il renvoie une liste de cinq entrées, chacune suivant la structure JSON décrite.
Délai d'attente (secondes)
Délai maximal d'attente pour le chargement de la page. Augmenter ce délai pour les pages lentes, le diminuer pour les pages statiques simples.
Budget symbolique
Limite le nombre maximal de jetons utilisés pour cette demande. Le dépassement de cette limite entraînera l'échec de la demande.
Utiliser ReaderLM-v2
Expérimental
Utilise ReaderLM-v2 pour la conversion HTML en Markdown, afin de fournir des résultats de haute qualité pour les sites Web aux structures et contenus complexes. Coûte 3x jetons !open_in_newApprendre encore plus
Extrait uniquement (sélecteur CSS)
Extraire uniquement le contenu correspondant à ces sélecteurs CSS. Exemple : article, .main-content, #post-body
Attendre (sélecteur CSS)
Attendez que ces éléments apparaissent avant d'extraire le contenu. Utile pour le contenu chargé dynamiquement.
Exclure (sélecteur CSS)
Supprimez ces éléments avant l'extraction. Exemple : nav, footer, .sidebar, #ads
Supprimer toutes les images
Supprime toutes les images du résultat. Cela réduit la consommation de jetons lorsque les images ne sont pas nécessaires.
Format de citation OpenAI
Formate les liens pour l'outil de navigation web d'OpenAI. Utilise des marqueurs de citation spéciaux compatibles avec les modèles GPT.open_in_newApprendre encore plus
Résumé des liens
Une section "Boutons & Liens" sera créée à la fin. Cela aide les LLM ou les agents Web en aval à naviguer sur la page ou à entreprendre d'autres actions.
Aucun
arrow_drop_down
Section récapitulative des images
Une section "Images" sera créée à la fin. Cela donne aux LLM en aval un aperçu de tous les visuels de la page, ce qui peut améliorer le raisonnement.
Aucun
arrow_drop_down
Taille de la fenêtre du navigateur
POST
Définir les dimensions de la fenêtre du navigateur. Cela affecte la mise en page adaptative et la visibilité du contenu.open_in_newApprendre encore plus
Cookie de transfert
Notre serveur API peut transmettre vos paramètres de cookies personnalisés lors de l'accès à l'URL, ce qui est utile pour les pages nécessitant une authentification supplémentaire. Notez que les demandes contenant des cookies ne seront pas mises en cache.open_in_newApprendre encore plus
Légende
Sous-titre toutes les images à l'URL spécifiée, en ajoutant « Image [idx] : [caption] » comme balise alt pour celles qui n'en ont pas. Cela permet aux LLM en aval d'interagir avec les images dans des activités telles que le raisonnement et la synthèse.
Utiliser un serveur proxy
Notre serveur API peut utiliser votre proxy pour accéder aux URL, ce qui est utile pour les pages accessibles uniquement via des proxys spécifiques.open_in_newApprendre encore plus
Utiliser un serveur proxy spécifique à un pays
Définissez le code pays pour le serveur proxy basé sur la localisation. Utilisez « auto » pour une sélection optimale ou « aucun » pour désactiver.
Contourner le cache
Notre serveur API met en cache le contenu des modes Lecture et Recherche pendant un certain temps. Pour contourner ce cache, définissez cet en-tête sur true.
Tolérance du cache (secondes)
Accepter le contenu mis en cache s'il date de moins de N secondes. Définir sur 0 pour du contenu récent (équivalent à « Ignorer le cache »), ou sur des valeurs plus élevées pour permettre des réponses plus rapides du cache.
Délai de chargement de la page
Quand considérer une page comme entièrement chargée ? Les mesures ultérieures impliquent un temps d’attente plus long, mais permettent de capturer davantage de contenu dynamique.
Défaut
arrow_drop_down
Agent utilisateur personnalisé
Modifiez la chaîne User-Agent du navigateur. Utile pour accéder aux sites nécessitant des navigateurs spécifiques ou bloquant les robots d'exploration.
Référent personnalisé
Configurez l'en-tête HTTP Referer. Certains sites le vérifient pour s'assurer que le trafic provient bien des sources attendues.
Préserver les images Base64
Conservez les images encodées en base64 directement dans le code Markdown au lieu de les convertir en URL externes.
Ne pas mettre en cache ni suivre
Empêcher la mise en cache ou l'enregistrement de cette requête sur nos serveurs. À utiliser pour les URL sensibles.
Markdown à saveur Github
Fonctionnalités d'activation/désactivation de GFM (Github Flavored Markdown).
Activé
arrow_drop_down
Mode flux
Le mode flux est avantageux pour les grandes pages cibles, ce qui laisse plus de temps à la page pour s'afficher complètement. Si le mode standard génère un contenu incomplet, envisagez d’utiliser le mode Stream.open_in_newApprendre encore plus
Personnaliser les paramètres régionaux du navigateur
Contrôlez les paramètres régionaux du navigateur pour afficher la page. De nombreux sites Web proposent un contenu différent en fonction des paramètres régionaux.open_in_newApprendre encore plus
Respectez robots.txt
Vérifiez les règles du fichier robots.txt avant de récupérer les données. Spécifiez le nom du robot à utiliser pour la vérification.
Inclure le contenu iframe
Extraire le contenu des iframes intégrées. Activer cette fonction pour les pages dont le contenu est chargé dans des iframes.
Inclure Shadow DOM
Extraire le contenu des composants Shadow DOM. Activer pour les pages utilisant des composants web.
Utiliser l'URL finale comme base
Résolvez les URL relatives en utilisant l'URL de destination finale après les redirections, au lieu de l'URL d'origine.
Fichier PDF/HTML local
POST
Utilisez Reader sur vos fichiers PDF et HTML locaux en les téléchargeant. Ne prend en charge que les fichiers PDF et HTML.
upload
Exécuter JavaScript avant l'extraction
POST
Exécutez du code JS personnalisé pour modifier la page avant l'extraction du contenu. Il peut s'agir de code intégré ou d'une URL pointant vers un fichier script.open_in_newApprendre encore plus
Style de titre
Définit le format de titre Markdown (transmis à Turndown).
Style haschisch
arrow_drop_down
Style de règle horizontale
Définit le format de la règle horizontale de démarque (transmis à Turndown).
Style à puces
Définit le caractère marqueur de la liste à puces (transmis à Turndown).
*
arrow_drop_down
Style d'emphase
Définit le délimiteur d'emphase Markdown (transmis à Turndown).
_
arrow_drop_down
Style à forte emphase
Définit le délimiteur d'emphase fort Markdown (transmis à Turndown).
**
arrow_drop_down
Style de lien
Détermine le format du lien Markdown (transmis à Turndown).
En ligne
arrow_drop_down
Conformité à l'UE
Expérimental
Toutes les infrastructures et opérations de traitement des données relèvent entièrement de la juridiction de l’UE.
upload
Demande
GET
Bash
Langue
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
Clé API
visibility_off
Jetons disponibles
0
Pour une meilleure recherche
Nos modèles de frontière constituent la base de recherche pour les systèmes de recherche d'entreprise et RAG de haute qualité.
Nos publications
Découvrez comment nos modèles de recherche de frontière ont été formés à partir de zéro, consultez nos dernières publications. Rencontrez notre équipe chez EMNLP, SIGIR, ICLR, NeurIPS et ICML !
février 17, 2026
février 11, 2026
ICLR 2026
janvier 22, 2026
décembre 29, 2025
ICLR 2026
décembre 04, 2025
AAAI 2026
octobre 01, 2025
NeurIPS 2025
août 31, 2025
EMNLP 2025
juin 24, 2025
ICLR 2025
mars 04, 2025
ACL 2025
décembre 17, 2024
ICLR 2025
décembre 12, 2024
ECIR 2025
septembre 18, 2024
SIGIR 2025
septembre 07, 2024
EMNLP 2024
août 30, 2024
WWW 2025
juin 21, 2024
ICML 2024
mai 30, 2024
février 26, 2024
octobre 30, 2023
EMNLP 2023
juillet 20, 2023
19 publications au total.







































