Votre base de recherche survoltée!
Nos clients
Pour une meilleure recherche
Nos modèles de frontière constituent la base de recherche pour les systèmes de recherche d'entreprise et RAG de haute qualité.
Lecteur
Convertissez une URL en entrée compatible LLM, en ajoutant simplement
r.jina.ai
devant.Intégrations
Intégrations multimodales et multilingues de classe mondiale.
Reclasseur
Récupérateur neuronal de classe mondiale pour maximiser la pertinence de la recherche.
Recherche profonde
Recherchez, lisez et raisonnez jusqu'à trouver la meilleure réponse.
Classificateur
Classification à zéro plan et à quelques plans pour l'image et le texte.
Segmenteur
Coupez un long texte en morceaux et effectuez la tokenisation.
Commencez instantanément — aucune carte de crédit ni inscription requise !
verified_user Nous sommes conformes aux normes SOC 2 Type 1 et 2 de l'American Institute of Certified Public Accountants (AICPA). open_in_new
chevron_leftchevron_right
globe_book
Utilisez
r.jina.ai
pour lire une URL et récupérer son contenutravel_explore
Utilisez
s.jina.ai
pour rechercher sur le Web et obtenir le SERPFormat du contenu
Vous pouvez contrôler le niveau de détail de la réponse pour éviter un filtrage excessif. Le pipeline par défaut est optimisé pour la plupart des sites Web et des entrées LLM.
Défaut
arrow_drop_down
Réponse JSON
La réponse sera au format JSON, contenant l'URL, le titre, le contenu et l'horodatage (si disponible). En mode Recherche, il renvoie une liste de cinq entrées, chacune suivant la structure JSON décrite.
Temps mort
Temps d'attente maximal de chargement de la page (pas le temps total de traitement de la demande).
Budget symbolique
Limite le nombre maximal de jetons utilisés pour cette demande. Le dépassement de cette limite entraînera l'échec de la demande.
Utiliser ReaderLM-v2
Expérimental
Utilise ReaderLM-v2 pour la conversion HTML en Markdown, afin de fournir des résultats de haute qualité pour les sites Web aux structures et contenus complexes. Coûte 3x jetons !
Sélecteur CSS : uniquement
Liste de sélecteurs CSS pour cibler des éléments de page spécifiques.
Sélecteur CSS : Wait-For
Sélecteurs CSS à attendre avant de renvoyer des résultats.
Sélecteur CSS : Exclusion
Sélecteurs CSS pour les éléments à supprimer (en-têtes, pieds de page, etc.).
Supprimer toutes les images
Supprimez toutes les images de la réponse.
Rassemblez tous les liens à la fin
Une section "Boutons & Liens" sera créée à la fin. Cela aide les LLM ou les agents Web en aval à naviguer sur la page ou à entreprendre d'autres actions.
Aucun
arrow_drop_down
Rassemblez toutes les images à la fin
Une section "Images" sera créée à la fin. Cela donne aux LLM en aval un aperçu de tous les visuels de la page, ce qui peut améliorer le raisonnement.
Aucun
arrow_drop_down
Configuration de la fenêtre d'affichage
POST
Définit les dimensions de la fenêtre d'affichage du navigateur pour un rendu réactif.
Cookie de transfert
Notre serveur API peut transmettre vos paramètres de cookies personnalisés lors de l'accès à l'URL, ce qui est utile pour les pages nécessitant une authentification supplémentaire. Notez que les demandes contenant des cookies ne seront pas mises en cache.
Légende
Sous-titre toutes les images à l'URL spécifiée, en ajoutant « Image [idx] : [caption] » comme balise alt pour celles qui n'en ont pas. Cela permet aux LLM en aval d'interagir avec les images dans des activités telles que le raisonnement et la synthèse.
Utiliser un serveur proxy
Notre serveur API peut utiliser votre proxy pour accéder aux URL, ce qui est utile pour les pages accessibles uniquement via des proxys spécifiques.
Utiliser un serveur proxy spécifique à un pays
Définissez le code pays pour le serveur proxy basé sur la localisation. Utilisez « auto » pour une sélection optimale ou « aucun » pour désactiver.
Contourner le cache
Notre serveur API met en cache le contenu des modes Lecture et Recherche pendant un certain temps. Pour contourner ce cache, définissez cet en-tête sur true.
Ne pas mettre en cache/suivre !
Lorsque cette option est activée, les résultats de la demande ne seront pas mis en cache sur nos serveurs.
Markdown à saveur Github
Fonctionnalités d'activation/désactivation de GFM (Github Flavored Markdown).
Activé
arrow_drop_down
Mode flux
Le mode flux est avantageux pour les grandes pages cibles, ce qui laisse plus de temps à la page pour s'afficher complètement. Si le mode standard génère un contenu incomplet, envisagez d’utiliser le mode Stream.
Personnaliser les paramètres régionaux du navigateur
Contrôlez les paramètres régionaux du navigateur pour afficher la page. De nombreux sites Web proposent un contenu différent en fonction des paramètres régionaux.
Respecter strictement la politique des robots
Définissez l'agent utilisateur du bot pour vérifier le fichier robots.txt avant de récupérer le contenu.
Extraction d'iframe
Traite le contenu de tous les iframes intégrés dans l'arborescence DOM.
Extraction du DOM fantôme
Extrait le contenu de toutes les racines Shadow DOM dans le document.
Suivre la page de redirection
Choisissez si vous souhaitez résoudre l'URL de destination finale après avoir suivi toutes les redirections. Activez cette option pour suivre la chaîne de redirection complète.
Fichier PDF/HTML local
POST
Utilisez Reader sur vos fichiers PDF et HTML locaux en les téléchargeant. Ne prend en charge que les fichiers PDF et HTML.
upload
JavaScript pré-exécuté
POST
Exécute le code JS de prétraitement (chaîne en ligne ou URL distante).
Style de titre
Définit le format de titre Markdown (transmis à Turndown).
Syntaxe de titre alternative
arrow_drop_down
Style de règle horizontale
Définit le format de la règle horizontale de démarque (transmis à Turndown).
Style à puces
Définit le caractère marqueur de la liste à puces (transmis à Turndown).
*
arrow_drop_down
Style d'emphase
Définit le délimiteur d'emphase Markdown (transmis à Turndown).
_
arrow_drop_down
Style à forte emphase
Définit le délimiteur d'emphase fort Markdown (transmis à Turndown).
**
arrow_drop_down
Style de lien
Détermine le format du lien Markdown (transmis à Turndown).
En ligne
arrow_drop_down
Conformité à l'UE
Expérimental
Toutes les infrastructures et opérations de traitement des données relèvent entièrement de la juridiction de l’UE.
upload
Demande
GET
Bash
Langue
arrow_drop_down
curl "https://r.jina.ai/https://example.com"
key
Clé API
visibility_off
Jetons disponibles
0
Nos publications
Découvrez comment nos modèles de recherche de frontière ont été formés à partir de zéro, consultez nos dernières publications. Rencontrez notre équipe chez EMNLP, SIGIR, ICLR, NeurIPS et ICML !
arXiv
juin 24, 2025
ICLR 2025
mars 04, 2025
ACL 2025
décembre 17, 2024
ICLR 2025
décembre 12, 2024
ECIR 2025
septembre 18, 2024
SIGIR 2025
septembre 07, 2024
EMNLP 2024
août 30, 2024
WWW 2025
juin 21, 2024
ICML 2024
mai 30, 2024
arXiv
février 26, 2024
arXiv
octobre 30, 2023
EMNLP 2023
juillet 20, 2023
12 publications au total.