Lecteur
Convertissez une URL en entrée compatible LLM, en ajoutant simplement
r.jina.ai devant.API de lecteur
Convertissez une URL en entrée compatible LLM, en ajoutant simplement
r.jina.ai devant.chevron_leftchevron_right
globe_book
Utilisez
r.jina.ai pour lire une URL et récupérer son contenutravel_explore
Utilisez
s.jina.ai pour rechercher sur le Web et obtenir le SERPAjoutez
mcp.jina.ai comme serveur MCP pour accéder à notre API dans les LLMFormat du contenu
Vous pouvez contrôler le niveau de détail de la réponse pour éviter un filtrage excessif. Le pipeline par défaut est optimisé pour la plupart des sites Web et des entrées LLM.
Défaut
arrow_drop_down
Réponse JSON
La réponse sera au format JSON, contenant l'URL, le titre, le contenu et l'horodatage (si disponible). En mode Recherche, il renvoie une liste de cinq entrées, chacune suivant la structure JSON décrite.
Délai d'attente (secondes)
Délai maximal d'attente pour le chargement de la page. Augmenter ce délai pour les pages lentes, le diminuer pour les pages statiques simples.
Budget symbolique
Limite le nombre maximal de jetons utilisés pour cette demande. Le dépassement de cette limite entraînera l'échec de la demande.
Utiliser ReaderLM-v2
Expérimental
Utilise ReaderLM-v2 pour la conversion HTML en Markdown, afin de fournir des résultats de haute qualité pour les sites Web aux structures et contenus complexes. Coûte 3x jetons !open_in_newApprendre encore plus
Extrait uniquement (sélecteur CSS)
Extraire uniquement le contenu correspondant à ces sélecteurs CSS. Exemple : article, .main-content, #post-body
Attendre (sélecteur CSS)
Attendez que ces éléments apparaissent avant d'extraire le contenu. Utile pour le contenu chargé dynamiquement.
Exclure (sélecteur CSS)
Supprimez ces éléments avant l'extraction. Exemple : nav, footer, .sidebar, #ads
Supprimer toutes les images
Supprime toutes les images du résultat. Cela réduit la consommation de jetons lorsque les images ne sont pas nécessaires.
Format de citation OpenAI
Formate les liens pour l'outil de navigation web d'OpenAI. Utilise des marqueurs de citation spéciaux compatibles avec les modèles GPT.open_in_newApprendre encore plus
Résumé des liens
Une section "Boutons & Liens" sera créée à la fin. Cela aide les LLM ou les agents Web en aval à naviguer sur la page ou à entreprendre d'autres actions.
Aucun
arrow_drop_down
Section récapitulative des images
Une section "Images" sera créée à la fin. Cela donne aux LLM en aval un aperçu de tous les visuels de la page, ce qui peut améliorer le raisonnement.
Aucun
arrow_drop_down
Taille de la fenêtre du navigateur
POST
Définir les dimensions de la fenêtre du navigateur. Cela affecte la mise en page adaptative et la visibilité du contenu.open_in_newApprendre encore plus
Cookie de transfert
Notre serveur API peut transmettre vos paramètres de cookies personnalisés lors de l'accès à l'URL, ce qui est utile pour les pages nécessitant une authentification supplémentaire. Notez que les demandes contenant des cookies ne seront pas mises en cache.open_in_newApprendre encore plus
Légende
Sous-titre toutes les images à l'URL spécifiée, en ajoutant « Image [idx] : [caption] » comme balise alt pour celles qui n'en ont pas. Cela permet aux LLM en aval d'interagir avec les images dans des activités telles que le raisonnement et la synthèse.
Utiliser un serveur proxy
Notre serveur API peut utiliser votre proxy pour accéder aux URL, ce qui est utile pour les pages accessibles uniquement via des proxys spécifiques.open_in_newApprendre encore plus
Utiliser un serveur proxy spécifique à un pays
Définissez le code pays pour le serveur proxy basé sur la localisation. Utilisez « auto » pour une sélection optimale ou « aucun » pour désactiver.
Contourner le cache
Notre serveur API met en cache le contenu des modes Lecture et Recherche pendant un certain temps. Pour contourner ce cache, définissez cet en-tête sur true.
Tolérance du cache (secondes)
Accepter le contenu mis en cache s'il date de moins de N secondes. Définir sur 0 pour du contenu récent (équivalent à « Ignorer le cache »), ou sur des valeurs plus élevées pour permettre des réponses plus rapides du cache.
Délai de chargement de la page
Quand considérer une page comme entièrement chargée ? Les mesures ultérieures impliquent un temps d’attente plus long, mais permettent de capturer davantage de contenu dynamique.
Défaut
arrow_drop_down
Agent utilisateur personnalisé
Modifiez la chaîne User-Agent du navigateur. Utile pour accéder aux sites nécessitant des navigateurs spécifiques ou bloquant les robots d'exploration.
Référent personnalisé
Configurez l'en-tête HTTP Referer. Certains sites le vérifient pour s'assurer que le trafic provient bien des sources attendues.
Préserver les images Base64
Conservez les images encodées en base64 directement dans le code Markdown au lieu de les convertir en URL externes.
Ne pas mettre en cache ni suivre
Empêcher la mise en cache ou l'enregistrement de cette requête sur nos serveurs. À utiliser pour les URL sensibles.
Markdown à saveur Github
Fonctionnalités d'activation/désactivation de GFM (Github Flavored Markdown).
Activé
arrow_drop_down
Mode flux
Le mode flux est avantageux pour les grandes pages cibles, ce qui laisse plus de temps à la page pour s'afficher complètement. Si le mode standard génère un contenu incomplet, envisagez d’utiliser le mode Stream.open_in_newApprendre encore plus
Personnaliser les paramètres régionaux du navigateur
Contrôlez les paramètres régionaux du navigateur pour afficher la page. De nombreux sites Web proposent un contenu différent en fonction des paramètres régionaux.open_in_newApprendre encore plus
Respectez robots.txt
Vérifiez les règles du fichier robots.txt avant de récupérer les données. Spécifiez le nom du robot à utiliser pour la vérification.
Inclure le contenu iframe
Extraire le contenu des iframes intégrées. Activer cette fonction pour les pages dont le contenu est chargé dans des iframes.
Inclure Shadow DOM
Extraire le contenu des composants Shadow DOM. Activer pour les pages utilisant des composants web.
Utiliser l'URL finale comme base
Résolvez les URL relatives en utilisant l'URL de destination finale après les redirections, au lieu de l'URL d'origine.
Fichier PDF/HTML local
POST
Utilisez Reader sur vos fichiers PDF et HTML locaux en les téléchargeant. Ne prend en charge que les fichiers PDF et HTML.
upload
Exécuter JavaScript avant l'extraction
POST
Exécutez du code JS personnalisé pour modifier la page avant l'extraction du contenu. Il peut s'agir de code intégré ou d'une URL pointant vers un fichier script.open_in_newApprendre encore plus
Style de titre
Définit le format de titre Markdown (transmis à Turndown).
Style haschisch
arrow_drop_down
Style de règle horizontale
Définit le format de la règle horizontale de démarque (transmis à Turndown).
Style à puces
Définit le caractère marqueur de la liste à puces (transmis à Turndown).
*
arrow_drop_down
Style d'emphase
Définit le délimiteur d'emphase Markdown (transmis à Turndown).
_
arrow_drop_down
Style à forte emphase
Définit le délimiteur d'emphase fort Markdown (transmis à Turndown).
**
arrow_drop_down
Style de lien
Détermine le format du lien Markdown (transmis à Turndown).
En ligne
arrow_drop_down
Conformité à l'UE
Expérimental
Toutes les infrastructures et opérations de traitement des données relèvent entièrement de la juridiction de l’UE.
upload
Demande
GET
Bash
Langue
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
Clé API
visibility_off
Jetons disponibles
0
Jina VLM : Petit modèle de langage de vision multilingue
Un modèle vision-langage à 2,4 milliards de paramètres qui atteint un niveau de réponse aux questions visuelles multilingues de pointe parmi les VLM ouverts à l'échelle 2B.
ReaderLM v2 : petit modèle de langage pour HTML vers Markdown et JSON
ReaderLM-v2 est un modèle de langage de 1,5 milliard de paramètres spécialisé dans la conversion HTML vers Markdown et l'extraction HTML vers JSON. Il prend en charge les documents jusqu'à 512 000 jetons dans 29 langues et offre une précision 20 % supérieure à celle de son prédécesseur.
Introduire des informations Web dans les LLM est une étape importante de la mise à la terre, mais cela peut être un défi. La méthode la plus simple consiste à gratter la page Web et à alimenter le code HTML brut. Cependant, le scraping peut être complexe et souvent bloqué, et le HTML brut est encombré d'éléments superflus tels que des balises et des scripts. L'API Reader résout ces problèmes en extrayant le contenu principal d'une URL et en le convertissant en texte clair et convivial LLM, garantissant ainsi une saisie de haute qualité pour vos systèmes d'agent et RAG.
Entrez votre URL
URL du lecteur
HTML brut
Sortie du lecteur
Poser une question
Reader peut être utilisé comme API SERP. Il vous permet d'alimenter votre LLM avec le contenu derrière la page des résultats du moteur de recherche. Ajoutez simplement
https://s.jina.ai/?q= à votre requête, et Reader effectuera une recherche sur le Web et renverra les cinq premiers résultats avec leurs URL et leur contenu, chacun dans un texte clair et adapté au LLM. De cette façon, vous pouvez toujours maintenir votre LLM à jour, améliorer sa factualité et réduire les hallucinations.Entrez votre requête
URL du lecteur
info Veuillez noter que contrairement à la démo présentée ci-dessus, en pratique, vous ne recherchez pas la question d'origine sur le Web pour vous ancrer. Ce que les gens font souvent, c'est réécrire la question d'origine ou utiliser des questions à sauts multiples. Ils lisent les résultats récupérés, puis génèrent des requêtes supplémentaires pour recueillir plus d'informations si nécessaire avant d'arriver à une réponse finale.
Les images de la page Web sont automatiquement sous-titrées à l'aide d'un modèle de langage de vision dans le lecteur et formatées sous forme de balises alt d'image dans la sortie. Cela donne à votre LLM en aval juste assez d'indices pour intégrer ces images dans ses processus de raisonnement et de synthèse. Cela signifie que vous pouvez poser des questions sur les images, en sélectionner des spécifiques ou même transmettre leurs URL à un VLM plus puissant pour une analyse plus approfondie !
Oui, Reader prend en charge nativement la lecture de PDF. Il est compatible avec la plupart des PDF, y compris ceux contenant de nombreuses images, et il est ultra-rapide ! En combinaison avec un LLM, vous pouvez facilement créer une IA ChatPDF ou d'analyse de documents en un rien de temps.
La meilleure partie? C'est gratuit!
L'API Reader est disponible gratuitement et offre une limite de débit et une tarification flexibles. Construit sur une infrastructure évolutive, il offre une accessibilité, une concurrence et une fiabilité élevées. Nous nous efforçons d'être votre solution de mise à la terre préférée pour vos LLM.
Limite de taux
Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.
Colonnes
arrow_drop_down
| Produit | Point de terminaison de l'API | Descriptionarrow_upward | sans clé APIkey_off | avec clé API gratuitekey | avec clé API payantekey | avec clé API Premiumkey | Latence moyenne | Comptage de l'utilisation des jetons | Demande autorisée | |
|---|---|---|---|---|---|---|---|---|---|---|
| API de lecteur | https://r.jina.ai | Convertir l'URL en texte compatible LLM | 20 RPM | 500 RPM | 500 RPM | trending_up5000 RPM | 7.9s | Comptez le nombre de jetons dans la réponse de sortie. | GET/POST | |
| API de lecteur | https://s.jina.ai | Recherchez sur le Web et convertissez les résultats en texte adapté au LLM | block | 100 RPM | 100 RPM | trending_up1000 RPM | 2.5s | Chaque demande coûte un nombre fixe de jetons, à partir de 10000 jetons | GET/POST | |
| API d'intégration | https://api.jina.ai/v1/embeddings | Convertir du texte/des images en vecteurs de longueur fixe | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart dépend de la taille de l'entrée help | Comptez le nombre de jetons dans la demande d'entrée. | POST | |
| API de reclassement | https://api.jina.ai/v1/rerank | Classer les documents par requête | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart dépend de la taille de l'entrée help | Comptez le nombre de jetons dans la demande d'entrée. | POST | |
| API de classificateur | https://api.jina.ai/v1/train | Entraîner un classificateur à l'aide d'exemples étiquetés | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Les jetons sont comptés comme suit : input_tokens × num_iters | POST | |
| API de classificateur (Coup zéro) | https://api.jina.ai/v1/classify | Classer les entrées à l'aide de la classification à coup zéro | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Jetons comptés comme : input_tokens + label_tokens | POST | |
| API de classificateur (Quelques coups) | https://api.jina.ai/v1/classify | Classer les entrées à l'aide d'un classificateur à quelques coups entraîné | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Jetons comptés comme : input_tokens | POST | |
| API de segmentation | https://api.jina.ai/v1/segment | Tokeniser et segmenter un texte long | 20 RPM | 200 RPM | 200 RPM | 1,000 RPM | 0.3s | Le jeton n'est pas comptabilisé comme une utilisation. | GET/POST | |
| Recherche profonde | https://deepsearch.jina.ai/v1/chat/completions | Raisonner, rechercher et itérer pour trouver la meilleure réponse | block | 50 RPM | 50 RPM | 500 RPM | 56.7s | Comptez le nombre total de jetons dans l’ensemble du processus. | POST |
Pas de panique ! Chaque nouvelle clé API contient dix millions de jetons gratuits !
Tarification des API
La tarification des API est basée sur l'utilisation des jetons. Une clé API vous donne accès à tous les produits de base de la recherche.
Quels sont les coûts associés à l’utilisation de l’API Reader ?
keyboard_arrow_down
Comment fonctionne l'API Reader ?
keyboard_arrow_down
L'API Reader est-elle open source ?
keyboard_arrow_down
Quelle est la latence typique de l’API Reader ?
keyboard_arrow_down
Pourquoi devrais-je utiliser l'API Reader au lieu de gratter la page moi-même ?
keyboard_arrow_down
L'API Reader prend-elle en charge plusieurs langues ?
keyboard_arrow_down
Que dois-je faire si un site Web bloque l’API Reader ?
keyboard_arrow_down
L'API Reader peut-elle extraire le contenu des fichiers PDF ?
keyboard_arrow_down
L'API Reader peut-elle traiter le contenu multimédia des pages Web ?
keyboard_arrow_down
Est-il possible d'utiliser l'API Reader sur des fichiers HTML locaux ?
keyboard_arrow_down
L'API Reader met-elle en cache le contenu ?
keyboard_arrow_down
Puis-je utiliser l'API Reader pour accéder au contenu derrière une connexion ?
keyboard_arrow_down
Puis-je utiliser l'API Reader pour accéder au PDF sur arXiv ?
keyboard_arrow_down
Comment fonctionne la légende d’image dans Reader ?
keyboard_arrow_down
Quelle est l’évolutivité du Reader ? Puis-je l’utiliser en production ?
keyboard_arrow_down
Quelle est la limite de débit de l’API Reader ?
keyboard_arrow_down
Qu'est-ce que Reader-LM ? Comment puis-je l'utiliser ?
keyboard_arrow_down
Comment extraire des données structurées à partir de pages web ?
keyboard_arrow_down
Le lecteur contourne-t-il activement la protection anti-robots du site web ?
keyboard_arrow_down
Le passage d'une clé API gratuite à une clé payante me donnera-t-il accès à davantage de sites web ?
keyboard_arrow_down
Limite de taux
Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.
Colonnes
arrow_drop_down
| Produit | Point de terminaison de l'API | Descriptionarrow_upward | sans clé APIkey_off | avec clé API gratuitekey | avec clé API payantekey | avec clé API Premiumkey | Latence moyenne | Comptage de l'utilisation des jetons | Demande autorisée | |
|---|---|---|---|---|---|---|---|---|---|---|
| API de lecteur | https://r.jina.ai | Convertir l'URL en texte compatible LLM | 20 RPM | 500 RPM | 500 RPM | trending_up5000 RPM | 7.9s | Comptez le nombre de jetons dans la réponse de sortie. | GET/POST | |
| API de lecteur | https://s.jina.ai | Recherchez sur le Web et convertissez les résultats en texte adapté au LLM | block | 100 RPM | 100 RPM | trending_up1000 RPM | 2.5s | Chaque demande coûte un nombre fixe de jetons, à partir de 10000 jetons | GET/POST | |
| API d'intégration | https://api.jina.ai/v1/embeddings | Convertir du texte/des images en vecteurs de longueur fixe | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart dépend de la taille de l'entrée help | Comptez le nombre de jetons dans la demande d'entrée. | POST | |
| API de reclassement | https://api.jina.ai/v1/rerank | Classer les documents par requête | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart dépend de la taille de l'entrée help | Comptez le nombre de jetons dans la demande d'entrée. | POST | |
| API de classificateur | https://api.jina.ai/v1/train | Entraîner un classificateur à l'aide d'exemples étiquetés | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Les jetons sont comptés comme suit : input_tokens × num_iters | POST | |
| API de classificateur (Coup zéro) | https://api.jina.ai/v1/classify | Classer les entrées à l'aide de la classification à coup zéro | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Jetons comptés comme : input_tokens + label_tokens | POST | |
| API de classificateur (Quelques coups) | https://api.jina.ai/v1/classify | Classer les entrées à l'aide d'un classificateur à quelques coups entraîné | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Jetons comptés comme : input_tokens | POST | |
| API de segmentation | https://api.jina.ai/v1/segment | Tokeniser et segmenter un texte long | 20 RPM | 200 RPM | 200 RPM | 1,000 RPM | 0.3s | Le jeton n'est pas comptabilisé comme une utilisation. | GET/POST | |
| Recherche profonde | https://deepsearch.jina.ai/v1/chat/completions | Raisonner, rechercher et itérer pour trouver la meilleure réponse | block | 50 RPM | 50 RPM | 500 RPM | 56.7s | Comptez le nombre total de jetons dans l’ensemble du processus. | POST |
Questions courantes liées à l'API
code
Puis-je utiliser la même clé API pour les API de lecture, d'intégration, de reclassement, de classification et de réglage fin ?
keyboard_arrow_down
code
Puis-je surveiller l’utilisation des jetons de ma clé API ?
keyboard_arrow_down
code
Que dois-je faire si j'oublie ma clé API ?
keyboard_arrow_down
code
Les clés API expirent-elles ?
keyboard_arrow_down
code
Puis-je transférer des jetons entre des clés API ?
keyboard_arrow_down
code
Puis-je révoquer ma clé API ?
keyboard_arrow_down
code
Pourquoi la première demande de certains modèles est-elle lente ?
keyboard_arrow_down
code
Mes données API sont-elles utilisées pour entraîner vos modèles ?
keyboard_arrow_down
code
Quelles sont les limites de débit des API Jina ?
keyboard_arrow_down
code
Existe-t-il des limites de taille de lot pour les API ?
keyboard_arrow_down
Questions courantes liées à la facturation
attach_money
La facturation est-elle basée sur le nombre de phrases ou de demandes ?
keyboard_arrow_down
attach_money
Existe-t-il un essai gratuit disponible pour les nouveaux utilisateurs ?
keyboard_arrow_down
attach_money
Les jetons sont-ils facturés pour les demandes ayant échoué ?
keyboard_arrow_down
attach_money
Quels moyens de paiement sont acceptés ?
keyboard_arrow_down
attach_money
La facturation est-elle disponible pour les achats de jetons ?
keyboard_arrow_down


