Lecteur
Convertissez une URL en entrée compatible LLM, en ajoutant simplement
r.jina.ai
devant.API de lecteur
Convertissez une URL en entrée compatible LLM, en ajoutant simplement
r.jina.ai
devant. chevron_leftchevron_right
globe_book
Utilisez
r.jina.ai
pour lire une URL et récupérer son contenutravel_explore
Utilisez
s.jina.ai
pour rechercher sur le Web et obtenir le SERPFormat du contenu
Vous pouvez contrôler le niveau de détail de la réponse pour éviter un filtrage excessif. Le pipeline par défaut est optimisé pour la plupart des sites Web et des entrées LLM.
Défaut
arrow_drop_down
Réponse JSON
La réponse sera au format JSON, contenant l'URL, le titre, le contenu et l'horodatage (si disponible). En mode Recherche, il renvoie une liste de cinq entrées, chacune suivant la structure JSON décrite.
Temps mort
Temps d'attente maximal de chargement de la page (pas le temps total de traitement de la demande).
Budget symbolique
Limite le nombre maximal de jetons utilisés pour cette demande. Le dépassement de cette limite entraînera l'échec de la demande.
Utiliser ReaderLM-v2
Expérimental
Utilise ReaderLM-v2 pour la conversion HTML en Markdown, afin de fournir des résultats de haute qualité pour les sites Web aux structures et contenus complexes. Coûte 3x jetons !
Sélecteur CSS : uniquement
Liste de sélecteurs CSS pour cibler des éléments de page spécifiques.
Sélecteur CSS : Wait-For
Sélecteurs CSS à attendre avant de renvoyer des résultats.
Sélecteur CSS : Exclusion
Sélecteurs CSS pour les éléments à supprimer (en-têtes, pieds de page, etc.).
Supprimer toutes les images
Supprimez toutes les images de la réponse.
Rassemblez tous les liens à la fin
Une section "Boutons & Liens" sera créée à la fin. Cela aide les LLM ou les agents Web en aval à naviguer sur la page ou à entreprendre d'autres actions.
Aucun
arrow_drop_down
Rassemblez toutes les images à la fin
Une section "Images" sera créée à la fin. Cela donne aux LLM en aval un aperçu de tous les visuels de la page, ce qui peut améliorer le raisonnement.
Aucun
arrow_drop_down
Configuration de la fenêtre d'affichage
POST
Définit les dimensions de la fenêtre d'affichage du navigateur pour un rendu réactif.
Cookie de transfert
Notre serveur API peut transmettre vos paramètres de cookies personnalisés lors de l'accès à l'URL, ce qui est utile pour les pages nécessitant une authentification supplémentaire. Notez que les demandes contenant des cookies ne seront pas mises en cache.
Légende
Sous-titre toutes les images à l'URL spécifiée, en ajoutant « Image [idx] : [caption] » comme balise alt pour celles qui n'en ont pas. Cela permet aux LLM en aval d'interagir avec les images dans des activités telles que le raisonnement et la synthèse.
Utiliser un serveur proxy
Notre serveur API peut utiliser votre proxy pour accéder aux URL, ce qui est utile pour les pages accessibles uniquement via des proxys spécifiques.
Utiliser un serveur proxy spécifique à un pays
Définissez le code pays pour le serveur proxy basé sur la localisation. Utilisez « auto » pour une sélection optimale ou « aucun » pour désactiver.
Contourner le cache
Notre serveur API met en cache le contenu des modes Lecture et Recherche pendant un certain temps. Pour contourner ce cache, définissez cet en-tête sur true.
Ne pas mettre en cache/suivre !
Lorsque cette option est activée, les résultats de la demande ne seront pas mis en cache sur nos serveurs.
Markdown à saveur Github
Fonctionnalités d'activation/désactivation de GFM (Github Flavored Markdown).
Activé
arrow_drop_down
Mode flux
Le mode flux est avantageux pour les grandes pages cibles, ce qui laisse plus de temps à la page pour s'afficher complètement. Si le mode standard génère un contenu incomplet, envisagez d’utiliser le mode Stream.
Personnaliser les paramètres régionaux du navigateur
Contrôlez les paramètres régionaux du navigateur pour afficher la page. De nombreux sites Web proposent un contenu différent en fonction des paramètres régionaux.
Respecter strictement la politique des robots
Définissez l'agent utilisateur du bot pour vérifier le fichier robots.txt avant de récupérer le contenu.
Extraction d'iframe
Traite le contenu de tous les iframes intégrés dans l'arborescence DOM.
Extraction du DOM fantôme
Extrait le contenu de toutes les racines Shadow DOM dans le document.
Suivre la page de redirection
Choisissez si vous souhaitez résoudre l'URL de destination finale après avoir suivi toutes les redirections. Activez cette option pour suivre la chaîne de redirection complète.
Fichier PDF/HTML local
POST
Utilisez Reader sur vos fichiers PDF et HTML locaux en les téléchargeant. Ne prend en charge que les fichiers PDF et HTML.
upload
JavaScript pré-exécuté
POST
Exécute le code JS de prétraitement (chaîne en ligne ou URL distante).
Style de titre
Définit le format de titre Markdown (transmis à Turndown).
Syntaxe de titre alternative
arrow_drop_down
Style de règle horizontale
Définit le format de la règle horizontale de démarque (transmis à Turndown).
Style à puces
Définit le caractère marqueur de la liste à puces (transmis à Turndown).
*
arrow_drop_down
Style d'emphase
Définit le délimiteur d'emphase Markdown (transmis à Turndown).
_
arrow_drop_down
Style à forte emphase
Définit le délimiteur d'emphase fort Markdown (transmis à Turndown).
**
arrow_drop_down
Style de lien
Détermine le format du lien Markdown (transmis à Turndown).
En ligne
arrow_drop_down
Conformité à l'UE
Expérimental
Toutes les infrastructures et opérations de traitement des données relèvent entièrement de la juridiction de l’UE.
upload
Demande
GET
Bash
Langue
arrow_drop_down
curl "https://r.jina.ai/https://example.com"
key
Clé API
visibility_off
Jetons disponibles
0
ReaderLM v2 : petit modèle de langage pour HTML vers Markdown et JSON
ReaderLM-v2 est un modèle de langage de 1,5 milliard de paramètres spécialisé dans la conversion HTML vers Markdown et l'extraction HTML vers JSON. Il prend en charge les documents jusqu'à 512 000 jetons dans 29 langues et offre une précision 20 % supérieure à celle de son prédécesseur.
Introduire des informations Web dans les LLM est une étape importante de la mise à la terre, mais cela peut être un défi. La méthode la plus simple consiste à gratter la page Web et à alimenter le code HTML brut. Cependant, le scraping peut être complexe et souvent bloqué, et le HTML brut est encombré d'éléments superflus tels que des balises et des scripts. L'API Reader résout ces problèmes en extrayant le contenu principal d'une URL et en le convertissant en texte clair et convivial LLM, garantissant ainsi une saisie de haute qualité pour vos systèmes d'agent et RAG.
Entrez votre URL
URL du lecteur
HTML brut
Sortie du lecteur
Poser une question
Reader peut être utilisé comme API SERP. Il vous permet d'alimenter votre LLM avec le contenu derrière la page des résultats du moteur de recherche. Ajoutez simplement
https://s.jina.ai/?q=
à votre requête, et Reader effectuera une recherche sur le Web et renverra les cinq premiers résultats avec leurs URL et leur contenu, chacun dans un texte clair et adapté au LLM. De cette façon, vous pouvez toujours maintenir votre LLM à jour, améliorer sa factualité et réduire les hallucinations.Entrez votre requête
URL du lecteur
info Veuillez noter que contrairement à la démo présentée ci-dessus, en pratique, vous ne recherchez pas la question d'origine sur le Web pour vous ancrer. Ce que les gens font souvent, c'est réécrire la question d'origine ou utiliser des questions à sauts multiples. Ils lisent les résultats récupérés, puis génèrent des requêtes supplémentaires pour recueillir plus d'informations si nécessaire avant d'arriver à une réponse finale.
Les images de la page Web sont automatiquement sous-titrées à l'aide d'un modèle de langage de vision dans le lecteur et formatées sous forme de balises alt d'image dans la sortie. Cela donne à votre LLM en aval juste assez d'indices pour intégrer ces images dans ses processus de raisonnement et de synthèse. Cela signifie que vous pouvez poser des questions sur les images, en sélectionner des spécifiques ou même transmettre leurs URL à un VLM plus puissant pour une analyse plus approfondie !
Oui, Reader prend en charge nativement la lecture de PDF. Il est compatible avec la plupart des PDF, y compris ceux contenant de nombreuses images, et il est ultra-rapide ! En combinaison avec un LLM, vous pouvez facilement créer une IA ChatPDF ou d'analyse de documents en un rien de temps.
La meilleure partie? C'est gratuit!
L'API Reader est disponible gratuitement et offre une limite de débit et une tarification flexibles. Construit sur une infrastructure évolutive, il offre une accessibilité, une concurrence et une fiabilité élevées. Nous nous efforçons d'être votre solution de mise à la terre préférée pour vos LLM.
Limite de taux
Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.
Colonnes
arrow_drop_down
Produit | Point de terminaison de l'API | Descriptionarrow_upward | sans clé APIkey_off | avec clé APIkey | avec clé API Premiumkey | Latence moyenne | Comptage de l'utilisation des jetons | Demande autorisée | |
---|---|---|---|---|---|---|---|---|---|
API de lecteur | https://r.jina.ai | Convertir l'URL en texte compatible LLM | 20 RPM | 500 RPM | trending_up5000 RPM | 7.9s | Comptez le nombre de jetons dans la réponse de sortie. | GET/POST | |
API de lecteur | https://s.jina.ai | Recherchez sur le Web et convertissez les résultats en texte adapté au LLM | block | 100 RPM | trending_up1000 RPM | 2.5s | Chaque demande coûte un nombre fixe de jetons, à partir de 10000 jetons | GET/POST | |
Recherche profonde | https://deepsearch.jina.ai/v1/chat/completions | Raisonner, rechercher et itérer pour trouver la meilleure réponse | block | 50 RPM | 500 RPM | 56.7s | Comptez le nombre total de jetons dans l’ensemble du processus. | POST | |
API d'intégration | https://api.jina.ai/v1/embeddings | Convertir du texte/des images en vecteurs de longueur fixe | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart dépend de la taille de l'entrée help | Comptez le nombre de jetons dans la demande d'entrée. | POST | |
API de reclassement | https://api.jina.ai/v1/rerank | Classer les documents par requête | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart dépend de la taille de l'entrée help | Comptez le nombre de jetons dans la demande d'entrée. | POST | |
API de classificateur | https://api.jina.ai/v1/train | Entraîner un classificateur à l'aide d'exemples étiquetés | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Les jetons sont comptés comme suit : input_tokens × num_iters | POST | |
API de classificateur (Coup zéro) | https://api.jina.ai/v1/classify | Classer les entrées à l'aide de la classification à coup zéro | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Jetons comptés comme : input_tokens + label_tokens | POST | |
API de classificateur (Quelques coups) | https://api.jina.ai/v1/classify | Classer les entrées à l'aide d'un classificateur à quelques coups entraîné | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Jetons comptés comme : input_tokens | POST | |
API de segmentation | https://api.jina.ai/v1/segment | Tokeniser et segmenter un texte long | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | Le jeton n'est pas comptabilisé comme une utilisation. | GET/POST |
Pas de panique ! Chaque nouvelle clé API contient dix millions de jetons gratuits !
Tarification des API
La tarification des API est basée sur l'utilisation des jetons. Une clé API vous donne accès à tous les produits de base de la recherche.
Quels sont les coûts associés à l’utilisation de l’API Reader ?
keyboard_arrow_down
Comment fonctionne l'API Reader ?
keyboard_arrow_down
L'API Reader est-elle open source ?
keyboard_arrow_down
Quelle est la latence typique de l’API Reader ?
keyboard_arrow_down
Pourquoi devrais-je utiliser l'API Reader au lieu de gratter la page moi-même ?
keyboard_arrow_down
L'API Reader prend-elle en charge plusieurs langues ?
keyboard_arrow_down
Que dois-je faire si un site Web bloque l’API Reader ?
keyboard_arrow_down
L'API Reader peut-elle extraire le contenu des fichiers PDF ?
keyboard_arrow_down
L'API Reader peut-elle traiter le contenu multimédia des pages Web ?
keyboard_arrow_down
Est-il possible d'utiliser l'API Reader sur des fichiers HTML locaux ?
keyboard_arrow_down
L'API Reader met-elle en cache le contenu ?
keyboard_arrow_down
Puis-je utiliser l'API Reader pour accéder au contenu derrière une connexion ?
keyboard_arrow_down
Puis-je utiliser l'API Reader pour accéder au PDF sur arXiv ?
keyboard_arrow_down
Comment fonctionne la légende d’image dans Reader ?
keyboard_arrow_down
Quelle est l’évolutivité du Reader ? Puis-je l’utiliser en production ?
keyboard_arrow_down
Quelle est la limite de débit de l’API Reader ?
keyboard_arrow_down
Qu'est-ce que Reader-LM ? Comment puis-je l'utiliser ?
keyboard_arrow_down
Limite de taux
Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.
Colonnes
arrow_drop_down
Produit | Point de terminaison de l'API | Descriptionarrow_upward | sans clé APIkey_off | avec clé APIkey | avec clé API Premiumkey | Latence moyenne | Comptage de l'utilisation des jetons | Demande autorisée | |
---|---|---|---|---|---|---|---|---|---|
API de lecteur | https://r.jina.ai | Convertir l'URL en texte compatible LLM | 20 RPM | 500 RPM | trending_up5000 RPM | 7.9s | Comptez le nombre de jetons dans la réponse de sortie. | GET/POST | |
API de lecteur | https://s.jina.ai | Recherchez sur le Web et convertissez les résultats en texte adapté au LLM | block | 100 RPM | trending_up1000 RPM | 2.5s | Chaque demande coûte un nombre fixe de jetons, à partir de 10000 jetons | GET/POST | |
Recherche profonde | https://deepsearch.jina.ai/v1/chat/completions | Raisonner, rechercher et itérer pour trouver la meilleure réponse | block | 50 RPM | 500 RPM | 56.7s | Comptez le nombre total de jetons dans l’ensemble du processus. | POST | |
API d'intégration | https://api.jina.ai/v1/embeddings | Convertir du texte/des images en vecteurs de longueur fixe | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart dépend de la taille de l'entrée help | Comptez le nombre de jetons dans la demande d'entrée. | POST | |
API de reclassement | https://api.jina.ai/v1/rerank | Classer les documents par requête | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart dépend de la taille de l'entrée help | Comptez le nombre de jetons dans la demande d'entrée. | POST | |
API de classificateur | https://api.jina.ai/v1/train | Entraîner un classificateur à l'aide d'exemples étiquetés | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Les jetons sont comptés comme suit : input_tokens × num_iters | POST | |
API de classificateur (Coup zéro) | https://api.jina.ai/v1/classify | Classer les entrées à l'aide de la classification à coup zéro | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Jetons comptés comme : input_tokens + label_tokens | POST | |
API de classificateur (Quelques coups) | https://api.jina.ai/v1/classify | Classer les entrées à l'aide d'un classificateur à quelques coups entraîné | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart dépend de la taille de l'entrée | Jetons comptés comme : input_tokens | POST | |
API de segmentation | https://api.jina.ai/v1/segment | Tokeniser et segmenter un texte long | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | Le jeton n'est pas comptabilisé comme une utilisation. | GET/POST |
Questions courantes liées à l'API
code
Puis-je utiliser la même clé API pour les API de lecture, d'intégration, de reclassement, de classification et de réglage fin ?
keyboard_arrow_down
code
Puis-je surveiller l’utilisation des jetons de ma clé API ?
keyboard_arrow_down
code
Que dois-je faire si j'oublie ma clé API ?
keyboard_arrow_down
code
Les clés API expirent-elles ?
keyboard_arrow_down
code
Puis-je transférer des jetons entre des clés API ?
keyboard_arrow_down
code
Puis-je révoquer ma clé API ?
keyboard_arrow_down
code
Pourquoi la première demande de certains modèles est-elle lente ?
keyboard_arrow_down
code
Les données saisies par l'utilisateur sont-elles utilisées pour entraîner vos modèles ?
keyboard_arrow_down
Questions courantes liées à la facturation
attach_money
La facturation est-elle basée sur le nombre de phrases ou de demandes ?
keyboard_arrow_down
attach_money
Existe-t-il un essai gratuit disponible pour les nouveaux utilisateurs ?
keyboard_arrow_down
attach_money
Les jetons sont-ils facturés pour les demandes ayant échoué ?
keyboard_arrow_down
attach_money
Quels moyens de paiement sont acceptés ?
keyboard_arrow_down
attach_money
La facturation est-elle disponible pour les achats de jetons ?
keyboard_arrow_down