Lector
Convierte una URL en una entrada compatible con LLM, simplemente agregando
r.jina.ai
al frente.API de lector
Convierte una URL en una entrada compatible con LLM, simplemente agregando
r.jina.ai
al frente. chevron_leftchevron_right
globe_book
Utilice
r.jina.ai
para leer una URL y obtener su contenidotravel_explore
Utilice
s.jina.ai
para buscar en la web y obtener SERPFormato del contenido
Puede controlar el nivel de detalle de la respuesta para evitar el filtrado excesivo. La canalización predeterminada está optimizada para la mayoría de los sitios web y las entradas de LLM.
Por defecto
arrow_drop_down
Respuesta JSON
La respuesta estará en formato JSON y contendrá la URL, el título, el contenido y la marca de tiempo (si está disponible). En el modo de búsqueda, devuelve una lista de cinco entradas, cada una de las cuales sigue la estructura JSON descrita.
Se acabó el tiempo
Tiempo máximo de espera para cargar la página (no el tiempo total de procesamiento de la solicitud).
Presupuesto de tokens
Limita la cantidad máxima de tokens que se pueden usar para esta solicitud. Si se excede este límite, la solicitud fallará.
Utilice ReaderLM-v2
Experimental
Utiliza ReaderLM-v2 para la conversión de HTML a Markdown y ofrece resultados de alta calidad para sitios web con estructuras y contenidos complejos. ¡Cuesta el triple de tokens!
Selector CSS: Solo
Lista de selectores CSS para apuntar a elementos de página específicos.
Selector CSS: Esperar
Selectores CSS que hay que esperar antes de devolver resultados.
Selector CSS: Excluyendo
Selectores CSS para elementos a eliminar (encabezados, pies de página, etc.).
Eliminar todas las imágenes
Eliminar todas las imágenes de la respuesta.
Reúna todos los enlaces al final
Al final se creará una sección de "Botones y enlaces". Esto ayuda a los LLM posteriores o agentes web a navegar por la página o realizar más acciones.
Ninguno
arrow_drop_down
Reúna todas las imágenes al final
Se creará una sección de "Imágenes" al final. Esto brinda a los LLM posteriores una descripción general de todos los elementos visuales de la página, lo que puede mejorar el razonamiento.
Ninguno
arrow_drop_down
Configuración de la ventana gráfica
POST
Establece las dimensiones de la ventana gráfica del navegador para una representación responsiva.
Cookie de reenvío
Nuestro servidor API puede reenviar su configuración de cookies personalizada al acceder a la URL, lo cual es útil para páginas que requieren autenticación adicional. Tenga en cuenta que las solicitudes con cookies no se almacenarán en caché.
Captura de imagen
Subtitula todas las imágenes en la URL especificada, agregando 'Imagen [idx]: [caption]' como etiqueta alternativa para aquellas que no tienen una. Esto permite que los LLM posteriores interactúen con las imágenes en actividades como razonar y resumir.
Utilice un servidor proxy
Nuestro servidor API puede utilizar su proxy para acceder a las URL, lo cual resulta útil para páginas a las que solo se puede acceder a través de servidores proxy específicos.
Utilice un servidor proxy específico del país
Establezca el código de país para el servidor proxy basado en la ubicación. Utilice "automático" para una selección óptima o "ninguno" para deshabilitarlo.
Omitir caché
Nuestro servidor API almacena en caché los contenidos del modo Lectura y Búsqueda durante un cierto período de tiempo. Para omitir este caché, establezca este encabezado en verdadero.
¡No almacenar en caché ni rastrear!
Cuando esta opción está habilitada, los resultados de la solicitud no se almacenarán en caché en nuestros servidores.
Markdown con sabor a Github
Funciones de inclusión/exclusión voluntaria de GFM (Github Flavored Markdown).
Activado
arrow_drop_down
Modo de transmisión
El modo de transmisión es beneficioso para páginas de destino grandes, ya que permite más tiempo para que la página se represente por completo. Si el modo estándar genera contenido incompleto, considere usar el modo Stream.
Personalizar la configuración regional del navegador
Controla la configuración regional del navegador para mostrar la página. Muchos sitios web ofrecen contenido diferente según la configuración regional.
Cumplir estrictamente la política de robots
Define el agente de usuario del bot para que verifique el archivo robots.txt antes de obtener el contenido.
Extracción de iframe
Procesa el contenido de todos los iframes incrustados en el árbol DOM.
Extracción de DOM de sombra
Extrae contenido de todas las raíces Shadow DOM en el documento.
Seguir página de redireccionamiento
Seleccione si desea resolver la URL de destino final después de seguir todas las redirecciones. Habilite esta opción para seguir la cadena de redireccionamiento completa.
Archivo PDF/HTML local
POST
Utilice Reader en sus archivos PDF y HTML locales cargándolos. Solo se admiten archivos PDF y HTML.
upload
Ejecutar JavaScript previamente
POST
Ejecuta código JS de preprocesamiento (cadena en línea o URL remota).
Estilo de encabezado
Establece el formato del encabezado de Markdown (pasado a Turndown).
Sintaxis de encabezado alternativo
arrow_drop_down
Estilo de regla horizontal
Define el formato de la regla horizontal de Markdown (pasado a Turndown).
Estilo de viñetas
Establece el carácter marcador de la lista de viñetas (se pasa a Turndown).
*
arrow_drop_down
Estilo de énfasis
Define el delimitador de énfasis de Markdown (pasado a Turndown).
_
arrow_drop_down
Estilo de énfasis fuerte
Establece un delimitador de énfasis fuerte de Markdown (se pasa a Turndown).
**
arrow_drop_down
Estilo de enlace
Determina el formato del enlace de Markdown (se pasa a Turndown).
En línea
arrow_drop_down
Cumplimiento de la UE
Todas las operaciones de infraestructura y procesamiento de datos residen íntegramente dentro de la jurisdicción de la UE.
upload
Pedido
GET
Bash
Idioma
arrow_drop_down
curl "https://r.jina.ai/https://example.com"
key
Clave API
visibility_off
Fichas disponibles
0
ReaderLM v2: un pequeño modelo de lenguaje para convertir HTML a Markdown y JSON
ReaderLM-v2 es un modelo de lenguaje de parámetros 1500 millones especializado en la conversión de HTML a Markdown y la extracción de HTML a JSON. Admite documentos de hasta 512 000 tokens en 29 idiomas y ofrece un 20 % más de precisión en comparación con su predecesor.
Introducir información web en los LLM es un paso importante para la puesta a tierra, pero puede ser un desafío. El método más simple es raspar la página web y alimentar el HTML sin formato. Sin embargo, el scraping puede ser complejo y a menudo bloqueado, y el HTML sin formato está lleno de elementos extraños como marcas y scripts. Reader API aborda estos problemas extrayendo el contenido principal de una URL y convirtiéndolo en texto limpio y compatible con LLM, lo que garantiza una entrada de alta calidad para su agente y sus sistemas RAG.
Introduce tu URL
URL del lector
HTML sin formato
Salida del lector
Haz una pregunta
Reader se puede utilizar como API SERP. Le permite alimentar su LLM con el contenido detrás de la página del motor de resultados de búsqueda. Simplemente anteponga
https://s.jina.ai/?q=
a su consulta y Reader buscará en la web y devolverá los cinco primeros resultados con sus URL y contenidos, cada uno en un texto limpio y compatible con LLM. De esta manera, puede mantener siempre actualizado su LLM, mejorar su veracidad y reducir las alucinaciones.Ingresa tu consulta
URL del lector
info Tenga en cuenta que, a diferencia de la demostración que se muestra arriba, en la práctica no busca la pregunta original en la web para fundamentarse. Lo que la gente suele hacer es reescribir la pregunta original o utilizar preguntas de múltiples saltos. Leen los resultados recuperados y luego generan consultas adicionales para recopilar más información según sea necesario antes de llegar a una respuesta final.
Las imágenes de la página web se subtitulan automáticamente utilizando un modelo de lenguaje de visión en el lector y se formatean como etiquetas alternativas de imagen en la salida. Esto le brinda a su LLM posterior suficientes sugerencias para incorporar esas imágenes en sus procesos de razonamiento y resumen. Esto significa que puede hacer preguntas sobre las imágenes, seleccionar imágenes específicas o incluso reenviar sus URL a un VLM más potente para un análisis más profundo.
Sí, Reader admite de forma nativa la lectura de PDF. Es compatible con la mayoría de los archivos PDF, incluidos aquellos con muchas imágenes, ¡y es ultrarrápido! Combinado con un LLM, puede crear fácilmente un ChatPDF o una IA de análisis de documentos en poco tiempo.
¿La mejor parte? ¡Es gratis!
Reader API está disponible de forma gratuita y ofrece límites de tarifas y precios flexibles. Construido sobre una infraestructura escalable, ofrece alta accesibilidad, simultaneidad y confiabilidad. Nos esforzamos por ser su solución de conexión a tierra preferida para sus LLM.
Límite de velocidad
Columnas
arrow_drop_down
Producto | Punto final de API | Descripciónarrow_upward | Sin clave APIkey_off | con clave APIkey | con clave API Premiumkey | Latencia media | Recuento de uso de tokens | Solicitud Permitida | |
---|---|---|---|---|---|---|---|---|---|
API de lector | https://r.jina.ai | Convertir URL a texto compatible con LLM | 20 RPM | 200 RPM | trending_up2000 RPM | 4.6s | Cuente la cantidad de tokens en la respuesta de salida. | GET/POST | |
API de lector | https://s.jina.ai | Busque en la web y convierta los resultados en texto compatible con LLM | block | 40 RPM | trending_up400 RPM | 5.7s | Cada solicitud cuesta una cantidad fija de tokens, a partir de 10000 tokens | GET/POST | |
Búsqueda profunda | https://deepsearch.jina.ai/v1/chat/completions | Razonar, buscar e iterar para encontrar la mejor respuesta. | 1 RPM | 10 RPM | 100 RPM | 56.7s | Cuente el número total de tokens en todo el proceso. | POST | |
API de incrustación | https://api.jina.ai/v1/embeddings | Convertir texto/imágenes en vectores de longitud fija | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart depende del tamaño de entrada help | Cuente la cantidad de tokens en la solicitud de entrada. | POST | |
API de reclasificación | https://api.jina.ai/v1/rerank | Clasificar documentos por consulta | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart depende del tamaño de entrada help | Cuente la cantidad de tokens en la solicitud de entrada. | POST | |
API de clasificador | https://api.jina.ai/v1/train | Entrenar un clasificador usando ejemplos etiquetados | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens × num_iters | POST | |
API de clasificador (Disparo cero) | https://api.jina.ai/v1/classify | Clasificar las entradas utilizando la clasificación de disparo cero | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens + label_tokens | POST | |
API de clasificador (Pocos disparos) | https://api.jina.ai/v1/classify | Clasifique las entradas utilizando un clasificador de pocos disparos entrenado | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens | POST | |
API de segmentación | https://api.jina.ai/v1/segment | Tokenizar y segmentar textos largos | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | El token no se cuenta como uso. | GET/POST |
¡No entrar en pánico! ¡Cada nueva clave API contiene un millón de tokens gratis!
Precios de API
El precio de la API se basa en el uso de tokens. Una clave API le otorga acceso a todos los productos de Search Foundation.
¿Cuáles son los costos asociados con el uso de Reader API?
keyboard_arrow_down
¿Cómo funciona la API Reader?
keyboard_arrow_down
¿La API Reader es de código abierto?
keyboard_arrow_down
¿Cuál es la latencia típica de la API Reader?
keyboard_arrow_down
¿Por qué debería utilizar Reader API en lugar de raspar la página yo mismo?
keyboard_arrow_down
¿La API Reader admite varios idiomas?
keyboard_arrow_down
¿Qué debo hacer si un sitio web bloquea la API de Reader?
keyboard_arrow_down
¿Puede la API Reader extraer contenido de archivos PDF?
keyboard_arrow_down
¿Puede la API Reader procesar contenido multimedia de páginas web?
keyboard_arrow_down
¿Es posible utilizar la API de Reader en archivos HTML locales?
keyboard_arrow_down
¿Reader API almacena en caché el contenido?
keyboard_arrow_down
¿Puedo usar Reader API para acceder al contenido tras un inicio de sesión?
keyboard_arrow_down
¿Puedo utilizar la API de Reader para acceder a PDF en arXiv?
keyboard_arrow_down
¿Cómo funciona el título de imagen en Reader?
keyboard_arrow_down
¿Cuál es la escalabilidad del Reader? ¿Puedo usarlo en producción?
keyboard_arrow_down
¿Cuál es el límite de velocidad de la API Reader?
keyboard_arrow_down
¿Qué es Reader-LM? ¿Cómo puedo utilizarlo?
keyboard_arrow_down
Límite de velocidad
Columnas
arrow_drop_down
Producto | Punto final de API | Descripciónarrow_upward | Sin clave APIkey_off | con clave APIkey | con clave API Premiumkey | Latencia media | Recuento de uso de tokens | Solicitud Permitida | |
---|---|---|---|---|---|---|---|---|---|
API de lector | https://r.jina.ai | Convertir URL a texto compatible con LLM | 20 RPM | 200 RPM | trending_up2000 RPM | 4.6s | Cuente la cantidad de tokens en la respuesta de salida. | GET/POST | |
API de lector | https://s.jina.ai | Busque en la web y convierta los resultados en texto compatible con LLM | block | 40 RPM | trending_up400 RPM | 5.7s | Cada solicitud cuesta una cantidad fija de tokens, a partir de 10000 tokens | GET/POST | |
Búsqueda profunda | https://deepsearch.jina.ai/v1/chat/completions | Razonar, buscar e iterar para encontrar la mejor respuesta. | 1 RPM | 10 RPM | 100 RPM | 56.7s | Cuente el número total de tokens en todo el proceso. | POST | |
API de incrustación | https://api.jina.ai/v1/embeddings | Convertir texto/imágenes en vectores de longitud fija | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart depende del tamaño de entrada help | Cuente la cantidad de tokens en la solicitud de entrada. | POST | |
API de reclasificación | https://api.jina.ai/v1/rerank | Clasificar documentos por consulta | block | 500 RPM & 1,000,000 TPM | trending_up2,000 RPM & 5,000,000 TPM | ssid_chart depende del tamaño de entrada help | Cuente la cantidad de tokens en la solicitud de entrada. | POST | |
API de clasificador | https://api.jina.ai/v1/train | Entrenar un clasificador usando ejemplos etiquetados | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens × num_iters | POST | |
API de clasificador (Disparo cero) | https://api.jina.ai/v1/classify | Clasificar las entradas utilizando la clasificación de disparo cero | block | 200 RPM & 500,000 TPM | 1,000 RPM & 3,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens + label_tokens | POST | |
API de clasificador (Pocos disparos) | https://api.jina.ai/v1/classify | Clasifique las entradas utilizando un clasificador de pocos disparos entrenado | block | 20 RPM & 200,000 TPM | 60 RPM & 1,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens | POST | |
API de segmentación | https://api.jina.ai/v1/segment | Tokenizar y segmentar textos largos | 20 RPM | 200 RPM | 1,000 RPM | 0.3s | El token no se cuenta como uso. | GET/POST |
Preguntas comunes relacionadas con API
code
¿Puedo usar la misma clave API para las API de lectura, inserción, reclasificación, clasificación y ajuste?
keyboard_arrow_down
code
¿Puedo monitorear el uso del token de mi clave API?
keyboard_arrow_down
code
¿Qué debo hacer si olvido mi clave API?
keyboard_arrow_down
code
¿Caducan las claves API?
keyboard_arrow_down
code
¿Puedo transferir tokens entre claves API?
keyboard_arrow_down
code
¿Puedo revocar mi clave API?
keyboard_arrow_down
code
¿Por qué la primera solicitud de algunos modelos es lenta?
keyboard_arrow_down
code
¿Se utilizan los datos de entrada del usuario para entrenar sus modelos?
keyboard_arrow_down
Preguntas comunes relacionadas con la facturación
attach_money
¿La facturación se basa en el número de sentencias o solicitudes?
keyboard_arrow_down
attach_money
¿Hay una prueba gratuita disponible para nuevos usuarios?
keyboard_arrow_down
attach_money
¿Se cobran tokens por solicitudes fallidas?
keyboard_arrow_down
attach_money
¿Qué métodos de pago se aceptan?
keyboard_arrow_down
attach_money
¿Está disponible la facturación para compras de tokens?
keyboard_arrow_down