Lector
Convierte una URL en una entrada compatible con LLM, simplemente agregando
r.jina.ai al frente.API de lector
Convierte una URL en una entrada compatible con LLM, simplemente agregando
r.jina.ai al frente.chevron_leftchevron_right
globe_book
Utilice
r.jina.ai para leer una URL y obtener su contenidotravel_explore
Utilice
s.jina.ai para buscar en la web y obtener SERPAgregue
mcp.jina.ai como su servidor MCP para acceder a nuestra API en LLMFormato del contenido
Puede controlar el nivel de detalle de la respuesta para evitar el filtrado excesivo. La canalización predeterminada está optimizada para la mayoría de los sitios web y las entradas de LLM.
Por defecto
arrow_drop_down
Respuesta JSON
La respuesta estará en formato JSON y contendrá la URL, el título, el contenido y la marca de tiempo (si está disponible). En el modo de búsqueda, devuelve una lista de cinco entradas, cada una de las cuales sigue la estructura JSON descrita.
Tiempo de espera (segundos)
Tiempo máximo de espera para la carga de la página. Aumentar para páginas lentas, reducir para páginas estáticas simples.
Presupuesto de tokens
Limita la cantidad máxima de tokens que se pueden usar para esta solicitud. Si se excede este límite, la solicitud fallará.
Utilice ReaderLM-v2
Experimental
Utiliza ReaderLM-v2 para la conversión de HTML a Markdown y ofrece resultados de alta calidad para sitios web con estructuras y contenidos complejos. ¡Cuesta el triple de tokens!open_in_newAprende más
Solo extraer (selector CSS)
Extraer solo el contenido que coincida con estos selectores CSS. Ejemplo: article, .main-content, #post-body
Esperar (Selector CSS)
Espere a que aparezcan estos elementos antes de extraer el contenido. Útil para contenido cargado dinámicamente.
Excluir (Selector CSS)
Elimine estos elementos antes de la extracción. Ejemplo: nav, footer, .sidebar, #ads
Eliminar todas las imágenes
Elimina todas las imágenes de la salida. Reduce el uso de tokens cuando no se necesitan imágenes.
Formato de cita de OpenAI
Formato de enlaces para la herramienta de navegación web de OpenAI. Utiliza marcadores de cita especiales compatibles con los modelos GPT.open_in_newAprende más
Sección de resumen de enlaces
Al final se creará una sección de "Botones y enlaces". Esto ayuda a los LLM posteriores o agentes web a navegar por la página o realizar más acciones.
Ninguno
arrow_drop_down
Sección de resumen de imágenes
Se creará una sección de "Imágenes" al final. Esto brinda a los LLM posteriores una descripción general de todos los elementos visuales de la página, lo que puede mejorar el razonamiento.
Ninguno
arrow_drop_down
Tamaño de la ventana gráfica del navegador
POST
Configura las dimensiones de la ventana del navegador. Afecta los diseños adaptables y la visibilidad del contenido.open_in_newAprende más
Cookie de reenvío
Nuestro servidor API puede reenviar su configuración de cookies personalizada al acceder a la URL, lo cual es útil para páginas que requieren autenticación adicional. Tenga en cuenta que las solicitudes con cookies no se almacenarán en caché.open_in_newAprende más
Captura de imagen
Subtitula todas las imágenes en la URL especificada, agregando 'Imagen [idx]: [caption]' como etiqueta alternativa para aquellas que no tienen una. Esto permite que los LLM posteriores interactúen con las imágenes en actividades como razonar y resumir.
Utilice un servidor proxy
Nuestro servidor API puede utilizar su proxy para acceder a las URL, lo cual resulta útil para páginas a las que solo se puede acceder a través de servidores proxy específicos.open_in_newAprende más
Utilice un servidor proxy específico del país
Establezca el código de país para el servidor proxy basado en la ubicación. Utilice "automático" para una selección óptima o "ninguno" para deshabilitarlo.
Omitir caché
Nuestro servidor API almacena en caché los contenidos del modo Lectura y Búsqueda durante un cierto período de tiempo. Para omitir este caché, establezca este encabezado en verdadero.
Tolerancia de caché (segundos)
Acepta contenido en caché si es menor a N segundos. Establézcalo en 0 para contenido nuevo (igual que Omitir caché) o en valores más altos para permitir respuestas más rápidas desde la caché.
Tiempo de preparación de la página
Cuándo considerar que una página está completamente cargada. Los tiempos de carga más largos requieren más tiempo, pero capturan contenido más dinámico.
Por defecto
arrow_drop_down
Agente de usuario personalizado
Anular la cadena de agente de usuario del navegador. Útil para acceder a sitios que requieren navegadores específicos o bloquean rastreadores.
Referencia personalizada
Establezca el encabezado HTTP Referer. Algunos sitios lo comprueban para verificar que el tráfico provenga de las fuentes esperadas.
Conservar imágenes Base64
Mantenga las imágenes codificadas en base64 en línea en la salida Markdown en lugar de convertirlas en URL externas.
No almacenar en caché ni rastrear
Evitar que esta solicitud se almacene en caché o se registre en nuestros servidores. Usar para URL sensibles.
Markdown con sabor a Github
Funciones de inclusión/exclusión voluntaria de GFM (Github Flavored Markdown).
Activado
arrow_drop_down
Modo de transmisión
El modo de transmisión es beneficioso para páginas de destino grandes, ya que permite más tiempo para que la página se represente por completo. Si el modo estándar genera contenido incompleto, considere usar el modo Stream.open_in_newAprende más
Personalizar la configuración regional del navegador
Controla la configuración regional del navegador para mostrar la página. Muchos sitios web ofrecen contenido diferente según la configuración regional.open_in_newAprende más
Respetar robots.txt
Revisa las reglas de robots.txt antes de obtener el archivo. Especifica el nombre del bot que se usará para la revisión.
Incluir contenido iframe
Extraer contenido de iframes incrustados. Habilitar para páginas con contenido cargado en iframes.
Incluir Shadow DOM
Extraer contenido de componentes Shadow DOM. Habilitar para páginas que usan componentes web.
Utilice la URL final como base
Resuelva las URL relativas utilizando la URL de destino final después de las redirecciones, en lugar de la URL original.
Archivo PDF/HTML local
POST
Utilice Reader en sus archivos PDF y HTML locales cargándolos. Solo se admiten archivos PDF y HTML.
upload
Ejecutar JavaScript antes de la extracción
POST
Ejecuta código JavaScript personalizado para modificar la página antes de extraer el contenido. Puede ser código en línea o una URL a un archivo de script.open_in_newAprende más
Estilo de encabezado
Establece el formato del encabezado de Markdown (pasado a Turndown).
Estilo hash
arrow_drop_down
Estilo de regla horizontal
Define el formato de la regla horizontal de Markdown (pasado a Turndown).
Estilo de viñetas
Establece el carácter marcador de la lista de viñetas (se pasa a Turndown).
*
arrow_drop_down
Estilo de énfasis
Define el delimitador de énfasis de Markdown (pasado a Turndown).
_
arrow_drop_down
Estilo de énfasis fuerte
Establece un delimitador de énfasis fuerte de Markdown (se pasa a Turndown).
**
arrow_drop_down
Estilo de enlace
Determina el formato del enlace de Markdown (se pasa a Turndown).
En línea
arrow_drop_down
Cumplimiento de la UE
Experimental
Todas las operaciones de infraestructura y procesamiento de datos residen íntegramente dentro de la jurisdicción de la UE.
upload
Pedido
GET
Bash
Idioma
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
Clave API
visibility_off
Fichas disponibles
0
Jina VLM: Modelo de lenguaje de visión multilingüe pequeño
Un modelo de visión-lenguaje de parámetros 2.4B que logra respuestas visuales a preguntas multilingües de última generación entre VLM abiertos de escala 2B.
ReaderLM v2: un pequeño modelo de lenguaje para convertir HTML a Markdown y JSON
ReaderLM-v2 es un modelo de lenguaje de parámetros 1500 millones especializado en la conversión de HTML a Markdown y la extracción de HTML a JSON. Admite documentos de hasta 512 000 tokens en 29 idiomas y ofrece un 20 % más de precisión en comparación con su predecesor.
Introducir información web en los LLM es un paso importante para la puesta a tierra, pero puede ser un desafío. El método más simple es raspar la página web y alimentar el HTML sin formato. Sin embargo, el scraping puede ser complejo y a menudo bloqueado, y el HTML sin formato está lleno de elementos extraños como marcas y scripts. Reader API aborda estos problemas extrayendo el contenido principal de una URL y convirtiéndolo en texto limpio y compatible con LLM, lo que garantiza una entrada de alta calidad para su agente y sus sistemas RAG.
Introduce tu URL
URL del lector
HTML sin formato
Salida del lector
Haz una pregunta
Reader se puede utilizar como API SERP. Le permite alimentar su LLM con el contenido detrás de la página del motor de resultados de búsqueda. Simplemente anteponga
https://s.jina.ai/?q= a su consulta y Reader buscará en la web y devolverá los cinco primeros resultados con sus URL y contenidos, cada uno en un texto limpio y compatible con LLM. De esta manera, puede mantener siempre actualizado su LLM, mejorar su veracidad y reducir las alucinaciones.Ingresa tu consulta
URL del lector
info Tenga en cuenta que, a diferencia de la demostración que se muestra arriba, en la práctica no busca la pregunta original en la web para fundamentarse. Lo que la gente suele hacer es reescribir la pregunta original o utilizar preguntas de múltiples saltos. Leen los resultados recuperados y luego generan consultas adicionales para recopilar más información según sea necesario antes de llegar a una respuesta final.
Las imágenes de la página web se subtitulan automáticamente utilizando un modelo de lenguaje de visión en el lector y se formatean como etiquetas alternativas de imagen en la salida. Esto le brinda a su LLM posterior suficientes sugerencias para incorporar esas imágenes en sus procesos de razonamiento y resumen. Esto significa que puede hacer preguntas sobre las imágenes, seleccionar imágenes específicas o incluso reenviar sus URL a un VLM más potente para un análisis más profundo.
Sí, Reader admite de forma nativa la lectura de PDF. Es compatible con la mayoría de los archivos PDF, incluidos aquellos con muchas imágenes, ¡y es ultrarrápido! Combinado con un LLM, puede crear fácilmente un ChatPDF o una IA de análisis de documentos en poco tiempo.
¿La mejor parte? ¡Es gratis!
Reader API está disponible de forma gratuita y ofrece límites de tarifas y precios flexibles. Construido sobre una infraestructura escalable, ofrece alta accesibilidad, simultaneidad y confiabilidad. Nos esforzamos por ser su solución de conexión a tierra preferida para sus LLM.
Límite de velocidad
Los límites de velocidad se controlan de tres maneras: RPM (solicitudes por minuto) y TPM (tokens por minuto). Los límites se aplican por IP/clave API y se activan cuando se alcanza primero el umbral de RPM o TPM. Al proporcionar una clave API en el encabezado de la solicitud, controlamos los límites de velocidad por clave, no por dirección IP.
Columnas
arrow_drop_down
| Producto | Punto final de API | Descripciónarrow_upward | Sin clave APIkey_off | con clave API gratuitakey | con clave API de pagokey | con clave API Premiumkey | Latencia media | Recuento de uso de tokens | Solicitud Permitida | |
|---|---|---|---|---|---|---|---|---|---|---|
| API de lector | https://r.jina.ai | Convertir URL a texto compatible con LLM | 20 RPM | 500 RPM | 500 RPM | trending_up5000 RPM | 7.9s | Cuente la cantidad de tokens en la respuesta de salida. | GET/POST | |
| API de lector | https://s.jina.ai | Busque en la web y convierta los resultados en texto compatible con LLM | block | 100 RPM | 100 RPM | trending_up1000 RPM | 2.5s | Cada solicitud cuesta una cantidad fija de tokens, a partir de 10000 tokens | GET/POST | |
| API de incrustación | https://api.jina.ai/v1/embeddings | Convertir texto/imágenes en vectores de longitud fija | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart depende del tamaño de entrada help | Cuente la cantidad de tokens en la solicitud de entrada. | POST | |
| API de reclasificación | https://api.jina.ai/v1/rerank | Clasificar documentos por consulta | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart depende del tamaño de entrada help | Cuente la cantidad de tokens en la solicitud de entrada. | POST | |
| API de clasificador | https://api.jina.ai/v1/train | Entrenar un clasificador usando ejemplos etiquetados | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens × num_iters | POST | |
| API de clasificador (Disparo cero) | https://api.jina.ai/v1/classify | Clasificar las entradas utilizando la clasificación de disparo cero | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens + label_tokens | POST | |
| API de clasificador (Pocos disparos) | https://api.jina.ai/v1/classify | Clasifique las entradas utilizando un clasificador de pocos disparos entrenado | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens | POST | |
| API de segmentación | https://api.jina.ai/v1/segment | Tokenizar y segmentar textos largos | 20 RPM | 200 RPM | 200 RPM | 1,000 RPM | 0.3s | El token no se cuenta como uso. | GET/POST | |
| Búsqueda profunda | https://deepsearch.jina.ai/v1/chat/completions | Razonar, buscar e iterar para encontrar la mejor respuesta. | block | 50 RPM | 50 RPM | 500 RPM | 56.7s | Cuente el número total de tokens en todo el proceso. | POST |
¡Que no cunda el pánico! ¡Cada nueva clave API contiene diez millones de tokens gratis!
Precios de API
El precio de la API se basa en el uso de tokens. Una clave API le otorga acceso a todos los productos de Search Foundation.
¿Cuáles son los costos asociados con el uso de Reader API?
keyboard_arrow_down
¿Cómo funciona la API Reader?
keyboard_arrow_down
¿La API Reader es de código abierto?
keyboard_arrow_down
¿Cuál es la latencia típica de la API Reader?
keyboard_arrow_down
¿Por qué debería utilizar Reader API en lugar de raspar la página yo mismo?
keyboard_arrow_down
¿La API Reader admite varios idiomas?
keyboard_arrow_down
¿Qué debo hacer si un sitio web bloquea la API de Reader?
keyboard_arrow_down
¿Puede la API Reader extraer contenido de archivos PDF?
keyboard_arrow_down
¿Puede la API Reader procesar contenido multimedia de páginas web?
keyboard_arrow_down
¿Es posible utilizar la API de Reader en archivos HTML locales?
keyboard_arrow_down
¿Reader API almacena en caché el contenido?
keyboard_arrow_down
¿Puedo usar Reader API para acceder al contenido tras un inicio de sesión?
keyboard_arrow_down
¿Puedo utilizar la API de Reader para acceder a PDF en arXiv?
keyboard_arrow_down
¿Cómo funciona el título de imagen en Reader?
keyboard_arrow_down
¿Cuál es la escalabilidad del Reader? ¿Puedo usarlo en producción?
keyboard_arrow_down
¿Cuál es el límite de velocidad de la API Reader?
keyboard_arrow_down
¿Qué es Reader-LM? ¿Cómo puedo utilizarlo?
keyboard_arrow_down
¿Cómo extraigo datos estructurados de páginas web?
keyboard_arrow_down
¿Reader elude activamente la protección anti-bots del sitio web?
keyboard_arrow_down
¿Actualizar de una clave API gratuita a una paga me dará acceso a más sitios web?
keyboard_arrow_down
Límite de velocidad
Los límites de velocidad se controlan de tres maneras: RPM (solicitudes por minuto) y TPM (tokens por minuto). Los límites se aplican por IP/clave API y se activan cuando se alcanza primero el umbral de RPM o TPM. Al proporcionar una clave API en el encabezado de la solicitud, controlamos los límites de velocidad por clave, no por dirección IP.
Columnas
arrow_drop_down
| Producto | Punto final de API | Descripciónarrow_upward | Sin clave APIkey_off | con clave API gratuitakey | con clave API de pagokey | con clave API Premiumkey | Latencia media | Recuento de uso de tokens | Solicitud Permitida | |
|---|---|---|---|---|---|---|---|---|---|---|
| API de lector | https://r.jina.ai | Convertir URL a texto compatible con LLM | 20 RPM | 500 RPM | 500 RPM | trending_up5000 RPM | 7.9s | Cuente la cantidad de tokens en la respuesta de salida. | GET/POST | |
| API de lector | https://s.jina.ai | Busque en la web y convierta los resultados en texto compatible con LLM | block | 100 RPM | 100 RPM | trending_up1000 RPM | 2.5s | Cada solicitud cuesta una cantidad fija de tokens, a partir de 10000 tokens | GET/POST | |
| API de incrustación | https://api.jina.ai/v1/embeddings | Convertir texto/imágenes en vectores de longitud fija | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart depende del tamaño de entrada help | Cuente la cantidad de tokens en la solicitud de entrada. | POST | |
| API de reclasificación | https://api.jina.ai/v1/rerank | Clasificar documentos por consulta | block | 100 RPM & 100,000 TPM | 500 RPM & 2,000,000 TPM | trending_up5,000 RPM & 50,000,000 TPM | ssid_chart depende del tamaño de entrada help | Cuente la cantidad de tokens en la solicitud de entrada. | POST | |
| API de clasificador | https://api.jina.ai/v1/train | Entrenar un clasificador usando ejemplos etiquetados | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens × num_iters | POST | |
| API de clasificador (Disparo cero) | https://api.jina.ai/v1/classify | Clasificar las entradas utilizando la clasificación de disparo cero | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens + label_tokens | POST | |
| API de clasificador (Pocos disparos) | https://api.jina.ai/v1/classify | Clasifique las entradas utilizando un clasificador de pocos disparos entrenado | block | 25 RPM & 25,000 TPM | 125 RPM & 500,000 TPM | 1,250 RPM & 12,000,000 TPM | ssid_chart depende del tamaño de entrada | Los tokens se cuentan como: input_tokens | POST | |
| API de segmentación | https://api.jina.ai/v1/segment | Tokenizar y segmentar textos largos | 20 RPM | 200 RPM | 200 RPM | 1,000 RPM | 0.3s | El token no se cuenta como uso. | GET/POST | |
| Búsqueda profunda | https://deepsearch.jina.ai/v1/chat/completions | Razonar, buscar e iterar para encontrar la mejor respuesta. | block | 50 RPM | 50 RPM | 500 RPM | 56.7s | Cuente el número total de tokens en todo el proceso. | POST |
Preguntas comunes relacionadas con API
code
¿Puedo usar la misma clave API para las API de lectura, inserción, reclasificación, clasificación y ajuste?
keyboard_arrow_down
code
¿Puedo monitorear el uso del token de mi clave API?
keyboard_arrow_down
code
¿Qué debo hacer si olvido mi clave API?
keyboard_arrow_down
code
¿Caducan las claves API?
keyboard_arrow_down
code
¿Puedo transferir tokens entre claves API?
keyboard_arrow_down
code
¿Puedo revocar mi clave API?
keyboard_arrow_down
code
¿Por qué la primera solicitud de algunos modelos es lenta?
keyboard_arrow_down
code
¿Se utilizan mis datos de API para entrenar sus modelos?
keyboard_arrow_down
code
¿Cuáles son los límites de velocidad para las API de Jina?
keyboard_arrow_down
code
¿Existen límites de tamaño de lote para las API?
keyboard_arrow_down
Preguntas comunes relacionadas con la facturación
attach_money
¿La facturación se basa en el número de sentencias o solicitudes?
keyboard_arrow_down
attach_money
¿Hay una prueba gratuita disponible para nuevos usuarios?
keyboard_arrow_down
attach_money
¿Se cobran tokens por solicitudes fallidas?
keyboard_arrow_down
attach_money
¿Qué métodos de pago se aceptan?
keyboard_arrow_down
attach_money
¿Está disponible la facturación para compras de tokens?
keyboard_arrow_down


