Noticias
Modelos
Productos
keyboard_arrow_down
Lector
Lea las URL y busque en la web para obtener una base más sólida para su LLM.
Incrustaciones
Integraciones multilingües y multimodales de clase mundial.
reclasificador
Recuperador neuronal de clase mundial para maximizar la relevancia de la búsqueda.
Búsqueda profunda
Busca, lee y razona hasta encontrar la mejor respuesta.
Más
keyboard_arrow_down
Clasificador
Clasificación de cero disparos y pocos disparos para imágenes y texto.
Segmentador
Corta el texto largo en fragmentos y haz tokenización.

Documentación de la API
Generación automática de código para su IDE o LLM de Copilot
open_in_new


Compañía
keyboard_arrow_down
Sobre nosotros
Contactar con ventas
Programa de prácticas
Únete a nosotros
open_in_new
Descargar logotipo
open_in_new
Términos y condiciones


Acceso
login
El Problema de Factualidad de los LLMs
Cómo Jina Reader Ayuda a Mejorar el Anclaje
Jina Reader como una Solución Integral de Anclaje
Límites de Tasa Más Altos con API Keys
Conclusión
star
Presentado
presione soltar
mayo 14, 2024

Jina Reader para el anclaje de búsqueda y mejorar la factibilidad de los LLM

El grounding es esencial para las aplicaciones de GenAI. Nuestro nuevo https://s.jina.ai/ permite a los LLMs acceder al conocimiento más reciente de la web, habilitando el grounding mediante búsqueda y haciendo las respuestas más confiables.
Flowchart detailing Jina AI's info search using LLM, starting with "when was Jina AI founded?" and various process steps.
Jina AI
Jina AI • 5 minutos de lectura

El anclaje es absolutamente esencial para las aplicaciones de GenAI.

Probablemente has visto muchas herramientas, prompts y pipelines RAG diseñados para mejorar la factualidad de los LLMs desde 2023. ¿Por qué? Porque la principal barrera que impide que las empresas implementen LLMs para millones de usuarios es la confianza: ¿Es la respuesta genuina o es una mera alucinación del modelo? Este es un problema de toda la industria, y Jina AI ha estado trabajando muy duro para resolverlo. Hoy, con la nueva función de anclaje de búsqueda de Jina Reader, puedes simplemente usar https://s.jina.ai/YOUR_SEARCH_QUERY para buscar el conocimiento más reciente del mundo desde la web. Con esto, estás un paso más cerca de mejorar la factualidad de los LLMs, haciendo sus respuestas más confiables y útiles.

Reader API
Lee URLs o busca en la web, obtén mejor anclaje para LLMs.

API, demo disponible en la página del producto

tagEl Problema de Factualidad de los LLMs

Todos sabemos que los LLMs pueden inventar cosas y dañar la confianza del usuario. Los LLMs pueden decir cosas que no son fácticas (es decir, alucinar), especialmente en temas sobre los que no aprendieron durante el entrenamiento. Esto podría ser información nueva creada desde el entrenamiento o conocimiento específico que ha sido "marginalizado" durante el entrenamiento.

Como resultado, cuando se trata de preguntas como "¿Qué tiempo hace hoy?" o "¿Quién ganó el Oscar a la Mejor Actriz este año?", el modelo responderá "No lo sé" o te dará información desactualizada.

Interactive web interface for querying Jina AI's founding details with input fields, navigation options, and informational no
Un ejemplo de conocimiento específico siendo "marginalizado" durante el entrenamiento puede verse cuando le preguntamos a GPT-3.5-turbo "¿Cuándo se fundó Jina AI?" y recibimos una respuesta incorrecta. Sin embargo, al usar Reader para el anclaje de búsqueda, el mismo LLM pudo proporcionar la respuesta correcta. De hecho, fue preciso hasta la fecha exacta.
Screen interface for inquiring about SpaceX launches with a query field and details about upcoming missions.
Un ejemplo de nueva información creada desde el entrenamiento. Le preguntamos a GPT-3.5-turbo "¿Cuándo será el próximo lanzamiento de SpaceX?" (hoy es 14 de mayo de 2024) y el modelo respondió con información antigua de 2021.

tagCómo Jina Reader Ayuda a Mejorar el Anclaje

Anteriormente, los usuarios podían fácilmente anteponer https://r.jina.ai para leer contenido de texto e imagen de una URL particular en un formato compatible con LLM y usarlo para verificación de anclaje y verificación de hechos. Desde su primer lanzamiento el 15 de abril, hemos atendido más de 18 millones de solicitudes de todo el mundo, lo que sugiere su popularidad.

Hoy nos complace avanzar aún más presentando la API de anclaje de búsqueda https://s.jina.ai. Simplemente anteponiendo esto a tu consulta, Reader buscará en la web y recuperará los 5 mejores resultados. Cada resultado incluye un título, markdown compatible con LLM (¡contenido completo! no resumen), y una URL que permite atribuir la fuente. Aquí hay un ejemplo a continuación, también te animamos a probar nuestra demo en vivo aquí.

Izquierda: Modo Markdown (visita directamente https://s.jina.ai/who+is+han+xiao); Derecha modo JSON (usando curl https://s.jina.ai/who+is+han+xiao -H 'accept: application/json'). Por cierto, una pregunta del ego como esta siempre sirve como un buen caso de prueba.

Hay tres principios cuando diseñamos el anclaje de búsqueda en Reader:

  • Mejorar la factualidad;
  • Acceder a información actualizada, es decir, conocimiento del mundo;
  • Conectar una respuesta con su fuente.

Además de ser extremadamente fácil de usar, s.jina.ai también es altamente escalable y personalizable ya que aprovecha la infraestructura flexible y escalable existente de r.jina.ai. Puedes establecer parámetros para controlar el pie de foto de las imágenes, la granularidad del filtro, etc., a través de los encabezados de la solicitud.

Configuration screen of Reader API with options for API behavior, proxy settings, and cookie forwarding against a dark backgr
Prueba el fragmento de código interactivo para el uso avanzado de la API Reader

tagJina Reader como una Solución Integral de Anclaje

Technical flowchart on a black background illustrating the processing of knowledge through various AI-related URLs.

Si combinamos el anclaje de búsqueda (s.jina.ai) y el anclaje de verificación (r.jina.ai), podemos construir una solución de anclaje muy completa para LLMs, agentes y sistemas RAG. En un flujo de trabajo RAG confiable típico, Jina Reader funciona de la siguiente manera:

  1. El usuario introduce una pregunta;
  2. Recupera la información más reciente de la web usando s.jina.ai;
  3. Genera una respuesta inicial con una cita al resultado de búsqueda del último paso;
  4. Usar.jina.ai para fundamentar la respuesta con su propia URL; o leer las URLs incluidas de la fuente devuelta desde el paso 3 para obtener una fundamentación más profunda;
  5. Generación de la respuesta final y resaltado de afirmaciones potencialmente sin fundamento para el usuario.

tagLímites de Tasa Más Altos con API Keys

Los usuarios pueden disfrutar del nuevo endpoint de búsqueda fundamentada de forma gratuita sin autorización. Además, al proporcionar una API key de Jina AI en el encabezado de la solicitud (la misma clave puede usarse en la API de Embedding/Reranking), puedes disfrutar inmediatamente de 200 solicitudes por minuto por IP para r.jina.ai y 40 solicitudes por minuto por IP para s.jina.ai. Los detalles se pueden encontrar en la tabla a continuación:

EndpointDescripciónLímite de tasa sin API keyLímite de tasa con API keyEsquema de conteo de tokensLatencia promedio
r.jina.aiLee una URL y devuelve su contenido, útil para verificar fundamentación20 RPM200 RPMBasado en los tokens de salida3 segundos
s.jina.aiBúsqueda en la web devuelve los 5 mejores resultados, útil para fundamentación de búsqueda5 RPM40 RPMBasado en los tokens de salida para los 5 resultados de búsqueda30 segundos

tagConclusión

Creemos que la fundamentación es esencial para las aplicaciones GenAI, y construir soluciones fundamentadas debería ser fácil para todos. Por eso introdujimos el nuevo endpoint de búsqueda fundamentada, s.jina.ai, que permite a los desarrolladores incorporar fácilmente el conocimiento del mundo en sus aplicaciones GenAI. Queremos que los desarrolladores establezcan la confianza del usuario, proporcionen respuestas explicables e inspiren curiosidad en millones de usuarios.

Categorías:
star
Presentado
presione soltar
rss_feed
Oficinas
location_on
Sunnyvale, California
710 Lakeway Dr, Ste 200, Sunnyvale, CA 94085, EE. UU.
location_on
Berlín, Alemania (sede central)
Prinzessinnenstraße 19-20, 10969 Berlín, Alemania
location_on
Beijing, China
Piso 5, Edificio 6, No.48 Haidian West St. Pekín, China
location_on
Shenzhen, China
Piso 402, Edificio de Tecnología Fu'an, Shenzhen, China
Fundación de búsqueda
Lector
Incrustaciones
reclasificador
Búsqueda profunda
Clasificador
Segmentador
Documentación API
Obtener la clave API de Jina
Límite de velocidad
Estado de la API
Compañía
Sobre nosotros
Contactar con ventas
Sala de prensa
Programa de prácticas
Únete a nosotros
open_in_new
Descargar logotipo
open_in_new
Términos
Seguridad
Términos y condiciones
Privacidad
Administrar cookies
email
Jina AI © 2020-2025.