Noticias
Modelos
Productos
keyboard_arrow_down
Lector
Lea las URL y busque en la web para obtener una base más sólida para su LLM.
Incrustaciones
Integraciones multilingües y multimodales de clase mundial.
reclasificador
Recuperador neuronal de clase mundial para maximizar la relevancia de la búsqueda.
Búsqueda profunda
Busca, lee y razona hasta encontrar la mejor respuesta.
Más
keyboard_arrow_down
Clasificador
Clasificación de cero disparos y pocos disparos para imágenes y texto.
Segmentador
Corta el texto largo en fragmentos y haz tokenización.

Documentación de la API
Generación automática de código para su IDE o LLM de Copilot
open_in_new


Compañía
keyboard_arrow_down
Sobre nosotros
Contactar con ventas
Programa de prácticas
Únete a nosotros
open_in_new
Descargar logotipo
open_in_new
Términos y condiciones


Acceso
login
warning
Este modelo está obsoleto por los modelos más nuevos.

jina-reranker-v1-tiny-en

El modelo de reordenación más rápido, más adecuado para clasificar una gran cantidad de documentos de manera confiable
Publicación de lanzamientoarrow_forward
Licencia
license
Apache-2.0
Fecha de lanzamiento
calendar_month
2024-04-18
Aporte
abc
Texto (Consulta)
abc
Texto (Documento)
arrow_forward
Producción
format_list_numbered
Clasificaciones
Detalles del modelo
Parámetros: 33M
Longitud del token de entrada: 8K
Soporte de idioma
🇺🇸 Inglés
Modelos relacionados
link
jina-reranker-v1-base-en
link
jina-reranker-v1-turbo-en
Etiquetas
reranker
english
long-context
memory-efficient
high-throughput
edge-optimized
bert-based
production-ready
lightweight
fast-inference
Disponible a través de
API de JinaAWS SageMakerMicrosoft AzureCara abrazada
Elige modelos para comparar

Descripción general

Jina Reranker v1 Tiny English representa un gran avance en el refinamiento de búsquedas eficiente, diseñado específicamente para organizaciones que requieren un reranking de alto rendimiento en entornos con recursos limitados. Este modelo aborda el desafío crítico de mantener la calidad de la búsqueda al mismo tiempo que reduce significativamente la sobrecarga computacional y los costos de implementación. Con solo 33 millones de parámetros (una fracción de los tamaños típicos de reranker), ofrece un rendimiento notablemente competitivo a través de técnicas innovadoras de destilación de conocimiento. La característica más sorprendente del modelo es su capacidad de procesar documentos casi cinco veces más rápido que los modelos básicos, al tiempo que mantiene más del 92 % de su precisión, lo que hace que el refinamiento de búsqueda de nivel empresarial sea accesible para aplicaciones donde los recursos computacionales son limitados.

Métodos

El modelo emplea una arquitectura optimizada de cuatro capas basada en JinaBERT con ALiBi (Atención con sesgos lineales) bidireccional simétrico, lo que permite un procesamiento eficiente de secuencias largas. Su desarrollo aprovecha un enfoque avanzado de destilación de conocimientos en el que un modelo docente más grande y de alto rendimiento (jina-reranker-v1-base-en) guía el proceso de entrenamiento, lo que permite que el modelo más pequeño aprenda comportamientos de clasificación óptimos sin requerir datos de entrenamiento extensos del mundo real. Esta innovadora metodología de entrenamiento, combinada con optimizaciones arquitectónicas como capas ocultas reducidas y mecanismos de atención eficientes, permite que el modelo mantenga clasificaciones de alta calidad al tiempo que reduce significativamente los requisitos computacionales. El resultado es un modelo que logra una eficiencia notable sin comprometer su capacidad para comprender relaciones complejas entre documentos.

Actuación

En evaluaciones comparativas exhaustivas, el modelo demuestra capacidades excepcionales que desafían el equilibrio convencional entre tamaño y rendimiento. En la prueba comparativa BEIR, logra una puntuación NDCG-10 de 48,54, lo que le permite conservar el 92,5 % del rendimiento del modelo base a pesar de tener solo una cuarta parte de su tamaño. Aún más impresionante es que, en las pruebas comparativas RAG de LlamaIndex, mantiene una tasa de aciertos del 83,16 %, casi igualando a los modelos más grandes y procesando documentos significativamente más rápido. El modelo se destaca particularmente en rendimiento, ya que procesa documentos casi cinco veces más rápido que el modelo base y utiliza un 13 % menos de memoria que incluso la variante turbo. Estas métricas se traducen en un rendimiento en el mundo real que rivaliza o supera a modelos mucho más grandes como mxbai-rerank-base-v1 (184 millones de parámetros) y bge-reranker-base (278 millones de parámetros).

Guía

Para implementar este modelo de manera eficaz, las organizaciones deben priorizar los escenarios en los que la velocidad de procesamiento y la eficiencia de los recursos son consideraciones fundamentales. El modelo es particularmente adecuado para implementaciones de computación de borde, aplicaciones móviles y sistemas de búsqueda de alto rendimiento donde los requisitos de latencia son estrictos. Si bien funciona excepcionalmente bien en la mayoría de las tareas de reclasificación, es importante tener en cuenta que para las aplicaciones que requieren el nivel más alto de precisión de clasificación, el modelo base aún puede ser preferible. El modelo requiere una infraestructura de GPU compatible con CUDA para un rendimiento óptimo, aunque su arquitectura eficiente significa que puede ejecutarse de manera eficaz en hardware menos potente que sus contrapartes más grandes. Para la implementación, el modelo se integra perfectamente con las principales bases de datos vectoriales y marcos RAG, y está disponible a través de la API Reranker y AWS SageMaker. Al realizar ajustes para dominios específicos, los usuarios deben equilibrar cuidadosamente la calidad de los datos de entrenamiento con la arquitectura compacta del modelo para mantener sus características de rendimiento.
Blogs que mencionan este modelo
abril 18, 2024 • 7 minutos de lectura
Más pequeño, más rápido, más económico: Presentamos Jina Rerankers Turbo y Tiny
Jina AI anuncia nuevos modelos de reranking: Jina Rerankers Turbo (jina-reranker-v1-turbo-en) y Tiny (jina-reranker-v1-tiny-en), ahora disponibles en AWS Sagemaker y Hugging Face, ofreciendo un reordenamiento más rápido, eficiente en memoria y de alto rendimiento.
Yuting Zhang
Scott Martens
Four interconnected white wireframe spheres on a deep blue background, symbolizing global networking and technological connec
mayo 07, 2024 • 12 minutos de lectura
Cuando la IA Crea IA: Datos Sintéticos, Destilación de Modelos y Colapso de Modelos
¡La IA creando IA! ¿Es el fin del mundo? ¿O simplemente otra herramienta para que los modelos realicen trabajo de valor agregado? ¡Descubrámoslo!
Scott Martens
Abstract depiction of a brain in purple and pink hues with a fluid, futuristic design against a blue and purple background.
abril 29, 2024 • 7 minutos de lectura
Embeddings y Reranker de Jina en Azure: Soluciones de IA escalables y listas para negocios
Los Jina Embeddings y Rerankers están ahora disponibles en Azure Marketplace. Las empresas que priorizan la privacidad y la seguridad ahora pueden integrar fácilmente los modelos de última generación de Jina AI directamente en su ecosistema Azure existente.
Susana Guzmán
Futuristic black background with a purple 3D grid, featuring the "Embeddings" and "Reranker" logos with a stylized "A".
Oficinas
location_on
Sunnyvale, California
710 Lakeway Dr, Ste 200, Sunnyvale, CA 94085, EE. UU.
location_on
Berlín, Alemania (sede central)
Prinzessinnenstraße 19-20, 10969 Berlín, Alemania
location_on
Beijing, China
Piso 5, Edificio 6, No.48 Haidian West St. Pekín, China
location_on
Shenzhen, China
Piso 402, Edificio de Tecnología Fu'an, Shenzhen, China
Fundación de búsqueda
Lector
Incrustaciones
reclasificador
Búsqueda profunda
Clasificador
Segmentador
Documentación API
Obtener la clave API de Jina
Límite de velocidad
Estado de la API
Compañía
Sobre nosotros
Contactar con ventas
Sala de prensa
Programa de prácticas
Únete a nosotros
open_in_new
Descargar logotipo
open_in_new
Términos
Seguridad
Términos y condiciones
Privacidad
Administrar cookies
email
Jina AI © 2020-2025.