Noticias
Modelos
API
keyboard_arrow_down
Lector
Lea las URL y busque en la web para obtener una base más sólida para su LLM.
Incrustaciones
Integraciones multilingües y multimodales de clase mundial.
reclasificador
Recuperador neuronal de clase mundial para maximizar la relevancia de la búsqueda.
MCP terminalCLIarticlellms.txtsmart_toyAgentesdata_objectEsquemamenu_bookDocumentos



Acceso
login
warning
Este modelo está obsoleto por los modelos más nuevos.
reclasificador
copyright CC BY-NC 4.0
open_in_new Publicación de lanzamiento

jina-reranker-v2-base-multilingual

Reranker de codificador cruzado con soporte para búsqueda de código, llamadas de funciones y varios idiomas.
Licencia
copyright CC-BY-NC-4.0
Fecha de lanzamiento
calendar_month
2024-06-25
Aporte
abc
Texto (Consulta)
abc
Texto (Documento)
arrow_forward
Producción
format_list_numbered
Clasificaciones
Detalles del modelo
Parámetros: 278M
Longitud del token de entrada: 1K
Modelo base help_outline
open_in_new
XLM-RoBERTa Base
Idiomas entrenados help_outline
24 idiomas
Idiomas admitidos help_outline
108 idiomas
Modelos relacionados
link
jina-reranker-v1-base-en
link
jina-reranker-v1-turbo-en
link
jina-reranker-v1-tiny-en
Etiquetas
multilingual
cross-lingual
function-calling
code-search
long-context
production-ready
reranker
rag-optimized
high-performance
100-languages
Disponible a través de
Servicio de inferencia elásticaAPI de JinaAWS SageMakerMicrosoft AzureNube de GoogleCara abrazada
Gráfico de E/S

múltiple

Documento

Consulta

jina-reranker-v2-base-multilingual

Categoría

Elige modelos para comparar

Descripción general

Jina Reranker v2 Base Multilingual es un modelo de codificador cruzado diseñado para mejorar la precisión de búsqueda en diferentes barreras lingüísticas y tipos de datos. Este reranker aborda el desafío crítico de la recuperación precisa de información en entornos multilingües, especialmente valioso para empresas globales que necesitan refinar los resultados de búsqueda en diferentes idiomas y tipos de contenido. Con soporte para más de 100 idiomas y capacidades únicas en llamadas de funciones y búsqueda de código, sirve como una solución unificada para equipos que requieren un refinamiento preciso de la búsqueda en contenido internacional, documentación de API y bases de código multilingües. El diseño compacto de 278M de parámetros del modelo lo hace particularmente atractivo para las organizaciones que buscan equilibrar el alto rendimiento con la eficiencia de los recursos.

Métodos

El modelo emplea una arquitectura de codificador cruzado mejorada con Flash Attention 2, lo que permite la comparación directa entre consultas y documentos para una evaluación de relevancia más precisa. Entrenado mediante un proceso de cuatro etapas, el modelo primero establece las capacidades del idioma inglés, luego incorpora progresivamente datos multilingües e interlingüísticos, antes del refinamiento final con ejemplos negativos. Este innovador enfoque de entrenamiento, combinado con la implementación de Flash Attention 2, permite al modelo gestionar una longitud de contexto de hasta 1024 tokens, con compatibilidad con fragmentación automática para documentos más extensos. La eficiencia de la arquitectura le permite gestionar tareas complejas de reclasificación en varios idiomas con un rendimiento seis veces superior al de su predecesor, a la vez que garantiza una evaluación de relevancia precisa mediante la interacción directa entre la consulta y el documento.

Actuación

En evaluaciones del mundo real, el modelo demuestra capacidades excepcionales en diversos puntos de referencia. Alcanza un rendimiento de vanguardia en la clasificación de AirBench para sistemas RAG y muestra sólidos resultados en tareas multilingües, incluido el conjunto de datos MKQA que cubre 26 idiomas. El modelo se destaca particularmente en tareas de datos estructurados, logrando altos puntajes de recuperación tanto en llamadas de funciones (punto de referencia ToolBench) como en coincidencias de esquemas SQL (punto de referencia NSText2SQL). Lo más impresionante es que ofrece estos resultados mientras procesa documentos 15 veces más rápido que modelos comparables como bge-reranker-v2-m3, lo que lo hace práctico para aplicaciones en tiempo real. Sin embargo, los usuarios deben tener en cuenta que el rendimiento óptimo requiere una GPU compatible con CUDA para la inferencia.

Guía

Para una implementación óptima, el modelo requiere una GPU compatible con CUDA y se puede acceder a él a través de múltiples canales, incluyendo la API Reranker, los principales frameworks RAG como Haystack y LangChain, o de forma privada a través de marketplaces en la nube. El modelo destaca en escenarios que requieren una comprensión precisa de las barreras lingüísticas y los tipos de datos, lo que lo hace ideal para empresas globales que trabajan con contenido multilingüe, documentación de API o repositorios de código. Con una ventana de contexto de 1024 tokens y fragmentación automática para documentos más largos, el modelo gestiona el contenido extendido de forma eficiente. Los equipos deberían considerar este modelo cuando necesiten mejorar la precisión de las búsquedas en diferentes idiomas, requieran capacidades de llamada a funciones para sistemas RAG con agentes o deseen mejorar la funcionalidad de búsqueda de código en bases de código multilingües. El modelo es especialmente eficaz cuando se utiliza junto con sistemas de búsqueda vectorial, donde puede mejorar significativamente la clasificación final de los documentos recuperados.
Blogs que mencionan este modelo
octubre 03, 2025 • 7 minutos de lectura
Jina Reranker v3: Reranker Listwise de 0.6B para la recuperación multilingüe SOTA
Nuevo reranker listwise de 0.6B parámetros que considera la consulta y todos los documentos candidatos en una sola ventana de contexto.
Jina AI
Light blue background with stylized text in the center, composed of small dots or squares, evoking a modern and minimalistic
abril 16, 2025 • 10 minutos de lectura
Sobre el sesgo de tamaño en los embeddings de texto y su impacto en la búsqueda
El sesgo de tamaño se refiere a cómo la longitud de los textos de entrada afecta la similitud, independientemente de la relevancia semántica. Explica por qué los sistemas de búsqueda a veces devuelven documentos largos y apenas relevantes en lugar de coincidencias más cortas y precisas para tu consulta.
Scott Martens
Black background with a simple white ruler marked in centimeters, emphasizing a minimalist design.
abril 08, 2025 • 21 minutos de lectura
jina-reranker-m0: Reranqueador multilingüe y multimodal de documentos
Presentamos jina-reranker-m0, nuestro nuevo reranker multimodal multilingüe para recuperar documentos visuales, con rendimiento SOTA en documentos largos multilingües y tareas de búsqueda de código.
Jina AI
Modern dot matrix text display on a dark blue background, conveying a digital feel.
abril 01, 2025 • 17 minutos de lectura
Usando el modelo de razonamiento DeepSeek R1 en DeepSearch
¿LLM estándar o modelo de razonamiento, cuál es mejor para DeepSearch? En esta publicación, exploramos el uso de DeepSeek-R1 en la implementación de DeepSearch para elegir la siguiente acción.
Andrei Ungureanu
Alex C-G
Brown background with a stylized whale graphic and the text "THINK:" and ":SEARCH>" in code-like font.
marzo 12, 2025 • 11 minutos de lectura
Selección de Fragmentos y Clasificación de URLs en DeepSearch/DeepResearch
Dominar estos dos detalles transforma tu DeepSearch de mediocre a legendario: seleccionar los mejores fragmentos de páginas web extensas y clasificar las URLs antes de rastrearlas.
Han Xiao
Logo with words "THINK SEARCH THINK" in black dot and arrow patterns on an orange background, accompanied by horizontal lines
Oficinas
location_on
Sunnyvale, California
710 Lakeway Dr, Ste 200, Sunnyvale, CA 94085, EE. UU.
location_on
Berlín, Alemania
Prinzessinnenstraße 19-20, 10969 Berlín, Alemania
Fundación de búsqueda
Lector
Incrustaciones
reclasificador
Obtener la clave API de Jina
Límite de velocidad
Estado de la API
Compañía
Sobre nosotros
Contactar con ventas
Sala de prensa
Programa de prácticas
Descargar el logotipo de Jina
open_in_new
Descargar el logotipo de Elastic
open_in_new
Términos
Seguridad
Términos y condiciones
Privacidad
Administrar cookies
email
Jina AI de Elastic © 2020-2026.