Noticias
Modelos
API
keyboard_arrow_down
Lector
Lea las URL y busque en la web para obtener una base más sólida para su LLM.
Incrustaciones
Integraciones multilingües y multimodales de clase mundial.
reclasificador
Recuperador neuronal de clase mundial para maximizar la relevancia de la búsqueda.
Servicio de inferencia elástica
Ejecuta modelos Jina de forma nativa dentro de Elasticsearch.
MCP terminalCLIarticlellms.txtsmart_toyAgentesdata_objectEsquemamenu_bookDocumentos



Acceso
login
reclasificador
copyright CC BY-NC 4.0
open_in_new Publicación de lanzamiento

jina-reranker-v3

Reranker por listas para la recuperación de documentos multilingües SOTA
Licencia
copyright CC-BY-NC-4.0
Fecha de lanzamiento
calendar_month
2025-10-01
Aporte
abc
Texto (Consulta)
abc
Texto (Documento)
arrow_forward
Producción
format_list_numbered
Clasificaciones
Detalles del modelo
Parámetros: 597M
Longitud del token de entrada: 131K
Dimensión de salida: 256
Modelo base help_outline
open_in_new
Qwen3-0.6B
Idiomas entrenados help_outline
24 idiomas
Idiomas admitidos help_outline
93 idiomas
Cuantizaciones help_outline
GGUF
Soporte para Apple Silicon help_outline
MLX
Modelos relacionados
link
jina-reranker-v2-base-multilingual
link
jina-reranker-m0
Etiquetas
listwise
multilingual
code-search
long-context
reranker
decoder-only
Disponible a través de
Servicio de inferencia elásticaAPI de JinaAWS SageMakerMicrosoft AzureNube de GoogleCara abrazada
Gráfico de E/S

múltiple

Documento

Consulta

jina-reranker-v3

Categoría

Elige modelos para comparar
Publicaciones (1)
AAAI 2026
octubre 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking

Descripción general

jina-reranker-v3 es un reranker de documentos multilingüe con 0.600 millones de parámetros que presenta una novedosa arquitectura de interacción de última instancia, pero no tardía. A diferencia de la codificación independiente de ColBERT con coincidencia multivectorial, este modelo realiza autoatención causal entre la consulta y los documentos dentro de la misma ventana de contexto, lo que permite interacciones complejas entre documentos antes de extraer las incrustaciones contextuales del último token de cada documento. Desarrollado sobre Qwen3-0.6B con 28 capas de transformador y un proyector MLP ligero (1024→512→256), procesa hasta 64 documentos simultáneamente en un contexto de 131 000 tokens. El modelo alcanza un rendimiento BEIR de vanguardia con 61,94 nDCG-10, siendo 10 veces más pequeño que los rerankers generativos por lista.

Métodos

Emplea un entrenamiento progresivo de tres etapas con pérdida multiobjetivo que combina InfoNCE, pérdida dispersiva (0,45), pérdida de coincidencia dual (0,85) y pérdida de similitud (0,85). La etapa 1 utiliza el ajuste fino de LoRA (r = 16, α = 32) en conjuntos de datos específicos del dominio, incluyendo BGE-M3 y Cornstack, con 16 documentos por consulta. La etapa 2 amplía el contexto a 8192 tokens y extrae negativos duros en sistemas de recuperación con hasta 25 negativos con τ = 0,05. La etapa 3 fusiona modelos especializados con ponderaciones de 0,25 a 0,65. Los tokens especiales doc_emb y query_emb marcan las posiciones de extracción de incrustaciones. El entrenamiento utiliza indicaciones estructuradas con roles de sistema/usuario/asistente, colocando la consulta tanto al principio como al final para una atención bidireccional.

Actuación

Alcanza una puntuación de nDCG-10 de 61,94 en BEIR, la más alta entre todos los rerankers evaluados, con una mejora del 4,88 % respecto a jina-reranker-v2. Destaca en la recuperación multisalto con 78,56 en HotpotQA y en la verificación de hechos con 93,95 en FEVER. El rendimiento multilingüe alcanza 66,50 en MIRACL en 18 idiomas, con 78,69 en árabe y 81,06 en tailandés. La recuperación de código alcanza 63,28 en CoIR. Supera a mxbai-rerank-large (61,44) con 2,5 veces menos parámetros. Muestra una mejora del 5,43 % respecto a bge-reranker-v2-m3 de la misma escala. Relativamente estable en todos los ordenamientos de documentos: aleatorio (62,54), descendente (61,94) y ascendente (61,52).

Guía

Utilice una plantilla de solicitud estructurada con roles de sistema/usuario/asistente y tokens especiales para la extracción de incrustaciones. Procese hasta 64 documentos por pasada para colecciones que superen los 131 K de contexto. Óptimo para documentos ordenados aleatoriamente o por relevancia descendente. Aproveche la capacidad de interacción entre documentos para tareas de clasificación comparativa. Para aplicaciones multilingües, el modelo proporciona una sólida transferencia de cero disparos en 18 idiomas. Implemente el procesamiento por lotes para grandes conjuntos de documentos, manteniendo la consistencia de las incrustaciones de consultas en todos los lotes. Considere las incrustaciones de salida de 256 dimensiones para un cálculo de similitud eficiente. Ideal para aplicaciones que requieren tanto calidad de clasificación como eficiencia de inferencia, en particular razonamiento multisalto y tareas de verificación de hechos.
Blogs que mencionan este modelo
octubre 03, 2025 • 7 minutos de lectura
Jina Reranker v3: Reranker Listwise de 0.6B para la recuperación multilingüe SOTA
Nuevo reranker listwise de 0.6B parámetros que considera la consulta y todos los documentos candidatos en una sola ventana de contexto.
Jina AI
Light blue background with stylized text in the center, composed of small dots or squares, evoking a modern and minimalistic
enero 22, 2025 • 10 minutos de lectura
¿Qué deberíamos aprender de ModernBERT?
Más datos de entrenamiento, un dimensionamiento eficiente de parámetros y una arquitectura profunda pero delgada: ModernBERT marca una dirección para los futuros modelos tipo BERT.
Nan Wang
Alex C-G
Futuristic illustration with a central white circle surrounded by white dots on a dotted background.
septiembre 18, 2024 • 10 minutos de lectura
Jina Embeddings v3: Un Modelo de Embeddings Multilingüe de Vanguardia
jina-embeddings-v3 es un modelo de vanguardia de embeddings de texto multilingüe con 570M parámetros y una longitud de token de 8192, que supera a los últimos embeddings propietarios de OpenAI y Cohere en MTEB.
Jina AI
Dynamic image showing the characters "V3" formed by bright green dots varying in size on a black background.
Fundación de búsqueda
Lector
Incrustaciones
reclasificador
Servicio de inferencia elástica
open_in_new
Obtener la clave API de Jina
Límite de velocidad
Estado de la API
Compañía
Sobre nosotros
Sala de prensa
Descargar el logotipo de Jina
open_in_new
Descargar el logotipo de Elastic
open_in_new
Términos
Seguridad
Términos y condiciones
Privacidad
Administrar cookies
Elástico © 2020-2026.