Новости
Модели
API
keyboard_arrow_down
Читатель
Читайте URL-адреса и ищите информацию в Интернете для получения более подходящей подготовки для получения степени магистра права.
Вложения
Мультимодальные многоязычные вложения мирового класса.
Реранкер
Нейронный ретривер мирового класса для максимального повышения релевантности поиска.
Elastic Inference Service
Запускайте модели Jina непосредственно в Elasticsearch.
MCP terminalCLIarticlellms.txtsmart_toyАгентыdata_objectСхемаmenu_bookДокументы



Авторизоваться
login
Реранкер
copyright CC BY-NC 4.0
open_in_new Выпуск Пост

jina-reranker-v3

Списочный реранжировщик для поиска многоязычных документов SOTA
Лицензия
copyright CC-BY-NC-4.0
Дата выпуска
calendar_month
2025-10-01
Вход
abc
Текст (Запрос)
abc
Текст (Документ)
arrow_forward
Выход
format_list_numbered
Рейтинги
Подробности модели
Параметры: 597M
Длина входного токена: 131K
Выходной размер: 256
Базовая модель help_outline
open_in_new
Qwen3-0.6B
Обученные языки help_outline
24 языки
Поддерживаемые языки help_outline
93 языки
Квантования help_outline
GGUF
Поддержка Apple Silicon help_outline
MLX
Похожие модели
link
jina-reranker-v2-base-multilingual
link
jina-reranker-m0
Теги
listwise
multilingual
code-search
long-context
reranker
decoder-only
Доступно через
Elastic Inference ServiceAPI ДжинаAWS SageMakerMicrosoft AzureGoogle ОблакоОбнимающее лицо
График ввода-вывода

несколько

Документ

Запрос

jina-reranker-v3

Рейтинг

Выберите модели для сравнения
Публикации (1)
AAAI 2026
октябрь 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking

Обзор

jina-reranker-v3 — это многоязычный реранжировщик документов с 0,6 млрд параметров, представляющий новую архитектуру взаимодействия «последний, но не поздний». В отличие от раздельного кодирования ColBERT с многовекторным сопоставлением, эта модель выполняет причинно-следственное самовосприятие между запросом и документами в одном и том же контекстном окне, обеспечивая расширенное междокументное взаимодействие перед извлечением контекстных вложений из последнего токена каждого документа. Модель построена на Qwen3-0.6B с 28 слоями-трансформерами и легковесным проектором многослойного перцептрона (1024→512→256), что позволяет обрабатывать до 64 документов одновременно в контексте из 131 тыс. токенов. Модель достигает передовой производительности BEIR с 61,94 nDCG-10, будучи при этом в 10 раз компактнее генеративных реранжировщиков по спискам.

Методы

Использует трёхэтапное прогрессивное обучение с многокритериальными потерями, объединяющее InfoNCE, дисперсионные потери (0,45), потери двойного сопоставления (0,85) и потери сходства (0,85). На этапе 1 используется тонкая настройка LoRA (r = 16, α = 32) на предметно-ориентированных наборах данных, включая BGE-M3, Cornstack, с 16 документами на запрос. На этапе 2 контекст расширяется до 8192 токенов и извлекаются жесткие отрицательные значения в поисковых системах с 25 отрицательными значениями при τ = 0,05. На этапе 3 объединяются специализированные модели с весами 0,25–0,65. Специальные токены doc_emb и query_emb отмечают позиции извлечения вложений. Обучение использует структурированные подсказки с ролями система/пользователь/помощник, размещая запрос как в начале, так и в конце для двунаправленного внимания.

Производительность

Достигает 61,94 nDCG-10 на BEIR, самого высокого показателя среди всех оцененных переранжировщиков и улучшения на 4,88% по сравнению с jina-reranker-v2. Превосходно справляется с многоадресным поиском с результатом 78,56 на HotpotQA, верификация фактов достигает 93,95 на FEVER. Многоязычная производительность достигает 66,50 на MIRACL для 18 языков, с арабским на уровне 78,69 и тайским на уровне 81,06. Извлечение кода достигает 63,28 на CoIR. Превосходит 1,5-процентный mxbai-rerank-large (61,44) с в 2,5 раза меньшим количеством параметров. Демонстрирует улучшение на 5,43% по сравнению с bge-reranker-v2-m3 того же масштаба. Относительно стабилен при сортировке документов: случайная (62,54), по убыванию (61,94), по возрастанию (61,52).

Руководство

Используйте структурированный шаблон запроса с ролями системы/пользователя/помощника и специальными токенами для извлечения встраиваемых данных. Обрабатывайте до 64 документов за один прямой проход для коллекций, превышающих 131 000 контекстов. Оптимально подходит для документов, упорядоченных случайным образом или по убыванию релевантности. Используйте возможности взаимодействия между документами для задач сравнительного ранжирования. Для многоязычных приложений модель обеспечивает надежный перенос данных с нулевого выстрела между 18 языками. Реализуйте пакетную обработку для больших наборов документов, поддерживая согласованность встраиваемых данных запросов между пакетами. Рассмотрите 256-мерные выходные встраиваемые данные для эффективного вычисления сходства. Идеально подходит для приложений, требующих как качества ранжирования, так и эффективности вывода, особенно для задач многошагового рассуждения и проверки фактов.
Блоги, в которых упоминается эта модель
октябрь 03, 2025 • 7 минуты чтения
Jina Reranker v3: 0.6B Listwise Reranker для SOTA Мультиязычного Поиска
Новый списочный реранкер с 0.6B параметрами, который рассматривает запрос и все документы-кандидаты в едином контекстном окне.
Jina AI
Light blue background with stylized text in the center, composed of small dots or squares, evoking a modern and minimalistic
январь 22, 2025 • 10 минуты чтения
Что нам следует извлечь из ModernBERT?
ModernBERT задает направление для будущих BERT-подобных моделей благодаря увеличенным тренировочным данным, эффективному подбору параметров и глубокой, но компактной архитектуре.
Nan Wang
Alex C-G
Futuristic illustration with a central white circle surrounded by white dots on a dotted background.
сентябрь 18, 2024 • 10 минуты чтения
Jina Embeddings v3: Передовая мультиязычная модель для создания эмбеддингов
jina-embeddings-v3 - это передовая многоязычная модель текстовых эмбеддингов с 570M параметров и длиной токена 8192, превосходящая по показателям последние проприетарные эмбеддинги от OpenAI и Cohere на бенчмарке MTEB.
Jina AI
Dynamic image showing the characters "V3" formed by bright green dots varying in size on a black background.
Поиск Фонда
Читатель
Вложения
Реранкер
Elastic Inference Service
open_in_new
Получить API-ключ Jina
Ограничение скорости
Статус API
Компания
О нас
Связаться с отделом продаж
отдел новостей
Стажерская программа
Загрузить логотип Jina
open_in_new
Скачать логотип Elastic
open_in_new
Условия
Безопасность
Условия использования
Конфиденциальность
Управление файлами cookie
email
Эластичный © 2020-2026.