jina-reranker-v2-base-multilingual

Ce modèle est obsolète pour les modèles plus récents.

Reclasseur

CC BY-NC 4.0

Publication de publication

jina-reranker-v2-base-multilingual

Réorganisateur d'encodeurs croisés avec prise en charge multilingue, appels de fonctions et recherche de code.

Licence

CC-BY-NC-4.0

Date de sortie

2024-06-25

Saisir

Texte (requête)

Texte (Document)

Sortir

Classements

Détails du modèle

Paramètres: 278M

Longueur du jeton d'entrée: 1K

Modèle de base

XLM-RoBERTa Base

Langues enseignées

24 langues

Langues prises en charge

108 langues

Modèles associés

jina-reranker-v1-base-en

jina-reranker-v1-turbo-en

jina-reranker-v1-tiny-en

Mots clés

multilingual

cross-lingual

function-calling

code-search

long-context

production-ready

reranker

rag-optimized

high-performance

100-languages

Disponible via

Service d'inférence élastique API Jina AWS SageMaker Microsoft Azure Google Cloud Visage qui fait un câlin

Graphique d'E/S

Choisissez les modèles à comparer

jina-reranker-v2-base-multilingual

jina-reranker-v1-base-en

jina-reranker-v1-turbo-en

jina-reranker-v1-tiny-en

Aperçu

Jina Reranker v2 Base Multilingual est un modèle de codeur croisé conçu pour améliorer la précision de la recherche au-delà des barrières linguistiques et des types de données. Ce reranker relève le défi crucial de la récupération précise d'informations dans des environnements multilingues, particulièrement utile pour les entreprises mondiales qui doivent affiner les résultats de recherche dans différentes langues et types de contenu. Avec la prise en charge de plus de 100 langues et des capacités uniques en matière d'appel de fonctions et de recherche de code, il constitue une solution unifiée pour les équipes qui ont besoin d'affiner la recherche avec précision dans le contenu international, la documentation API et les bases de code multilingues. La conception compacte de 278 millions de paramètres du modèle le rend particulièrement attrayant pour les organisations qui cherchent à équilibrer hautes performances et efficacité des ressources.

Méthodes

Ce modèle utilise une architecture d'encodage croisé optimisée par Flash Attention 2, permettant une comparaison directe entre les requêtes et les documents pour une évaluation de pertinence plus précise. Entraîné en quatre étapes, il acquiert d'abord des compétences en anglais, puis intègre progressivement des données interlingues et multilingues, avant d'être affiné par des exemples négatifs stricts. Cette approche d'entraînement innovante, combinée à l'implémentation de Flash Attention 2, permet au modèle de gérer un contexte allant jusqu'à 1024 tokens, avec une segmentation automatique pour les documents plus longs. L'efficacité de cette architecture lui permet de gérer des tâches complexes de réordonnancement multilingues avec un débit six fois supérieur à celui de son prédécesseur, tout en garantissant une évaluation de pertinence précise grâce à l'interaction directe entre les requêtes et les documents.

Performance

Lors d'évaluations en conditions réelles, le modèle démontre des capacités exceptionnelles dans divers tests de performance. Il atteint des performances de pointe dans le classement AirBench pour les systèmes RAG et affiche de bons résultats dans les tâches multilingues, notamment dans l'ensemble de données MKQA couvrant 26 langues. Le modèle excelle particulièrement dans les tâches de données structurées, obtenant des scores de rappel élevés à la fois dans l'appel de fonctions (test de performance ToolBench) et dans la correspondance de schémas SQL (test de performance NSText2SQL). Plus impressionnant encore, il fournit ces résultats tout en traitant les documents 15 fois plus rapidement que des modèles comparables comme bge-reranker-v2-m3, ce qui le rend pratique pour les applications en temps réel. Cependant, les utilisateurs doivent noter que des performances optimales nécessitent un GPU compatible CUDA pour l'inférence.

Conseils

Pour un déploiement optimal, le modèle requiert un GPU compatible CUDA et est accessible via plusieurs canaux, notamment l'API Reranker, les principaux frameworks RAG tels que Haystack et LangChain, ou déployable en mode privé via des plateformes cloud. Ce modèle excelle dans les scénarios exigeant une compréhension précise malgré les barrières linguistiques et les types de données, ce qui le rend idéal pour les entreprises internationales travaillant avec du contenu multilingue, de la documentation API ou des dépôts de code. Grâce à une fenêtre de contexte de 1024 jetons et au découpage automatique en segments pour les documents longs, le modèle gère efficacement les contenus étendus. Les équipes devraient envisager l'utilisation de ce modèle lorsqu'elles souhaitent améliorer la précision de la recherche multilingue, ont besoin de capacités d'appel de fonctions pour les systèmes RAG multilingues ou veulent optimiser la recherche de code dans des bases de code multilingues. Le modèle est particulièrement efficace lorsqu'il est utilisé conjointement avec des systèmes de recherche vectorielle, où il peut améliorer significativement le classement final des documents extraits.

Blogs qui mentionnent ce modèle

octobre 03, 2025 • 7 minutes lues

Jina Reranker v3 : 重排器 Listwise de 0,6B pour une récupération multilingue SOTA

Nouveau réorganisateur listwise de 0,6 milliard de paramètres qui prend en compte la requête et tous les documents candidats dans une seule fenêtre contextuelle.