Nouvelles
Modèles
API
keyboard_arrow_down
Lecteur
Lisez les URL et effectuez des recherches sur le Web pour de meilleurs LLM de base.
Intégrations
Intégrations multimodales et multilingues de classe mondiale.
Reclasseur
Récupérateur neuronal de classe mondiale pour maximiser la pertinence de la recherche.
Service d'inférence élastique
Exécutez les modèles Jina nativement au sein d'Elasticsearch.
MCP terminalCLIarticlellms.txtsmart_toyAgentsdata_objectSchémamenu_bookDocuments



Se connecter
login

Reclasseur

Optimisez la pertinence de la recherche et la précision du RAG avec notre API de reranker de pointe.

API de reclassement

Essayez notre API de reclassement de pointe pour maximiser la pertinence de votre recherche et la précision de RAG. Commencer gratuitement !
keyClé API et facturation
codeUsage
more_horizPlus
chevron_leftchevron_right

home
speedLimite de taux
bug_reportSoulever un problème
help_outlineFAQ
Statut
chevron_leftchevron_right

Nombre de documents retournés
top_n
top_k
Nombre maximal de documents les mieux classés à renvoyer.

Exemple de requête
Changez-le et voyez comment la réponse change !
Exemples de documents candidats à classer
Changez-les et voyez comment la réponse change !
Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.
New makeup trends focus on bold colors and innovative techniques: Step into the world of cutting-edge beauty with this seasons makeup trends. Bold, vibrant colors and groundbreaking techniques are redefining the art of makeup. From neon eyeliners to holographic highlighters, unleash your creativity and make a statement with every look.
Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.
Neue Make-up-Trends setzen auf kräftige Farben und innovative Techniken: Tauchen Sie ein in die Welt der modernen Schönheit mit den neuesten Make-up-Trends. Kräftige, lebendige Farben und innovative Techniken setzen neue Maßstäbe. Von auffälligen Eyelinern bis hin zu holografischen Highlightern – lassen Sie Ihrer Kreativität freien Lauf und setzen Sie jedes Mal ein Statement.
Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.
Las nuevas tendencias de maquillaje se centran en colores vivos y técnicas innovadoras: Entra en el fascinante mundo del maquillaje con las tendencias más actuales. Colores vivos y técnicas innovadoras están revolucionando el arte del maquillaje. Desde delineadores neón hasta iluminadores holográficos, desata tu creatividad y destaca en cada look.
针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。
新的化妆趋势注重鲜艳的颜色和创新的技巧:进入化妆艺术的新纪元,本季的化妆趋势以大胆的颜色和创新的技巧为主。无论是霓虹眼线还是全息高光,每一款妆容都能让您脱颖而出,展现独特魅力。
敏感肌のために特別に設計された天然有機スキンケア製品: アロエベラとカモミールのやさしい力で、自然の抱擁を感じてください。敏感肌用に特別に設計された私たちのスキンケア製品は、肌に優しく栄養を与え、保護します。肌トラブルにさようなら、輝く健康な肌にこんにちは。
新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

upload
Demande
curl https://api.jina.ai/v1/rerank \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "query": "Organic skincare products for sensitive skin",
    "top_n": 3,
    "documents": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "New makeup trends focus on bold colors and innovative techniques: Step into the world of cutting-edge beauty with this seasons makeup trends. Bold, vibrant colors and groundbreaking techniques are redefining the art of makeup. From neon eyeliners to holographic highlighters, unleash your creativity and make a statement with every look.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Neue Make-up-Trends setzen auf kräftige Farben und innovative Techniken: Tauchen Sie ein in die Welt der modernen Schönheit mit den neuesten Make-up-Trends. Kräftige, lebendige Farben und innovative Techniken setzen neue Maßstäbe. Von auffälligen Eyelinern bis hin zu holografischen Highlightern – lassen Sie Ihrer Kreativität freien Lauf und setzen Sie jedes Mal ein Statement.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "Las nuevas tendencias de maquillaje se centran en colores vivos y técnicas innovadoras: Entra en el fascinante mundo del maquillaje con las tendencias más actuales. Colores vivos y técnicas innovadoras están revolucionando el arte del maquillaje. Desde delineadores neón hasta iluminadores holográficos, desata tu creatividad y destaca en cada look.",
        "针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。",
        "新的化妆趋势注重鲜艳的颜色和创新的技巧:进入化妆艺术的新纪元,本季的化妆趋势以大胆的颜色和创新的技巧为主。无论是霓虹眼线还是全息高光,每一款妆容都能让您脱颖而出,展现独特魅力。",
        "敏感肌のために特別に設計された天然有機スキンケア製品: アロエベラとカモミールのやさしい力で、自然の抱擁を感じてください。敏感肌用に特別に設計された私たちのスキンケア製品は、肌に優しく栄養を与え、保護します。肌トラブルにさようなら、輝く健康な肌にこんにちは。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ],
    "return_documents": false
  }
EOFEOF


v3 : Listwise Reranker pour la recherche multilingue SOTA

jina-reranker-v3 est un reranker de documents multilingue de 0,6 B de paramètres introduisant une nouvelle architecture d'interaction de dernière minute.
Lire la note de publicationarrow_forward

m0 : Reclasseur de documents multilingues et multimodaux

Notre nouveau reranker multimodal multilingue pour récupérer des documents visuels dans plusieurs langues, avec des performances SOTA sur les documents longs multilingues et les tâches de recherche de code.

Qu'est-ce qu'un reranker ?

L’objectif d’un système de recherche est de trouver les résultats les plus pertinents rapidement et efficacement. Traditionnellement, des méthodes telles que BM25 ou tf-idf ont été utilisées pour classer les résultats de recherche en fonction de la correspondance des mots clés. Des méthodes récentes, telles que la similarité cosinus basée sur l'intégration, ont été implémentées dans de nombreuses bases de données vectorielles. Ces méthodes sont simples mais peuvent parfois passer à côté des subtilités du langage et, plus important encore, de l'interaction entre les documents et l'intention d'une requête. C'est là que le « reranker » brille. Un reranker est un modèle d'IA avancé qui prend l'ensemble initial de résultats d'une recherche (souvent fourni par une recherche basée sur des intégrations/jetons) et les réévalue pour s'assurer qu'ils correspondent plus étroitement à l'intention de l'utilisateur. Il va au-delà de la correspondance superficielle des termes pour considérer l’interaction plus profonde entre la requête de recherche et le contenu des documents.
account_tree
Voici comment cela fonctionne:

1
Récupération initiale
Un système de recherche utilise embeddings/BM25 pour trouver un large ensemble de documents potentiellement pertinents en fonction de la requête de l'utilisateur.

2
Reclassement
Le reranker prend ensuite ces résultats et les analyse à un niveau plus granulaire, en tenant compte des nuances de la manière dont les termes de requête interagissent avec le contenu du document.

3
Résultats améliorés
Il réorganise les résultats de recherche, en plaçant ceux qu'il juge les plus pertinents en haut, sur la base de cette analyse plus approfondie.

Le reranker peut améliorer considérablement la qualité de la recherche car il opère au niveau des sous-documents et des sous-requêtes, ce qui signifie qu'il examine les mots et expressions individuels, leur signification et leurs relations les uns avec les autres dans la requête et les documents. Cela se traduit par un ensemble de résultats de recherche plus précis et contextuellement pertinents.
Jina Reranker v2 est le meilleur reranker de sa catégorie sorti le 25 juin 2024 ; il est conçu pour Agentic RAG. Il offre une prise en charge des appels de fonctions, une récupération multilingue pour plus de 100 langues, des capacités de recherche de code et offre une accélération 6x par rapport à la v1. En savoir plus sur le modèle v2.
Récupération multilingue
Reranker v2 permet la récupération de documents dans plus de 100 langues, quel que soit le langage de requête.

Appel de fonction et recherche de code
Reranker v2 classe les extraits de code et les signatures de fonctions en fonction de requêtes en langage naturel, idéal pour les applications Agentic RAG.

Prise en charge des données tabulaires et structurées
Reranker v2 classe les tables les plus pertinentes en fonction de requêtes en langage naturel, aidant ainsi à trier différents schémas de table et à identifier le plus pertinent avant de générer une requête SQL.

Deux façons d'acheter

Abonnez-vous à notre API ou achetez via des fournisseurs de cloud.
radio_button_unchecked
cloud
Avec 3 fournisseurs de services cloud
Votre entreprise utilise-t-elle AWS ou Azure ? Déployez ensuite directement nos modèles de fondation de recherche sur ces plateformes dans votre entreprise, afin que vos données restent sécurisées et conformes.
AWS SageMaker
Intégrations
Reclasseur
Microsoft Azure
Intégrations
Reclasseur
Google Cloud
Intégrations
radio_button_checked
Avec l'API Jina Search Foundation
Le moyen le plus simple d'accéder à tous nos produits. Rechargez vos jetons au fur et à mesure.
Rechargez cette clé API avec plus de jetons
Selon votre emplacement, vous pouvez être facturé en USD, EUR ou dans d'autres devises. Des taxes peuvent s'appliquer.
Veuillez saisir la bonne clé API pour recharger
Comprendre la limite de débit
Les limites de débit correspondent au nombre maximal de requêtes pouvant être adressées à une API en une minute par adresse IP/clé API (RPM). Découvrez ci-dessous les limites de débit pour chaque produit et niveau.
keyboard_arrow_down
Limite de taux
Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.
ProduitPoint de terminaison de l'APIDescriptionarrow_upwardsans clé APIkey_offavec clé API gratuitekeyavec clé API payantekeyavec clé API PremiumkeyLatence moyenneComptage de l'utilisation des jetonsDemande autorisée
API de lecteurhttps://r.jina.aiConvertir l'URL en texte compatible LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sComptez le nombre de jetons dans la réponse de sortie.GET/POST
API de lecteurhttps://s.jina.aiRecherchez sur le Web et convertissez les résultats en texte adapté au LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sChaque demande coûte un nombre fixe de jetons, à partir de 10000 jetonsGET/POST
API d'intégrationhttps://api.jina.ai/v1/embeddingsConvertir du texte/des images en vecteurs de longueur fixeblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
help
Comptez le nombre de jetons dans la demande d'entrée.POST
API de reclassementhttps://api.jina.ai/v1/rerankClasser les documents par requêteblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
help
Comptez le nombre de jetons dans la demande d'entrée.POST
API de classificateurhttps://api.jina.ai/v1/trainEntraîner un classificateur à l'aide d'exemples étiquetésblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Les jetons sont comptés comme suit : input_tokens × num_itersPOST
API de classificateur (Coup zéro)https://api.jina.ai/v1/classifyClasser les entrées à l'aide de la classification à coup zéroblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Jetons comptés comme : input_tokens + label_tokensPOST
API de classificateur (Quelques coups)https://api.jina.ai/v1/classifyClasser les entrées à l'aide d'un classificateur à quelques coups entraînéblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Jetons comptés comme : input_tokensPOST
API de segmentationhttps://api.jina.ai/v1/segmentTokeniser et segmenter un texte long20 RPM200 RPM200 RPM1,000 RPM0.3sLe jeton n'est pas comptabilisé comme une utilisation.GET/POST
Recherche profondehttps://deepsearch.jina.ai/v1/chat/completionsRaisonner, rechercher et itérer pour trouver la meilleure réponseblock50 RPM50 RPM500 RPM56.7sComptez le nombre total de jetons dans l’ensemble du processus.POST

Déploiement sur site

Déployez Jina Reranker sur AWS Sagemaker et Microsoft Azure et bientôt dans Google Cloud Services, ou contactez notre équipe commerciale pour obtenir des déploiements Kubernetes personnalisés pour votre cloud privé virtuel et vos serveurs sur site.
AWS SageMaker
Intégrations
Reclasseur
Microsoft Azure
Intégrations
Reclasseur
Google Cloud
Intégrations

Référence de performances

looks_two
Afficher le benchmark pour le modèle v2 (dernier)
menu_book
Jina Reranker v2 est le meilleur reranker de sa catégorie sorti le 25 juin 2024 ; il est conçu pour Agentic RAG. Il offre une prise en charge des appels de fonctions, une récupération multilingue pour plus de 100 langues, des capacités de recherche de code et offre une accélération 6x par rapport à la v1. En savoir plus sur le modèle v2.

MKQA (Questions et réponses sur les connaissances multilingues)
Rappel de 10 scores rapportés pour différents modèles de reclassement pour l'ensemble de données MKQA
BEIR (Benchmark hétérogène sur diverses tâches IR)
Scores NDCG 10 rapportés pour différents modèles de reclassement pour l'ensemble de données Beir
Banc d'outils. Le benchmark collecte plus de 16 000 API publiques et les instructions correspondantes générées synthétiquement pour les utiliser dans des paramètres à API unique et multi-API.
Rappel de 3 scores rapportés pour différents modèles de reclassement pour l'ensemble de données ToolBench
NSText2SQL
Rappel de 3 scores rapportés pour différents modèles de reclassement pour l'ensemble de données NSText2SQL
CodeSearchNet. Le benchmark est une combinaison de requêtes aux formats docstring et en langage naturel, avec des segments de code étiquetés pertinents pour les requêtes.
Scores MRR 10 rapportés pour différents modèles de reclassement pour l'ensemble de données CodeSearchNet
Débit de Jina Reranker v2 sur RTX4090
Scores de débit (documents récupérés en 50 ms) rapportés pour différents modèles de reclassement sur un GPU RTX 4090.

Comparaison de Reranker, Vector Search et BM25

Le tableau ci-dessous fournit une comparaison complète du Reranker, de la recherche Vector/Embeddings et du BM25, mettant en évidence leurs forces et leurs faiblesses dans diverses catégories.
ReclasseurRecherche de vecteursBM25
Meilleur pourPrécision et pertinence de recherche amélioréesFiltrage initial et rapideRécupération de texte générale pour des requêtes étendues
GranularitéDétaillé : sous-document et segment de requêteLarge : documents entiersIntermédiaire : divers segments de texte
Complexité du temps de requêteHautMoyenFaible
Complexité du temps d’indexationNon requisHautFaible, utilise un index prédéfini
Complexité du temps de formationHautHautNon requis
Qualité de la rechercheSupérieur pour les requêtes nuancéesÉquilibré entre efficacité et précisionCohérent et fiable pour un large éventail de requêtes
ForcesTrès précis avec une compréhension contextuelle approfondieRapide et efficace, avec une précision modéréeHautement évolutif, avec une efficacité établie
Essayez l'API de reclassement gratuitementEssayez d'intégrer l'API gratuitement

En savoir plus sur le Reranker

Qu'est-ce qu'un reranker ? Pourquoi la recherche vectorielle ou la similarité cosinus ne suffisent-elles pas ? Découvrez les rerankers de A à Z avec notre guide complet.
Light blue background with stylized text in the center, composed of small dots or squares, evoking a modern and minimalistic
octobre 03, 2025 • 7 minutes lues
Jina Reranker v3: 0.6B Listwise Reranker for SOTA Multilingual Retrieval
New 0.6B-parameter listwise reranker that considers the query and all candidate documents in a single context window.
Jina AI
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
octobre 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
jina-reranker-v3 is a 0.6B parameter multilingual document reranker that introduces a novel last but not late interaction. Unlike late interaction models such as ColBERT that perform separate encoding followed by multi-vector matching, our approach conducts causal self-attention between query and documents within the same context window, enabling rich cross-document interactions before extracting contextual embeddings from the last token of each document. This compact architecture achieves state-of-the-art BEIR performance with 61.94 nDCG@10 while being significant smaller than generative listwise rerankers.
Network illustration of interconnected hexagons, some solid and some hollow blue, connected by red lines indicating paths or
juillet 14, 2025 • 11 minutes lues
Submodular Optimization for Text Selection, Passage Reranking & Context Engineering
While others rely on prompt tuning and hope for the best, you should learn submodular optimization that provides a principled framework with theoretical guarantees for better context engineering.
Han Xiao
Stacked glowing green ovals on a background transitioning from black to green, with the top oval having an unusual, split sha
mai 25, 2025 • 8 minutes lues
Fair Scoring for Multimodal Documents with jina-reranker-m0
Text similarity: 0.7. Image similarity: 0.5. Which document is more relevant? You literally cannot tell—and that's the core problem breaking multimodal search. We solve it with unified reranking.
Nan Wang
Alex C-G

FAQ

Combien coûte l’API Reranker ?
keyboard_arrow_down
La tarification de l'API Reranker est alignée sur celle de notre API Embedding. Elle commence avec 10 millions de jetons gratuits pour chaque nouvelle clé API. Outre ces jetons gratuits, différents packages sont disponibles à l'achat. Pour plus d'informations, veuillez consulter notre section Tarifs.
Quelles sont les différences entre les modérateurs de Jina ?
keyboard_arrow_down
jina-reranker-v3 est notre tout dernier outil de reclassement phare, doté d'une architecture novatrice par listes, offrant des performances de pointe en matière de recherche multilingue avec une longueur de contexte de 131 000 caractères. jina-reranker-m0 est notre outil de reclassement multimodal permettant de classer des documents visuels dans différentes langues. jina-reranker-v2-base-multilingual est un encodeur croisé prenant en charge plus de 100 langues, avec appels de fonctions et récupération de code. jina-colbert-v2 utilise l'interaction tardive pour 89 langues, avec des tailles d'embeddings configurables par l'utilisateur.
Les Jina Rerankers sont-ils open source ?
keyboard_arrow_down
Oui, tous nos outils de réordonnancement (jina-reranker-v3, jina-reranker-m0, jina-reranker-v2-base-multilingual et jina-colbert-v2) sont open source et disponibles sous licence CC-BY-NC 4.0. Vous êtes libre d'utiliser, de partager et d'adapter ces modèles à des fins non commerciales.
Les rerankers prennent-ils en charge plusieurs langues ?
keyboard_arrow_down
Oui, tous nos outils de réévaluation prennent en charge la recherche multilingue. `jina-reranker-v3` et `jina-reranker-v2-base-multilingual` prennent en charge plus de 100 langues. `jina-reranker-m0` prend en charge le classement visuel multilingue des documents. `jina-colbert-v2` prend en charge 89 langues.
Quelle est la longueur maximale du contexte pour chaque modèle de reclassement ?
keyboard_arrow_down
La longueur du contexte varie selon le modèle :

jina-reranker-v3 : 131 072 jetons (requête + tous les documents combinés) avec troncature automatique
jina-reranker-m0 : 10 000 jetons
jina-reranker-v2-base-multilingual : 1 024 jetons avec découpage automatique pour les documents longs
jina-reranker-v1-* : 1 024 jetons avec découpage automatique
jina-colbert-v2 : 8 192 jetons

Pour les réorganisateurs v1/v2, les requêtes sont automatiquement tronquées et les documents longs sont découpés en segments avec un regroupement maximal entre les segments.
Existe-t-il une limite au nombre de documents que je peux réorganiser par requête ?
keyboard_arrow_down
Il n'y a pas de limite stricte au nombre de documents par requête. À l'instar de notre API Embeddings, l'API Reranker regroupe les entrées en interne par nombre de jetons afin d'optimiser l'utilisation du GPU. Vous pouvez envoyer autant de documents que nécessaire en une seule requête.
À quelle latence puis-je m'attendre lors du reclassement de 100 documents ?
keyboard_arrow_down
La latence varie de 100 millisecondes à 7 secondes, en fonction en grande partie de la longueur des documents et de la requête. Par exemple, le reclassement de 100 documents de 256 jetons chacun avec une requête de 64 jetons prend environ 150 millisecondes. L'augmentation de la longueur du document à 4 096 jetons augmente le temps à 3,5 secondes. Si la longueur de la requête est augmentée à 512 jetons, le temps augmente encore à 7 secondes.
Vous trouverez ci-dessous le coût en temps nécessaire au reclassement d'une requête et de 100 documents en millisecondes :
Nombre de jetons dans chaque document
Nombre de jetons dans la requête256512102420484096
64156323136621073571
128194369137721233598
256273475139721554299
5124681385211435367068
Vos points de terminaison peuvent-ils être hébergés en privé sur AWS, Azure ou GCP ?
keyboard_arrow_down
Oui, nos services sont disponibles sur les marketplaces AWS, Azure et GCP. Si vous avez des besoins spécifiques, veuillez nous contacter à sales AT jina.ai.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
Proposez-vous un reranker affiné sur les données spécifiques à un domaine ?
keyboard_arrow_down
Si vous êtes intéressé par un reranker affiné et adapté à des données de domaine spécifiques, veuillez contacter notre équipe commerciale. Notre équipe répondra à votre demande dans les plus brefs délais.
Contact
Quelle est la taille minimale de l'image pour les documents ?
keyboard_arrow_down
La taille d'image minimale acceptable pour le modèle jina-reranker-m0 est de 28x28 pixels.
Qu’est-ce que le réordonnancement par liste et en quoi diffère-t-il du réordonnancement par points ?
keyboard_arrow_down
jina-reranker-v3 utilise une architecture novatrice de classement par liste qui évalue tous les documents simultanément en une seule passe, permettant ainsi la comparaison entre documents. Les systèmes de classement ponctuels traditionnels (comme la version 2) évaluent chaque document indépendamment par rapport à la requête. Le classement par liste atteint une précision supérieure en tenant compte de la pertinence relative au sein de l'ensemble des candidats.
Pourquoi l'API prend-elle en charge une longueur de contexte différente de la capacité maximale du modèle ?
keyboard_arrow_down
Bien que certains de nos modèles de réordonnancement soient conçus pour traiter des contextes plus longs, l'API peut imposer des limites inférieures en raison des contraintes de mémoire vidéo (VRAM) des GPU de notre infrastructure d'inférence. Le traitement de séquences très longues exige une quantité importante de mémoire ; nous optimisons donc notre configuration de service afin d'équilibrer débit, latence et coût pour la plupart des cas d'utilisation. Si vous avez besoin d'une prise en charge étendue des contextes, veuillez contacter notre équipe commerciale pour discuter des options de déploiement dédiées.
Quelles sont les limites de débit de l'API Reranker ?
keyboard_arrow_down
Les limites de débit dépendent du type de votre clé API :

Gratuite : 100 RPM, 100 000 TPM, 2 requêtes simultanées
Payante : 500 RPM, 2 millions de TPM, 50 requêtes simultanées
Premium : 5 000 RPM, 50 millions de TPM, 500 requêtes simultanées

Il existe également une limite de débit basée sur l’adresse IP de 10 000 requêtes par 60 secondes. Ces mêmes limites s’appliquent aux API Embeddings et Reranker.

Comment obtenir ma clé API ?

video_not_supported

Quelle est la limite de débit ?

Limite de taux
Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.
ProduitPoint de terminaison de l'APIDescriptionarrow_upwardsans clé APIkey_offavec clé API gratuitekeyavec clé API payantekeyavec clé API PremiumkeyLatence moyenneComptage de l'utilisation des jetonsDemande autorisée
API de lecteurhttps://r.jina.aiConvertir l'URL en texte compatible LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sComptez le nombre de jetons dans la réponse de sortie.GET/POST
API de lecteurhttps://s.jina.aiRecherchez sur le Web et convertissez les résultats en texte adapté au LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sChaque demande coûte un nombre fixe de jetons, à partir de 10000 jetonsGET/POST
API d'intégrationhttps://api.jina.ai/v1/embeddingsConvertir du texte/des images en vecteurs de longueur fixeblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
help
Comptez le nombre de jetons dans la demande d'entrée.POST
API de reclassementhttps://api.jina.ai/v1/rerankClasser les documents par requêteblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
help
Comptez le nombre de jetons dans la demande d'entrée.POST
API de classificateurhttps://api.jina.ai/v1/trainEntraîner un classificateur à l'aide d'exemples étiquetésblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Les jetons sont comptés comme suit : input_tokens × num_itersPOST
API de classificateur (Coup zéro)https://api.jina.ai/v1/classifyClasser les entrées à l'aide de la classification à coup zéroblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Jetons comptés comme : input_tokens + label_tokensPOST
API de classificateur (Quelques coups)https://api.jina.ai/v1/classifyClasser les entrées à l'aide d'un classificateur à quelques coups entraînéblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Jetons comptés comme : input_tokensPOST
API de segmentationhttps://api.jina.ai/v1/segmentTokeniser et segmenter un texte long20 RPM200 RPM200 RPM1,000 RPM0.3sLe jeton n'est pas comptabilisé comme une utilisation.GET/POST
Recherche profondehttps://deepsearch.jina.ai/v1/chat/completionsRaisonner, rechercher et itérer pour trouver la meilleure réponseblock50 RPM50 RPM500 RPM56.7sComptez le nombre total de jetons dans l’ensemble du processus.POST

Ai-je besoin d’une licence commerciale ?

Auto-vérification de la licence CC BY-NC

play_arrow
Utilisez-vous notre API officielle ou nos images officielles sur Azure, AWS ou GCP ?
play_arrow
Oui
Aucune restriction. Inscrivez-vous simplement et payez via notre site web ou notre plateforme cloud.
play_arrow
Non
play_arrow
Êtes-vous un client Elastic payant ?
play_arrow
Oui
L'utilisation commerciale est probablement déjà incluse dans votre licence Elastic. En cas de doute, contactez votre représentant commercial Elastic.
Contacter le service commercial
play_arrow
Non
Nous ne sommes actuellement pas en mesure de délivrer des contrats de licence commerciale indépendants. Veuillez contacter le service commercial d'Elastic pour plus d'informations.
Contacter le service commercial
Questions courantes liées à l'API
code
Puis-je utiliser la même clé API pour les API de lecture, d'intégration, de reclassement, de classification et de réglage fin ?
keyboard_arrow_down
Oui, la même clé API est valable pour tous les produits de recherche de Jina AI. Cela inclut les API de lecture, d'intégration, de reclassement, de classification et de réglage fin, avec des jetons partagés entre tous les services.
code
Puis-je surveiller l’utilisation des jetons de ma clé API ?
keyboard_arrow_down
Oui, l'utilisation des jetons peut être surveillée dans l'onglet « Clé API et facturation » en saisissant votre clé API, ce qui vous permet d'afficher l'historique d'utilisation récent et les jetons restants. Si vous êtes connecté au tableau de bord de l'API, ces détails peuvent également être consultés dans l'onglet « Gérer la clé API ».
code
Que dois-je faire si j'oublie ma clé API ?
keyboard_arrow_down
Si vous avez égaré une clé rechargée et souhaitez la récupérer, veuillez contacter le support AT jina.ai avec votre adresse e-mail enregistrée pour obtenir de l'aide. Il est recommandé de vous connecter pour conserver votre clé API en toute sécurité et facilement accessible.
Contact
code
Les clés API expirent-elles ?
keyboard_arrow_down
Non, nos clés API n'ont pas de date d'expiration. Cependant, si vous pensez que votre clé a été compromise et souhaitez la retirer, veuillez contacter notre équipe d'assistance pour obtenir de l'aide. Vous pouvez également révoquer votre clé dans le tableau de bord de gestion des clés API.
Contact
code
Puis-je transférer des jetons entre des clés API ?
keyboard_arrow_down
Oui, vous pouvez transférer des jetons d'une clé premium vers une autre. Après vous être connecté à votre compte sur le tableau de bord de gestion des clés API, utilisez les paramètres de la clé que vous souhaitez transférer pour déplacer tous les jetons payants restants.
code
Puis-je révoquer ma clé API ?
keyboard_arrow_down
Oui, vous pouvez révoquer votre clé API si vous pensez qu'elle a été compromise. La révocation d'une clé la désactivera immédiatement pour tous les utilisateurs qui l'ont stockée, et tout le solde restant et les propriétés associées seront définitivement inutilisables. Si la clé est une clé premium, vous avez la possibilité de transférer le solde restant payé vers une autre clé avant la révocation. Notez que cette action ne peut pas être annulée. Pour révoquer une clé, accédez aux paramètres de clé dans le tableau de bord de gestion des clés API.
code
Pourquoi la première demande de certains modèles est-elle lente ?
keyboard_arrow_down
Cela est dû au fait que notre architecture sans serveur décharge certains modèles pendant les périodes de faible utilisation. La requête initiale active ou « réchauffe » le modèle, ce qui peut prendre quelques secondes. Après cette activation initiale, les requêtes suivantes sont traitées beaucoup plus rapidement.
code
Mes données API sont-elles utilisées pour entraîner vos modèles ?
keyboard_arrow_down
Non. Nous n'utilisons jamais vos requêtes API, entrées ou sorties pour entraîner nos modèles d'embedding, de reranker ou tout autre modèle. Vos données vous appartiennent.
code
Quelles sont les limites de débit des API Jina ?
keyboard_arrow_down
Des limites de débit s'appliquent par clé API :

Gratuit : 100 RPM, 100 000 TPM, 2 requêtes simultanées
Payant : 500 RPM, 2 M TPM, 50 requêtes simultanées
Premium : 5 000 RPM, 50 M TPM, 500 requêtes simultanées

Il existe également une limite de débit basée sur l'adresse IP de 10 000 requêtes par 60 secondes. Ces limites s'appliquent à toutes les API Jina (Embeddings, Reranker, Reader, etc.).
code
Existe-t-il des limites de taille de lot pour les API ?
keyboard_arrow_down
Il n'y a aucune limite de taille de lot pour les API Embeddings et Reranker. Vous pouvez envoyer autant d'éléments ou de documents que nécessaire par requête. Les deux API traitent les entrées par lots en interne, en fonction du nombre de jetons, pour une utilisation optimale du GPU.
Questions courantes liées à la facturation
attach_money
La facturation est-elle basée sur le nombre de phrases ou de demandes ?
keyboard_arrow_down
Notre modèle de tarification est basé sur le nombre total de jetons traités, ce qui donne aux utilisateurs la possibilité d'attribuer ces jetons à un nombre illimité de phrases, offrant ainsi une solution rentable pour diverses exigences d'analyse de texte.
attach_money
Existe-t-il un essai gratuit disponible pour les nouveaux utilisateurs ?
keyboard_arrow_down
Nous offrons un essai gratuit aux nouveaux utilisateurs, comprenant dix millions de jetons utilisables avec tous nos modèles, grâce à une clé API générée automatiquement. Une fois la limite de jetons gratuits atteinte, les utilisateurs peuvent facilement acheter des jetons supplémentaires pour leurs clés API via l'onglet « Acheter des jetons ».
attach_money
Les jetons sont-ils facturés pour les demandes ayant échoué ?
keyboard_arrow_down
Non, les jetons ne sont pas déduits pour les demandes ayant échoué.
attach_money
Quels moyens de paiement sont acceptés ?
keyboard_arrow_down
Les paiements sont traités via Stripe, prenant en charge diverses méthodes de paiement, notamment les cartes de crédit, Google Pay et PayPal, pour votre commodité.
attach_money
La facturation est-elle disponible pour les achats de jetons ?
keyboard_arrow_down
Oui, une facture sera émise à l'adresse e-mail associée à votre compte Stripe lors de l'achat de tokens.
Fondation Recherche
Lecteur
Intégrations
Reclasseur
Service d'inférence élastique
open_in_new
Obtenir la clé API Jina
Limite de taux
Statut de l'API
Entreprise
À propos de nous
Contacter le service commercial
Rédaction
Programme de stage
Télécharger le logo Jina
open_in_new
Télécharger le logo Elastic
open_in_new
Termes
Sécurité
termes et conditions
Confidentialité
Gérer les cookies
email
Élastique © 2020-2026.