Nouvelles
Modèles
API
keyboard_arrow_down
Lecteur
Lisez les URL et effectuez des recherches sur le Web pour de meilleurs LLM de base.
Intégrations
Intégrations multimodales et multilingues de classe mondiale.
Reclasseur
Récupérateur neuronal de classe mondiale pour maximiser la pertinence de la recherche.
MCP terminalCLIarticlellms.txtsmart_toyAgentsdata_objectSchémamenu_bookDocuments



Se connecter
login

Intégrations

Incorporations multimodales multilingues à contexte long les plus performantes pour les applications de recherche, RAG et agents.

API d'intégration

Essayez nos modèles d'intégration de classe mondiale pour améliorer vos systèmes de recherche et RAG. Commencez par un essai gratuit !
keyClé API et facturation
codeUsage
more_horizPlus
chevron_leftchevron_right

home
speedLimite de taux
bug_reportSoulever un problème
help_outlineFAQ
Statut
chevron_leftchevron_right


Exemples d'entrées
Changez-les et voyez comment la réponse change !
Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.
Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.
Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.
针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。
新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

upload
Demande
curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF


v5-text : Nouveaux plongements multilingues de petite taille à l’état de l’art

jina-embeddings-v5-text offre une qualité d'intégration de cinquième génération dans deux tailles efficaces — un petit modèle de 677M et un nano modèle de 239M — avec des adaptateurs LoRA spécifiques à la tâche, des dimensions Matryoshka, un contexte de 32K et une quantification GGUF/MLX pour le déploiement en périphérie, établissant de nouvelles références pour les tâches MMTEB, MTEB English et de récupération.
Lire la note de publicationarrow_forward

v4 : Incorporations universelles pour la recherche multimodale et multilingue

jina-embeddings-v4 est notre avancée la plus significative à ce jour : un modèle de 3,8 milliards de dollars qui intègre du texte et des images via une voie unifiée, prenant en charge la récupération dense et à interaction tardive tout en surpassant les modèles propriétaires de Google, OpenAI et Voyage AI, en particulier sur la récupération de documents visuellement riches.

Deux façons d'acheter

Abonnez-vous à notre API ou achetez via des fournisseurs de cloud.
radio_button_unchecked
cloud
Avec 3 fournisseurs de services cloud
Votre entreprise utilise-t-elle AWS ou Azure ? Déployez ensuite directement nos modèles de fondation de recherche sur ces plateformes dans votre entreprise, afin que vos données restent sécurisées et conformes.
AWS SageMaker
Intégrations
Reclasseur
Microsoft Azure
Intégrations
Reclasseur
Google Cloud
Intégrations
radio_button_checked
Avec l'API Jina Search Foundation
Le moyen le plus simple d'accéder à tous nos produits. Rechargez vos jetons au fur et à mesure.
Rechargez cette clé API avec plus de jetons
Selon votre emplacement, vous pouvez être facturé en USD, EUR ou dans d'autres devises. Des taxes peuvent s'appliquer.
Veuillez saisir la bonne clé API pour recharger
Comprendre la limite de débit
Les limites de débit correspondent au nombre maximal de requêtes pouvant être adressées à une API en une minute par adresse IP/clé API (RPM). Découvrez ci-dessous les limites de débit pour chaque produit et niveau.
keyboard_arrow_down
Limite de taux
Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.
ProduitPoint de terminaison de l'APIDescriptionarrow_upwardsans clé APIkey_offavec clé API gratuitekeyavec clé API payantekeyavec clé API PremiumkeyLatence moyenneComptage de l'utilisation des jetonsDemande autorisée
API de lecteurhttps://r.jina.aiConvertir l'URL en texte compatible LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sComptez le nombre de jetons dans la réponse de sortie.GET/POST
API de lecteurhttps://s.jina.aiRecherchez sur le Web et convertissez les résultats en texte adapté au LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sChaque demande coûte un nombre fixe de jetons, à partir de 10000 jetonsGET/POST
API d'intégrationhttps://api.jina.ai/v1/embeddingsConvertir du texte/des images en vecteurs de longueur fixeblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
help
Comptez le nombre de jetons dans la demande d'entrée.POST
API de reclassementhttps://api.jina.ai/v1/rerankClasser les documents par requêteblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
help
Comptez le nombre de jetons dans la demande d'entrée.POST
API de classificateurhttps://api.jina.ai/v1/trainEntraîner un classificateur à l'aide d'exemples étiquetésblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Les jetons sont comptés comme suit : input_tokens × num_itersPOST
API de classificateur (Coup zéro)https://api.jina.ai/v1/classifyClasser les entrées à l'aide de la classification à coup zéroblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Jetons comptés comme : input_tokens + label_tokensPOST
API de classificateur (Quelques coups)https://api.jina.ai/v1/classifyClasser les entrées à l'aide d'un classificateur à quelques coups entraînéblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Jetons comptés comme : input_tokensPOST
API de segmentationhttps://api.jina.ai/v1/segmentTokeniser et segmenter un texte long20 RPM200 RPM200 RPM1,000 RPM0.3sLe jeton n'est pas comptabilisé comme une utilisation.GET/POST
Recherche profondehttps://deepsearch.jina.ai/v1/chat/completionsRaisonner, rechercher et itérer pour trouver la meilleure réponseblock50 RPM50 RPM500 RPM56.7sComptez le nombre total de jetons dans l’ensemble du processus.POST

Déploiement sur site

Déployez les modèles Jina Embeddings dans AWS Sagemaker et Microsoft Azure, et bientôt dans Google Cloud Services, ou contactez notre équipe commerciale pour obtenir des déploiements Kubernetes personnalisés pour votre cloud privé virtuel et vos serveurs sur site.
AWS SageMaker
Intégrations
Reclasseur
Microsoft Azure
Intégrations
Reclasseur
Google Cloud
Intégrations
Intégrations d'API
Notre API d'intégration est nativement intégrée à diverses bases de données renommées, magasins de vecteurs, frameworks RAG et LLMOps. Pour commencer, copiez et collez simplement votre clé API dans l'une des intégrations répertoriées pour un démarrage rapide et transparent.
Magasin de vecteurs
LLMOps
CHIFFON
Observabilité
open_in_new
MongoDB
open_in_new
DataStax
open_in_new
Qdrant
open_in_new
Pinecone
open_in_new
Chroma
open_in_new
Weaviate
open_in_new
Milvus
open_in_new
Epsilla
open_in_new
MyScale
open_in_new
LlamaIndex
open_in_new
Haystack
open_in_new
Langchain
open_in_new
Dify
open_in_new
SuperDuperDB
open_in_new
DashVector
open_in_new
Portkey
open_in_new
Baseten
open_in_new
TiDB
open_in_new
LanceDB
open_in_new
Carbon

Nos publications

Découvrez comment nos modèles de recherche de frontière ont été formés à partir de zéro, consultez nos dernières publications. Rencontrez notre équipe chez EMNLP, SIGIR, ICLR, NeurIPS et ICML !
arXiv
février 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
arXiv
février 11, 2026
Embedding Inversion via Conditional Masked Diffusion Language Models
ICLR 2026
janvier 22, 2026
Embedding Compression via Spherical Coordinates
arXiv
décembre 29, 2025
Vision Encoders in Vision-Language Models: A Survey
ICLR 2026
décembre 04, 2025
Jina-VLM: Small Multilingual Vision Language Model
AAAI 2026
octobre 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
NeurIPS 2025
août 31, 2025
Efficient Code Embeddings from Code Generation Models
EMNLP 2025
juin 24, 2025
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval
ICLR 2025
mars 04, 2025
ReaderLM-v2: Small Language Model for HTML to Markdown and JSON
ACL 2025
décembre 17, 2024
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark
ICLR 2025
décembre 12, 2024
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images
ECIR 2025
septembre 18, 2024
jina-embeddings-v3: Multilingual Embeddings With Task LoRA
SIGIR 2025
septembre 07, 2024
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models
EMNLP 2024
août 30, 2024
Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever
WWW 2025
juin 21, 2024
Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models
ICML 2024
mai 30, 2024
Jina CLIP: Your CLIP Model Is Also Your Text Retriever
arXiv
février 26, 2024
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings
arXiv
octobre 30, 2023
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents
EMNLP 2023
juillet 20, 2023
Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models
19 publications au total.

En savoir plus sur les intégrations

Par où commencer avec les intégrations ? Nous avons ce qu'il vous faut. Découvrez les intégrations de A à Z avec notre guide complet.
Abstract illustration of a sound wave or heartbeat, formed by blue, orange, and gray dots on a white background.
mars 11, 2026 • 7 minutes lues
Bootstrapping Audio Embeddings from Multimodal LLMs
Turn any multimodal LLM into a small audio embedding model that beats CLAP with 25x less data.
Han Xiao
Fingerprint illustration made from numbers, showcasing digital and high-tech design on a light background.
mars 06, 2026 • 6 minutes lues
Identifying Embedding Models from Raw Numerical Values
A tiny transformer that fingerprints embedding models by reading raw numerical digits. No feature engineering.
Han Xiao
Abstract digital artwork in black and white, featuring scattered dots forming letters in a halftone effect. The central lette
février 19, 2026 • 7 minutes lues
jina-embeddings-v5-text: New SOTA Small Multilingual Embeddings
Two sub-1B multilingual embeddings with best-in-class performance, available on Elastic Inference Service, Llama.cpp and MLX.
Han Xiao
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
février 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
Text embedding models are widely used for semantic similarity tasks, including information retrieval, clustering, and classification. General-purpose models are typically trained with single- or multi-stage processes using contrastive loss functions. We introduce a novel training regimen that combines model distillation techniques with task-specific contrastive loss to produce compact, high-performance embedding models. Our findings suggest that this approach is more effective for training small models than purely contrastive or distillation-based training paradigms alone. Benchmark scores for the resulting models, jina-embeddings-v5-text-small and jina-embeddings-v5-text-nano, exceed or match the state-of-the-art for models of similar size. jina-embeddings-v5-text models additionally support long texts (up to 32k tokens) in many languages, and generate embeddings that remain robust under truncation and binary quantization. Model weights are publicly available, hopefully inspiring further advances in embedding model development.

Comparaison de Reranker, Vector Search et BM25

Le tableau ci-dessous fournit une comparaison complète du Reranker, de la recherche Vector/Embeddings et du BM25, mettant en évidence leurs forces et leurs faiblesses dans diverses catégories.
ReclasseurRecherche de vecteursBM25
Meilleur pourPrécision et pertinence de recherche amélioréesFiltrage initial et rapideRécupération de texte générale pour des requêtes étendues
GranularitéDétaillé : sous-document et segment de requêteLarge : documents entiersIntermédiaire : divers segments de texte
Complexité du temps de requêteHautMoyenFaible
Complexité du temps d’indexationNon requisHautFaible, utilise un index prédéfini
Complexité du temps de formationHautHautNon requis
Qualité de la rechercheSupérieur pour les requêtes nuancéesÉquilibré entre efficacité et précisionCohérent et fiable pour un large éventail de requêtes
ForcesTrès précis avec une compréhension contextuelle approfondieRapide et efficace, avec une précision modéréeHautement évolutif, avec une efficacité établie
Essayez l'API de reclassement gratuitementEssayez d'intégrer l'API gratuitement

L'évolution des intégrations Poster

Découvrez l'affiche idéale pour votre espace, présentant des infographies captivantes ou des visuels à couper le souffle retraçant l'évolution des modèles d'intégration de texte depuis 1950.
Découvrez comment nous l'avons fait
shopping_cartAcheter une copie papier

FAQ

Comment les modèles d'intégration Jina ont-ils été entraînés ?
keyboard_arrow_down
Pour des informations détaillées sur nos processus de formation, nos sources de données et nos évaluations, veuillez vous référer à nos rapports techniques sur arXiv pour jina-embeddings-v3 et jina-embeddings-v4.
launcharXiv
Quels sont vos modèles d'intégration multimodaux ?
keyboard_arrow_down
jina-embeddings-v4 est notre dernier modèle multimodal universel (3,8 milliards de paramètres) prenant en charge le texte et les images avec un contexte de 32 Ko, la recherche dense et la recherche en interaction tardive, et des performances de pointe sur les documents visuellement riches. jina-clip-v2 est une option plus légère (865 millions de paramètres) prenant en charge 89 langues avec une résolution d'image de 512x512 et des représentations de type Matriochka. Les deux excellent dans les tâches de recherche texte-texte, texte-image et image-image.
launcharXiv
Quelles langues vos modèles prennent-ils en charge ?
keyboard_arrow_down
Les modules jina-embeddings-v4 et jina-embeddings-v3 prennent tous deux en charge 89 langues et offrent d'excellentes performances multilingues. Parmi les 30 langues les plus utilisées figurent : l'arabe, le bengali, le chinois, le danois, le néerlandais, l'anglais, le finnois, le français, le géorgien, l'allemand, le grec, l'hindi, l'indonésien, l'italien, le japonais, le coréen, le letton, le norvégien, le polonais, le portugais, le roumain, le russe, le slovaque, l'espagnol, le suédois, le thaï, le turc, l'ukrainien, l'ourdou et le vietnamien. Le module jina-clip-v2 prend également en charge 89 langues pour les tâches multimodales.
launcharXiv
Quelle est la longueur maximale d’une seule phrase saisie ?
keyboard_arrow_down
La longueur du contexte varie selon le modèle : `jina-embeddings-v4` prend en charge jusqu’à 32 000 jetons, tandis que `jina-embeddings-v3` et `jina-clip-v2` en prennent en charge jusqu’à 8 192. Un jeton peut aller d’un seul caractère à un mot entier. Ce contexte étendu permet une analyse documentaire complète et une meilleure compréhension du contexte pour les données textuelles volumineuses.
Quel est le nombre maximum de phrases que je peux inclure dans une seule demande ?
keyboard_arrow_down
Il n'y a pas de limite stricte au nombre d'éléments par requête. L'API regroupe les entrées en interne par nombre de jetons pour une utilisation optimale du GPU. Vous pouvez envoyer autant de textes ou d'images que nécessaire dans une seule requête.
Comment envoyer des images à des modèles d'intégration multimodaux ?
keyboard_arrow_down
Pour `jina-embeddings-v4`, `jina-clip-v2` et `jina-clip-v1`, vous pouvez utiliser `url` ou `bytes` dans le champ `input` de la requête API. Pour `url`, indiquez l'URL de l'image à traiter. Pour `bytes`, encodez l'image au format base64. `jina-embeddings-v4` peut également intégrer directement des documents PDF en fournissant une URL PDF ou des octets PDF encodés en base64.
Comment les modèles Jina Embeddings se comparent-ils aux derniers embeddings d'OpenAI et de Cohere ?
keyboard_arrow_down
jina-embeddings-v4 est notre tout dernier modèle phare, atteignant l'état de l'art en matière de recherche de documents visuellement riches (ViDoRe) et sur des benchmarks multimodaux. Pour les tâches textuelles uniquement, jina-embeddings-v3 surpasse OpenAI et Cohere sur les benchmarks MTEB anglais et multilingue, tout en étant plus compact et plus efficace. Les deux modèles prennent en charge l'apprentissage par représentation Matryoshka (MRL), permettant une réduction de la dimensionnalité (jusqu'à 32 pour v3 et 128 pour v4) sans perte de performance significative.
Dans quelle mesure la transition entre Text-Embedding-3-Large d'OpenAI et votre solution est-elle transparente ?
keyboard_arrow_down
La transition est simplifiée, car notre point de terminaison d'API correspond aux schémas JSON d'entrée et de sortie du modèle text-embedding-3-large d'OpenAI. Cette compatibilité garantit que les utilisateurs peuvent facilement remplacer le modèle OpenAI par le nôtre lorsqu'ils utilisent le point de terminaison d'OpenAI.
Comment les jetons sont-ils calculés lors de l'utilisation des modèles jina-clip ?
keyboard_arrow_down
Les jetons sont calculés en fonction de la longueur du texte et de la taille de l'image. Pour le texte de la requête, les jetons sont comptabilisés de manière standard. Pour les images, les étapes suivantes sont suivies : 1. Taille des tuiles : Chaque image est divisée en tuiles. Pour jina-embeddings-v4, les tuiles mesurent 28 x 28 pixels, pour jina-clip-v2, 512 x 512 pixels, et pour jina-clip-v1, 224 x 224 pixels. 2. Couverture : Le nombre de tuiles nécessaires pour couvrir l'image d'entrée est calculé. Même si les dimensions de l'image ne sont pas parfaitement divisibles par la taille de la tuile, les tuiles partielles sont comptées comme des tuiles complètes. 3. Nombre total de tuiles : Le nombre total de tuiles couvrant l'image détermine le coût. Par exemple, une image de 600 x 600 pixels serait couverte par 22 x 22 tuiles (484 tuiles) dans jina-embeddings-v4, par 2 x 2 tuiles (4 tuiles) dans jina-clip-v2 et par 3 x 3 tuiles (9 tuiles) dans jina-clip-v1. 4. Calcul du coût : Pour jina-embeddings-v4, chaque tuile coûte 10 jetons, pour jina-clip-v2, chaque tuile coûte 4 000 jetons, tandis que pour jina-clip-v1, chaque tuile coûte 1 000 jetons. Exemple : Pour une image de 600 x 600 pixels : • Avec jina-embeddings-v4 • L’image est divisée en tuiles de 28 x 28 pixels. • Le nombre total de tuiles requises est de 22 (horizontales) x 22 (verticales) = 484 tuiles. • Le coût de jina-embeddings-v4 sera de 484 x 10 = 4 840 jetons. • Avec jina-clip-v2 • L'image est divisée en tuiles de 512 x 512 pixels. • Le nombre total de tuiles requises est de 2 (horizontales) x 2 (verticales) = 4 tuiles. • Le coût de jina-clip-v2 sera de 4 x 4 000 = 16 000 jetons. • Avec jina-clip-v1 • L'image est divisée en tuiles de 224 x 224 pixels. • Le nombre total de tuiles requises est de 3 (horizontales) x 3 (verticales) = 9 tuiles. • Le coût de jina-clip-v1 sera de 9*1000 = 9000 jetons.
Fournissez-vous des modèles pour intégrer des images ou du son ?
keyboard_arrow_down
Oui, jina-clip-v2 et jina-clip-v1 peuvent intégrer à la fois des images et des textes. L'intégration de modèles sur d'autres modalités sera annoncée prochainement !
Les modèles Jina Embedding peuvent-ils être ajustés avec des données privées ou d’entreprise ?
keyboard_arrow_down
Pour toute question concernant le réglage fin de nos modèles avec des données spécifiques, veuillez nous contacter pour discuter de vos besoins. Nous sommes ouverts à l’exploration de la manière dont nos modèles peuvent être adaptés pour répondre à vos besoins.
Contact
Vos points de terminaison peuvent-ils être hébergés en privé sur AWS, Azure ou GCP ?
keyboard_arrow_down
Oui, nos services sont disponibles sur les marketplaces AWS, Azure et GCP. Si vous avez des besoins spécifiques, veuillez nous contacter à sales AT jina.ai.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
Qu’est-ce que le paramètre « task » et quand dois-je l’utiliser ?
keyboard_arrow_down
Le paramètre `task` dans `jina-embeddings-v3` et `jina-embeddings-v4` active les adaptateurs LoRA spécifiques à la tâche pour des performances optimales. Utilisez `retrieval.query` pour les requêtes de recherche, `retrieval.passage` pour les documents à analyser, `text-matching` pour la similarité sémantique, `classification` pour la classification de texte et `separation` pour les tâches de clustering.
Qu’est-ce que la récupération d’interactions tardives et quels modèles la prennent en charge ?
keyboard_arrow_down
Le modèle `jina-embeddings-v4` prend en charge la recherche dense (vecteur unique) et la recherche à interaction tardive (vecteurs multiples) via le paramètre `output_type`. La recherche à interaction tardive préserve des informations plus fines au niveau des jetons, ce qui améliore la précision de la recherche pour les requêtes complexes. Le modèle `jina-colbert-v2` est un modèle dédié à la recherche à interaction tardive.
Qu’est-ce que le découpage tardif et quand dois-je l’utiliser ?
keyboard_arrow_down
Le découpage tardif est une technique qui consiste à intégrer d'abord l'intégralité du document à l'aide de modèles à contexte long, puis à extraire les représentations vectorielles des segments à partir des tokens. Contrairement au découpage classique (segmentation puis intégration), le découpage tardif préserve le contexte inter-segments, améliorant ainsi la recherche pour les applications RAG. Activez-le via le paramètre `late_chunking` dans `jina-embeddings-v3`.
Pourquoi l'API prend-elle en charge une longueur de contexte différente de la capacité maximale du modèle ?
keyboard_arrow_down
Bien que certains de nos modèles d'intégration soient conçus pour traiter des contextes plus longs, l'API peut imposer des limites inférieures en raison des contraintes de mémoire vidéo (VRAM) du GPU dans notre infrastructure d'inférence. Le traitement de séquences très longues exige une quantité importante de mémoire, et nous optimisons notre configuration de service afin d'équilibrer débit, latence et coût pour la plupart des cas d'utilisation. Si vous avez besoin d'une prise en charge étendue des contextes, veuillez contacter notre équipe commerciale pour discuter des options de déploiement dédiées.
Pourquoi jina-embeddings-v4 est-il gratuit, et pourquoi est-il lent ?
keyboard_arrow_down
Le modèle `jina-embeddings-v4` est basé sur le modèle Qwen2-VL, distribué sous licence de recherche Qwen. Cette licence autorise uniquement la recherche et une utilisation non commerciale ; nous ne pouvons donc pas commercialiser `jina-embeddings-v4`. Par conséquent, l'accès au modèle est gratuit via notre API. `jina-embeddings-v4` peut sembler plus lent que d'autres modèles pour deux raisons : premièrement, il est nettement plus volumineux que `jina-embeddings-v3`, ce qui implique un temps de calcul plus important par requête ; deuxièmement, l'impossibilité de commercialiser ce modèle nous oblige à limiter le débit de l'API afin de maîtriser les coûts d'infrastructure. Les utilisateurs ne doivent donc pas s'attendre à un débit élevé ou de niveau production avec l'API `jina-embeddings-v4`. Pour les charges de travail de production nécessitant un débit plus élevé, nous recommandons d'utiliser jina-embeddings-v3 ou de déployer jina-embeddings-v4 sur votre propre infrastructure via Hugging Face.
Quelles sont les limites de débit de l'API Embeddings ?
keyboard_arrow_down
Les limites de débit dépendent du type de votre clé API :

Gratuit : 100 tr/min, 100 000 TPM, 2 requêtes simultanées
Payant : 500 tr/min, 2 millions de TPM, 50 requêtes simultanées
Premium : 5 000 tr/min, 50 millions de TPM, 500 requêtes simultanées

De plus, une limite de débit de 10 000 requêtes par adresse IP et par période de 60 secondes est appliquée afin de prévenir les abus. Si vous avez besoin de limites supérieures, veuillez contacter notre équipe commerciale.
Quelles sont les limites de longueur de contexte pour chaque modèle d'intégration ?
keyboard_arrow_down
Chaque modèle a une longueur de contexte maximale par entrée :

jina-embeddings-v4 : 32 768 jetons
jina-embeddings-v3 : 8 192 jetons
jina-embeddings-v2-* : 8 192 jetons
jina-clip-v1/v2 : 8 192 jetons
jina-colbert-v1/v2 : 8 192 jetons
jina-code-embeddings-* : 32 768 jetons

Les entrées dépassant la limite renverront une erreur, sauf si truncate: true est défini, ce qui tronque automatiquement à la longueur maximale.
Quelles sont les limites de taille des fichiers image et PDF ?
keyboard_arrow_down
Taille maximale des fichiers : Images : 5 Mo, PDF : 8 Mo. Les fichiers plus volumineux seront rejetés et un message d’erreur s’affichera.

Comment obtenir ma clé API ?

video_not_supported

Quelle est la limite de débit ?

Limite de taux
Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.
ProduitPoint de terminaison de l'APIDescriptionarrow_upwardsans clé APIkey_offavec clé API gratuitekeyavec clé API payantekeyavec clé API PremiumkeyLatence moyenneComptage de l'utilisation des jetonsDemande autorisée
API de lecteurhttps://r.jina.aiConvertir l'URL en texte compatible LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sComptez le nombre de jetons dans la réponse de sortie.GET/POST
API de lecteurhttps://s.jina.aiRecherchez sur le Web et convertissez les résultats en texte adapté au LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sChaque demande coûte un nombre fixe de jetons, à partir de 10000 jetonsGET/POST
API d'intégrationhttps://api.jina.ai/v1/embeddingsConvertir du texte/des images en vecteurs de longueur fixeblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
help
Comptez le nombre de jetons dans la demande d'entrée.POST
API de reclassementhttps://api.jina.ai/v1/rerankClasser les documents par requêteblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
help
Comptez le nombre de jetons dans la demande d'entrée.POST
API de classificateurhttps://api.jina.ai/v1/trainEntraîner un classificateur à l'aide d'exemples étiquetésblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Les jetons sont comptés comme suit : input_tokens × num_itersPOST
API de classificateur (Coup zéro)https://api.jina.ai/v1/classifyClasser les entrées à l'aide de la classification à coup zéroblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Jetons comptés comme : input_tokens + label_tokensPOST
API de classificateur (Quelques coups)https://api.jina.ai/v1/classifyClasser les entrées à l'aide d'un classificateur à quelques coups entraînéblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
dépend de la taille de l'entrée
Jetons comptés comme : input_tokensPOST
API de segmentationhttps://api.jina.ai/v1/segmentTokeniser et segmenter un texte long20 RPM200 RPM200 RPM1,000 RPM0.3sLe jeton n'est pas comptabilisé comme une utilisation.GET/POST
Recherche profondehttps://deepsearch.jina.ai/v1/chat/completionsRaisonner, rechercher et itérer pour trouver la meilleure réponseblock50 RPM50 RPM500 RPM56.7sComptez le nombre total de jetons dans l’ensemble du processus.POST

Ai-je besoin d’une licence commerciale ?

Auto-vérification de la licence CC BY-NC

play_arrow
Utilisez-vous notre API officielle ou nos images officielles sur Azure, AWS ou GCP ?
play_arrow
Oui
Aucune restriction. Inscrivez-vous simplement et payez via notre site web ou notre plateforme cloud.
play_arrow
Non
play_arrow
Êtes-vous un client Elastic payant ?
play_arrow
Oui
L'utilisation commerciale est probablement déjà incluse dans votre licence Elastic. En cas de doute, contactez votre représentant commercial Elastic.
Contacter le service commercial
play_arrow
Non
Nous ne sommes actuellement pas en mesure de délivrer des contrats de licence commerciale indépendants. Veuillez contacter le service commercial d'Elastic pour plus d'informations.
Contacter le service commercial
Questions courantes liées à l'API
code
Puis-je utiliser la même clé API pour les API de lecture, d'intégration, de reclassement, de classification et de réglage fin ?
keyboard_arrow_down
Oui, la même clé API est valable pour tous les produits de recherche de Jina AI. Cela inclut les API de lecture, d'intégration, de reclassement, de classification et de réglage fin, avec des jetons partagés entre tous les services.
code
Puis-je surveiller l’utilisation des jetons de ma clé API ?
keyboard_arrow_down
Oui, l'utilisation des jetons peut être surveillée dans l'onglet « Clé API et facturation » en saisissant votre clé API, ce qui vous permet d'afficher l'historique d'utilisation récent et les jetons restants. Si vous êtes connecté au tableau de bord de l'API, ces détails peuvent également être consultés dans l'onglet « Gérer la clé API ».
code
Que dois-je faire si j'oublie ma clé API ?
keyboard_arrow_down
Si vous avez égaré une clé rechargée et souhaitez la récupérer, veuillez contacter le support AT jina.ai avec votre adresse e-mail enregistrée pour obtenir de l'aide. Il est recommandé de vous connecter pour conserver votre clé API en toute sécurité et facilement accessible.
Contact
code
Les clés API expirent-elles ?
keyboard_arrow_down
Non, nos clés API n'ont pas de date d'expiration. Cependant, si vous pensez que votre clé a été compromise et souhaitez la retirer, veuillez contacter notre équipe d'assistance pour obtenir de l'aide. Vous pouvez également révoquer votre clé dans le tableau de bord de gestion des clés API.
Contact
code
Puis-je transférer des jetons entre des clés API ?
keyboard_arrow_down
Oui, vous pouvez transférer des jetons d'une clé premium vers une autre. Après vous être connecté à votre compte sur le tableau de bord de gestion des clés API, utilisez les paramètres de la clé que vous souhaitez transférer pour déplacer tous les jetons payants restants.
code
Puis-je révoquer ma clé API ?
keyboard_arrow_down
Oui, vous pouvez révoquer votre clé API si vous pensez qu'elle a été compromise. La révocation d'une clé la désactivera immédiatement pour tous les utilisateurs qui l'ont stockée, et tout le solde restant et les propriétés associées seront définitivement inutilisables. Si la clé est une clé premium, vous avez la possibilité de transférer le solde restant payé vers une autre clé avant la révocation. Notez que cette action ne peut pas être annulée. Pour révoquer une clé, accédez aux paramètres de clé dans le tableau de bord de gestion des clés API.
code
Pourquoi la première demande de certains modèles est-elle lente ?
keyboard_arrow_down
Cela est dû au fait que notre architecture sans serveur décharge certains modèles pendant les périodes de faible utilisation. La requête initiale active ou « réchauffe » le modèle, ce qui peut prendre quelques secondes. Après cette activation initiale, les requêtes suivantes sont traitées beaucoup plus rapidement.
code
Mes données API sont-elles utilisées pour entraîner vos modèles ?
keyboard_arrow_down
Non. Nous n'utilisons jamais vos requêtes API, vos entrées ni vos sorties pour entraîner nos modèles d'embeddings, de reranking ou tout autre modèle. Vos données restent votre propriété. Nous sommes conformes aux normes SOC 2 de type I et de type II.
code
Quelles sont les limites de débit des API Jina ?
keyboard_arrow_down
Des limites de débit s'appliquent par clé API :

Gratuit : 100 RPM, 100 000 TPM, 2 requêtes simultanées
Payant : 500 RPM, 2 M TPM, 50 requêtes simultanées
Premium : 5 000 RPM, 50 M TPM, 500 requêtes simultanées

Il existe également une limite de débit basée sur l'adresse IP de 10 000 requêtes par 60 secondes. Ces limites s'appliquent à toutes les API Jina (Embeddings, Reranker, Reader, etc.).
code
Existe-t-il des limites de taille de lot pour les API ?
keyboard_arrow_down
Il n'y a aucune limite de taille de lot pour les API Embeddings et Reranker. Vous pouvez envoyer autant d'éléments ou de documents que nécessaire par requête. Les deux API traitent les entrées par lots en interne, en fonction du nombre de jetons, pour une utilisation optimale du GPU.
Questions courantes liées à la facturation
attach_money
La facturation est-elle basée sur le nombre de phrases ou de demandes ?
keyboard_arrow_down
Notre modèle de tarification est basé sur le nombre total de jetons traités, ce qui donne aux utilisateurs la possibilité d'attribuer ces jetons à un nombre illimité de phrases, offrant ainsi une solution rentable pour diverses exigences d'analyse de texte.
attach_money
Existe-t-il un essai gratuit disponible pour les nouveaux utilisateurs ?
keyboard_arrow_down
Nous offrons un essai gratuit aux nouveaux utilisateurs, comprenant dix millions de jetons utilisables avec tous nos modèles, grâce à une clé API générée automatiquement. Une fois la limite de jetons gratuits atteinte, les utilisateurs peuvent facilement acheter des jetons supplémentaires pour leurs clés API via l'onglet « Acheter des jetons ».
attach_money
Les jetons sont-ils facturés pour les demandes ayant échoué ?
keyboard_arrow_down
Non, les jetons ne sont pas déduits pour les demandes ayant échoué.
attach_money
Quels moyens de paiement sont acceptés ?
keyboard_arrow_down
Les paiements sont traités via Stripe, prenant en charge diverses méthodes de paiement, notamment les cartes de crédit, Google Pay et PayPal, pour votre commodité.
attach_money
La facturation est-elle disponible pour les achats de jetons ?
keyboard_arrow_down
Oui, une facture sera émise à l'adresse e-mail associée à votre compte Stripe lors de l'achat de tokens.
Des bureaux
location_on
Sunnyvale, Californie
710 Lakeway Dr, Ste 200, Sunnyvale, CA 94085, États-Unis
location_on
Berlin, Allemagne
Prinzessinnenstraße 19-20, 10969 Berlin, Allemagne
Fondation Recherche
Lecteur
Intégrations
Reclasseur
Obtenir la clé API Jina
Limite de taux
Statut de l'API
Entreprise
À propos de nous
Contacter le service commercial
Rédaction
Programme de stage
Télécharger le logo Jina
open_in_new
Télécharger le logo Elastic
open_in_new
Termes
Sécurité
termes et conditions
Confidentialité
Gérer les cookies
email
Jina AI par Elastic © 2020-2026.