Intégrations

Incorporations multimodales multilingues à contexte long les plus performantes pour les applications de recherche, RAG et agents.

API d'intégration

Essayez nos modèles d'intégration de classe mondiale pour améliorer vos systèmes de recherche et RAG. Commencez par un essai gratuit !

Limite de taux

Soulever un problème

FAQ

Statut

Sélectionnez les intégrations

Normalisation L2

Mettre à l'échelle les plongements lexicaux à une longueur unitaire (norme L2 = 1). Nécessaire pour la similarité cosinus via le produit scalaire.

Type de données de sortie

embedding_type

encoding_format

output_dtype

embedding_types

Choisissez le format de sortie : float (par défaut), binaire (stockage compact) ou base64 (transmission efficace).

Par défaut (comme float)

Exemples d'entrées

Changez-les et voyez comment la réponse change !

Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.

Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.

Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.

针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。

新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

Demande

Bash

Langue

curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF

Clé API

Jetons disponibles

C'est votre clé unique. Conservez-la en toute sécurité !

v5-text : Nouveaux plongements multilingues de petite taille à l’état de l’art

jina-embeddings-v5-text offre une qualité d'intégration de cinquième génération dans deux tailles efficaces — un petit modèle de 677M et un nano modèle de 239M — avec des adaptateurs LoRA spécifiques à la tâche, des dimensions Matryoshka, un contexte de 32K et une quantification GGUF/MLX pour le déploiement en périphérie, établissant de nouvelles références pour les tâches MMTEB, MTEB English et de récupération.

v4 : Incorporations universelles pour la recherche multimodale et multilingue

jina-embeddings-v4 est notre avancée la plus significative à ce jour : un modèle de 3,8 milliards de dollars qui intègre du texte et des images via une voie unifiée, prenant en charge la récupération dense et à interaction tardive tout en surpassant les modèles propriétaires de Google, OpenAI et Voyage AI, en particulier sur la récupération de documents visuellement riches.

Deux façons d'acheter

Abonnez-vous à notre API ou achetez via des fournisseurs de cloud.

Avec 3 fournisseurs de services cloud

Votre entreprise utilise-t-elle AWS ou Azure ? Déployez ensuite directement nos modèles de fondation de recherche sur ces plateformes dans votre entreprise, afin que vos données restent sécurisées et conformes.

Avec l'API Jina Search Foundation

Le moyen le plus simple d'accéder à tous nos produits. Rechargez vos jetons au fur et à mesure.

Saisissez la clé API que vous souhaitez recharger

Rechargez cette clé API avec plus de jetons

Selon votre emplacement, vous pouvez être facturé en USD, EUR ou dans d'autres devises. Des taxes peuvent s'appliquer.

Veuillez saisir la bonne clé API pour recharger

Comprendre la limite de débit

Les limites de débit correspondent au nombre maximal de requêtes pouvant être adressées à une API en une minute par adresse IP/clé API (RPM). Découvrez ci-dessous les limites de débit pour chaque produit et niveau.

Limite de taux

Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.

Colonnes

Produit	Point de terminaison de l'API	Description	sans clé API	avec clé API gratuite	avec clé API payante	avec clé API Premium	Latence moyenne	Comptage de l'utilisation des jetons	Demande autorisée
API de lecteur	`https://r.jina.ai`	Convertir l'URL en texte compatible LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Comptez le nombre de jetons dans la réponse de sortie.	GET/POST
API de lecteur	`https://s.jina.ai`	Recherchez sur le Web et convertissez les résultats en texte adapté au LLM		100 RPM	100 RPM	1000 RPM	2.5s	Chaque demande coûte un nombre fixe de jetons, à partir de 10000 jetons	GET/POST
API d'intégration	`https://api.jina.ai/v1/embeddings`	Convertir du texte/des images en vecteurs de longueur fixe		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dépend de la taille de l'entrée	Comptez le nombre de jetons dans la demande d'entrée.	POST
API de reclassement	`https://api.jina.ai/v1/rerank`	Classer les documents par requête		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dépend de la taille de l'entrée	Comptez le nombre de jetons dans la demande d'entrée.	POST
API de classificateur	`https://api.jina.ai/v1/train`	Entraîner un classificateur à l'aide d'exemples étiquetés		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Les jetons sont comptés comme suit : input_tokens × num_iters	POST
API de classificateur (Coup zéro)	`https://api.jina.ai/v1/classify`	Classer les entrées à l'aide de la classification à coup zéro		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Jetons comptés comme : input_tokens + label_tokens	POST
API de classificateur (Quelques coups)	`https://api.jina.ai/v1/classify`	Classer les entrées à l'aide d'un classificateur à quelques coups entraîné		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Jetons comptés comme : input_tokens	POST
API de segmentation	`https://api.jina.ai/v1/segment`	Tokeniser et segmenter un texte long	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Le jeton n'est pas comptabilisé comme une utilisation.	GET/POST
Recherche profonde	`https://deepsearch.jina.ai/v1/chat/completions`	Raisonner, rechercher et itérer pour trouver la meilleure réponse		50 RPM	50 RPM	500 RPM	56.7s	Comptez le nombre total de jetons dans l’ensemble du processus.	POST

Recharge automatique en cas de faible solde de jetons

Recommandé pour un service ininterrompu en production. Lorsque le solde de votre token descend en dessous du seuil défini, nous rechargerons automatiquement votre mode de paiement enregistré pour le dernier forfait acheté, jusqu'à ce que le seuil soit atteint.

Nous avons introduit un nouveau modèle de tarification le 6 mai 2025. Si vous avez activé la recharge automatique avant cette date, vous continuerez à payer l'ancien prix (celui appliqué lors de l'achat). La nouvelle tarification s'applique uniquement si vous modifiez vos paramètres de recharge automatique ou achetez une nouvelle clé API.

< 1M Jetons

Rechargez quand

Déploiement sur site

Déployez les modèles Jina Embeddings dans AWS Sagemaker et Microsoft Azure, et bientôt dans Google Cloud Services, ou contactez notre équipe commerciale pour obtenir des déploiements Kubernetes personnalisés pour votre cloud privé virtuel et vos serveurs sur site.

AWS SageMaker

Intégrations

Reclasseur

Microsoft Azure

Intégrations

Reclasseur

Google Cloud

Intégrations

Intégrations d'API

Notre API d'intégration est nativement intégrée à diverses bases de données renommées, magasins de vecteurs, frameworks RAG et LLMOps. Pour commencer, copiez et collez simplement votre clé API dans l'une des intégrations répertoriées pour un démarrage rapide et transparent.

Magasin de vecteurs

LLMOps

CHIFFON

Observabilité

MongoDB

DataStax

Qdrant

Pinecone

Chroma

Weaviate

Milvus

Epsilla

MyScale

LlamaIndex

Haystack

Langchain

Dify

SuperDuperDB

DashVector

Portkey

Baseten

TiDB

LanceDB

Carbon

Nos publications

Découvrez comment nos modèles de recherche de frontière ont été formés à partir de zéro, consultez nos dernières publications. Rencontrez notre équipe chez EMNLP, SIGIR, ICLR, NeurIPS et ICML !

arXiv

février 17, 2026

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

arXiv

février 11, 2026

Embedding Inversion via Conditional Masked Diffusion Language Models

ICLR 2026

janvier 22, 2026

Embedding Compression via Spherical Coordinates

arXiv

décembre 29, 2025

Vision Encoders in Vision-Language Models: A Survey

ICLR 2026

décembre 04, 2025

Jina-VLM: Small Multilingual Vision Language Model

AAAI 2026

octobre 01, 2025

jina-reranker-v3: Last but Not Late Interaction for Document Reranking

NeurIPS 2025

août 31, 2025

Efficient Code Embeddings from Code Generation Models

EMNLP 2025

juin 24, 2025

jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval

ICLR 2025

mars 04, 2025

ReaderLM-v2: Small Language Model for HTML to Markdown and JSON

ACL 2025

décembre 17, 2024

AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark

ICLR 2025

décembre 12, 2024

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

ECIR 2025

septembre 18, 2024

jina-embeddings-v3: Multilingual Embeddings With Task LoRA

SIGIR 2025

septembre 07, 2024

Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models

EMNLP 2024

août 30, 2024

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

WWW 2025

juin 21, 2024

Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models

ICML 2024

mai 30, 2024

Jina CLIP: Your CLIP Model Is Also Your Text Retriever

arXiv

février 26, 2024

Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings

arXiv

octobre 30, 2023

Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents

EMNLP 2023

juillet 20, 2023

Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models

19 publications au total.

En savoir plus sur les intégrations

Par où commencer avec les intégrations ? Nous avons ce qu'il vous faut. Découvrez les intégrations de A à Z avec notre guide complet.

Comparaison de Reranker, Vector Search et BM25

Le tableau ci-dessous fournit une comparaison complète du Reranker, de la recherche Vector/Embeddings et du BM25, mettant en évidence leurs forces et leurs faiblesses dans diverses catégories.

	Reclasseur	Recherche de vecteurs	BM25
Meilleur pour	Précision et pertinence de recherche améliorées	Filtrage initial et rapide	Récupération de texte générale pour des requêtes étendues
Granularité	Détaillé : sous-document et segment de requête	Large : documents entiers	Intermédiaire : divers segments de texte
Complexité du temps de requête	Haut	Moyen	Faible
Complexité du temps d’indexation	Non requis	Haut	Faible, utilise un index prédéfini
Complexité du temps de formation	Haut	Haut	Non requis
Qualité de la recherche	Supérieur pour les requêtes nuancées	Équilibré entre efficacité et précision	Cohérent et fiable pour un large éventail de requêtes
Forces	Très précis avec une compréhension contextuelle approfondie	Rapide et efficace, avec une précision modérée	Hautement évolutif, avec une efficacité établie
	Essayez l'API de reclassement gratuitement	Essayez d'intégrer l'API gratuitement

L'évolution des intégrations Poster

Découvrez l'affiche idéale pour votre espace, présentant des infographies captivantes ou des visuels à couper le souffle retraçant l'évolution des modèles d'intégration de texte depuis 1950.

Découvrez comment nous l'avons fait

Acheter une copie papier

FAQ

Comment les modèles d'intégration Jina ont-ils été entraînés ?

Quels sont vos modèles d'intégration multimodaux ?

Quelles langues vos modèles prennent-ils en charge ?

Quelle est la longueur maximale d’une seule phrase saisie ?

Quel est le nombre maximum de phrases que je peux inclure dans une seule demande ?

Comment envoyer des images à des modèles d'intégration multimodaux ?

Comment les modèles Jina Embeddings se comparent-ils aux derniers embeddings d'OpenAI et de Cohere ?

Dans quelle mesure la transition entre Text-Embedding-3-Large d'OpenAI et votre solution est-elle transparente ?

Comment les jetons sont-ils calculés lors de l'utilisation des modèles jina-clip ?

Fournissez-vous des modèles pour intégrer des images ou du son ?

Les modèles Jina Embedding peuvent-ils être ajustés avec des données privées ou d’entreprise ?

Vos points de terminaison peuvent-ils être hébergés en privé sur AWS, Azure ou GCP ?

Qu’est-ce que le paramètre « task » et quand dois-je l’utiliser ?

Qu’est-ce que la récupération d’interactions tardives et quels modèles la prennent en charge ?

Qu’est-ce que le découpage tardif et quand dois-je l’utiliser ?

Pourquoi l'API prend-elle en charge une longueur de contexte différente de la capacité maximale du modèle ?

Pourquoi jina-embeddings-v4 est-il gratuit, et pourquoi est-il lent ?

Quelles sont les limites de débit de l'API Embeddings ?

Quelles sont les limites de longueur de contexte pour chaque modèle d'intégration ?

Quelles sont les limites de taille des fichiers image et PDF ?

Comment obtenir ma clé API ?

Quelle est la limite de débit ?

Limite de taux

Colonnes

Produit	Point de terminaison de l'API	Description	sans clé API	avec clé API gratuite	avec clé API payante	avec clé API Premium	Latence moyenne	Comptage de l'utilisation des jetons	Demande autorisée
API de lecteur	`https://r.jina.ai`	Convertir l'URL en texte compatible LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Comptez le nombre de jetons dans la réponse de sortie.	GET/POST
API de lecteur	`https://s.jina.ai`	Recherchez sur le Web et convertissez les résultats en texte adapté au LLM		100 RPM	100 RPM	1000 RPM	2.5s	Chaque demande coûte un nombre fixe de jetons, à partir de 10000 jetons	GET/POST
API d'intégration	`https://api.jina.ai/v1/embeddings`	Convertir du texte/des images en vecteurs de longueur fixe		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dépend de la taille de l'entrée	Comptez le nombre de jetons dans la demande d'entrée.	POST
API de reclassement	`https://api.jina.ai/v1/rerank`	Classer les documents par requête		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dépend de la taille de l'entrée	Comptez le nombre de jetons dans la demande d'entrée.	POST
API de classificateur	`https://api.jina.ai/v1/train`	Entraîner un classificateur à l'aide d'exemples étiquetés		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Les jetons sont comptés comme suit : input_tokens × num_iters	POST
API de classificateur (Coup zéro)	`https://api.jina.ai/v1/classify`	Classer les entrées à l'aide de la classification à coup zéro		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Jetons comptés comme : input_tokens + label_tokens	POST
API de classificateur (Quelques coups)	`https://api.jina.ai/v1/classify`	Classer les entrées à l'aide d'un classificateur à quelques coups entraîné		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Jetons comptés comme : input_tokens	POST
API de segmentation	`https://api.jina.ai/v1/segment`	Tokeniser et segmenter un texte long	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Le jeton n'est pas comptabilisé comme une utilisation.	GET/POST
Recherche profonde	`https://deepsearch.jina.ai/v1/chat/completions`	Raisonner, rechercher et itérer pour trouver la meilleure réponse		50 RPM	50 RPM	500 RPM	56.7s	Comptez le nombre total de jetons dans l’ensemble du processus.	POST

Ai-je besoin d’une licence commerciale ?

Auto-vérification de la licence CC BY-NC

Utilisez-vous notre API officielle ou nos images officielles sur Azure, AWS ou GCP ?

Oui

Non

Puis-je utiliser la même clé API pour les API de lecture, d'intégration, de reclassement, de classification et de réglage fin ?

Puis-je surveiller l’utilisation des jetons de ma clé API ?

Que dois-je faire si j'oublie ma clé API ?

Les clés API expirent-elles ?

Puis-je transférer des jetons entre des clés API ?

Puis-je révoquer ma clé API ?

Pourquoi la première demande de certains modèles est-elle lente ?

Mes données API sont-elles utilisées pour entraîner vos modèles ?

Quelles sont les limites de débit des API Jina ?

Existe-t-il des limites de taille de lot pour les API ?

La facturation est-elle basée sur le nombre de phrases ou de demandes ?

Existe-t-il un essai gratuit disponible pour les nouveaux utilisateurs ?

Les jetons sont-ils facturés pour les demandes ayant échoué ?

Quels moyens de paiement sont acceptés ?

La facturation est-elle disponible pour les achats de jetons ?