Contacter le service commercial

Développez votre entreprise avec Jina AI.

Deux façons d'acheter

Abonnez-vous à notre API ou achetez via des fournisseurs de cloud.

Avec 3 fournisseurs de services cloud

Votre entreprise utilise-t-elle AWS ou Azure ? Déployez ensuite directement nos modèles de fondation de recherche sur ces plateformes dans votre entreprise, afin que vos données restent sécurisées et conformes.

Avec l'API Jina Search Foundation

Le moyen le plus simple d'accéder à tous nos produits. Rechargez vos jetons au fur et à mesure.

Saisissez la clé API que vous souhaitez recharger

Rechargez cette clé API avec plus de jetons

Selon votre emplacement, vous pouvez être facturé en USD, EUR ou dans d'autres devises. Des taxes peuvent s'appliquer.

Veuillez saisir la bonne clé API pour recharger

Comprendre la limite de débit

Les limites de débit correspondent au nombre maximal de requêtes pouvant être adressées à une API en une minute par adresse IP/clé API (RPM). Découvrez ci-dessous les limites de débit pour chaque produit et niveau.

Limite de taux

Les limites de débit sont suivies de trois manières : RPM (requêtes par minute) et TPM (jetons par minute). Les limites sont appliquées par IP/clé API et sont déclenchées dès que le seuil RPM ou TPM est atteint. Lorsque vous fournissez une clé API dans l'en-tête de la requête, nous suivons les limites de débit par clé plutôt que par adresse IP.

Colonnes

Produit	Point de terminaison de l'API	Description	sans clé API	avec clé API gratuite	avec clé API payante	avec clé API Premium	Latence moyenne	Comptage de l'utilisation des jetons	Demande autorisée
API de lecteur	`https://r.jina.ai`	Convertir l'URL en texte compatible LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Comptez le nombre de jetons dans la réponse de sortie.	GET/POST
API de lecteur	`https://s.jina.ai`	Recherchez sur le Web et convertissez les résultats en texte adapté au LLM		100 RPM	100 RPM	1000 RPM	2.5s	Chaque demande coûte un nombre fixe de jetons, à partir de 10000 jetons	GET/POST
API d'intégration	`https://api.jina.ai/v1/embeddings`	Convertir du texte/des images en vecteurs de longueur fixe		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dépend de la taille de l'entrée	Comptez le nombre de jetons dans la demande d'entrée.	POST
API de reclassement	`https://api.jina.ai/v1/rerank`	Classer les documents par requête		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dépend de la taille de l'entrée	Comptez le nombre de jetons dans la demande d'entrée.	POST
API de classificateur	`https://api.jina.ai/v1/train`	Entraîner un classificateur à l'aide d'exemples étiquetés		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Les jetons sont comptés comme suit : input_tokens × num_iters	POST
API de classificateur (Coup zéro)	`https://api.jina.ai/v1/classify`	Classer les entrées à l'aide de la classification à coup zéro		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Jetons comptés comme : input_tokens + label_tokens	POST
API de classificateur (Quelques coups)	`https://api.jina.ai/v1/classify`	Classer les entrées à l'aide d'un classificateur à quelques coups entraîné		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Jetons comptés comme : input_tokens	POST
API de segmentation	`https://api.jina.ai/v1/segment`	Tokeniser et segmenter un texte long	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Le jeton n'est pas comptabilisé comme une utilisation.	GET/POST
Recherche profonde	`https://deepsearch.jina.ai/v1/chat/completions`	Raisonner, rechercher et itérer pour trouver la meilleure réponse		50 RPM	50 RPM	500 RPM	56.7s	Comptez le nombre total de jetons dans l’ensemble du processus.	POST

Recharge automatique en cas de faible solde de jetons

Recommandé pour un service ininterrompu en production. Lorsque le solde de votre token descend en dessous du seuil défini, nous rechargerons automatiquement votre mode de paiement enregistré pour le dernier forfait acheté, jusqu'à ce que le seuil soit atteint.

Nous avons introduit un nouveau modèle de tarification le 6 mai 2025. Si vous avez activé la recharge automatique avant cette date, vous continuerez à payer l'ancien prix (celui appliqué lors de l'achat). La nouvelle tarification s'applique uniquement si vous modifiez vos paramètres de recharge automatique ou achetez une nouvelle clé API.

< 1M Jetons

Rechargez quand

FAQ

Jina IA × Élastique

La marque Jina sera-t-elle préservée ?

Sur quoi Jina AI va-t-elle se concentrer à l'avenir ?

Les offres d'API et de places de marché cloud vont-elles se poursuivre ?

Allez-vous continuer à proposer des modèles à poids libre sur Hugging Face ?

Sous quelle licence ces modèles ouverts seront-ils publiés ?

Allez-vous continuer à publier des articles de recherche ?

Je ne suis pas encore client de Jina ou d'Elastic, mais je souhaite utiliser l'API Reader, les API de modèles ou les images du marché cloud. Que dois-je faire ?

Je suis déjà client Elastic payant et je souhaite utiliser l'API Reader, les API de modèles ou les images de la place de marché cloud. Que dois-je faire ?

Je suis client Elastic payant et je souhaite utiliser les modèles d'intégration et de reclassement Jina en local à des fins commerciales, et non via l'API ou une place de marché cloud. Que dois-je faire ?

Je ne suis pas client d'Elastic et je souhaite utiliser les modèles d'intégration et de réorganisation Jina en local à des fins commerciales, et non via une API ou une plateforme cloud. Que dois-je faire ?

J'achète vos services en tant qu'entité chinoise. Puis-je obtenir une facture en chinois (发票) ?

Je souhaite signer un contrat avec Jina AI. Que dois-je faire ?

Je suis client payant d'Elastic et je souhaite apprendre les bonnes pratiques d'utilisation des embeddings et des modèles de reranking, ou plus généralement, je m'intéresse au développement de Jina AI. Que dois-je faire ?

Comment obtenir ma clé API ?

Quelle est la limite de débit ?

Limite de taux

Colonnes

Produit	Point de terminaison de l'API	Description	sans clé API	avec clé API gratuite	avec clé API payante	avec clé API Premium	Latence moyenne	Comptage de l'utilisation des jetons	Demande autorisée
API de lecteur	`https://r.jina.ai`	Convertir l'URL en texte compatible LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Comptez le nombre de jetons dans la réponse de sortie.	GET/POST
API de lecteur	`https://s.jina.ai`	Recherchez sur le Web et convertissez les résultats en texte adapté au LLM		100 RPM	100 RPM	1000 RPM	2.5s	Chaque demande coûte un nombre fixe de jetons, à partir de 10000 jetons	GET/POST
API d'intégration	`https://api.jina.ai/v1/embeddings`	Convertir du texte/des images en vecteurs de longueur fixe		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dépend de la taille de l'entrée	Comptez le nombre de jetons dans la demande d'entrée.	POST
API de reclassement	`https://api.jina.ai/v1/rerank`	Classer les documents par requête		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	dépend de la taille de l'entrée	Comptez le nombre de jetons dans la demande d'entrée.	POST
API de classificateur	`https://api.jina.ai/v1/train`	Entraîner un classificateur à l'aide d'exemples étiquetés		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Les jetons sont comptés comme suit : input_tokens × num_iters	POST
API de classificateur (Coup zéro)	`https://api.jina.ai/v1/classify`	Classer les entrées à l'aide de la classification à coup zéro		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Jetons comptés comme : input_tokens + label_tokens	POST
API de classificateur (Quelques coups)	`https://api.jina.ai/v1/classify`	Classer les entrées à l'aide d'un classificateur à quelques coups entraîné		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	dépend de la taille de l'entrée	Jetons comptés comme : input_tokens	POST
API de segmentation	`https://api.jina.ai/v1/segment`	Tokeniser et segmenter un texte long	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Le jeton n'est pas comptabilisé comme une utilisation.	GET/POST
Recherche profonde	`https://deepsearch.jina.ai/v1/chat/completions`	Raisonner, rechercher et itérer pour trouver la meilleure réponse		50 RPM	50 RPM	500 RPM	56.7s	Comptez le nombre total de jetons dans l’ensemble du processus.	POST

Ai-je besoin d’une licence commerciale ?

Auto-vérification de la licence CC BY-NC

Utilisez-vous notre API officielle ou nos images officielles sur Azure, AWS ou GCP ?

Oui

Non

Autres questions

Quels sont les coûts associés à l’utilisation de l’API Reader ?

Comment fonctionne l'API Reader ?

L'API Reader est-elle open source ?

Quelle est la latence typique de l’API Reader ?

Pourquoi devrais-je utiliser l'API Reader au lieu de gratter la page moi-même ?

L'API Reader prend-elle en charge plusieurs langues ?

Que dois-je faire si un site Web bloque l’API Reader ?

L'API Reader peut-elle extraire le contenu des fichiers PDF ?

L'API Reader peut-elle traiter le contenu multimédia des pages Web ?

Est-il possible d'utiliser l'API Reader sur des fichiers HTML locaux ?

L'API Reader met-elle en cache le contenu ?

Puis-je utiliser l'API Reader pour accéder au contenu derrière une connexion ?

Puis-je utiliser l'API Reader pour accéder au PDF sur arXiv ?

Comment fonctionne la légende d’image dans Reader ?

Quelle est l’évolutivité du Reader ? Puis-je l’utiliser en production ?

Quelle est la limite de débit de l’API Reader ?

Qu'est-ce que Reader-LM ? Comment puis-je l'utiliser ?

Comment extraire des données structurées à partir de pages web ?

Le lecteur contourne-t-il activement la protection anti-robots du site web ?

Le passage d'une clé API gratuite à une clé payante me donnera-t-il accès à davantage de sites web ?

Comment les modèles d'intégration Jina ont-ils été entraînés ?

Quels sont vos modèles d'intégration multimodaux ?

Quelles langues vos modèles prennent-ils en charge ?

Quelle est la longueur maximale d’une seule phrase saisie ?

Quel est le nombre maximum de phrases que je peux inclure dans une seule demande ?

Comment envoyer des images à des modèles d'intégration multimodaux ?

Comment les modèles Jina Embeddings se comparent-ils aux derniers embeddings d'OpenAI et de Cohere ?

Dans quelle mesure la transition entre Text-Embedding-3-Large d'OpenAI et votre solution est-elle transparente ?

Comment les jetons sont-ils calculés lors de l'utilisation des modèles jina-clip ?

Fournissez-vous des modèles pour intégrer des images ou du son ?

Les modèles Jina Embedding peuvent-ils être ajustés avec des données privées ou d’entreprise ?

Vos points de terminaison peuvent-ils être hébergés en privé sur AWS, Azure ou GCP ?

Qu’est-ce que le paramètre « task » et quand dois-je l’utiliser ?

Qu’est-ce que la récupération d’interactions tardives et quels modèles la prennent en charge ?

Qu’est-ce que le découpage tardif et quand dois-je l’utiliser ?

Pourquoi l'API prend-elle en charge une longueur de contexte différente de la capacité maximale du modèle ?

Pourquoi jina-embeddings-v4 est-il gratuit, et pourquoi est-il lent ?

Quelles sont les limites de débit de l'API Embeddings ?

Quelles sont les limites de longueur de contexte pour chaque modèle d'intégration ?

Quelles sont les limites de taille des fichiers image et PDF ?

Combien coûte l’API Reranker ?

Quelles sont les différences entre les modérateurs de Jina ?

Les Jina Rerankers sont-ils open source ?

Les rerankers prennent-ils en charge plusieurs langues ?

Quelle est la longueur maximale du contexte pour chaque modèle de reclassement ?

Existe-t-il une limite au nombre de documents que je peux réorganiser par requête ?

À quelle latence puis-je m'attendre lors du reclassement de 100 documents ?

	Nombre de jetons dans chaque document
Nombre de jetons dans la requête	256	512	1024	2048	4096
64	156	323	1366	2107	3571
128	194	369	1377	2123	3598
256	273	475	1397	2155	4299
512	468	1385	2114	3536	7068

Vos points de terminaison peuvent-ils être hébergés en privé sur AWS, Azure ou GCP ?

Proposez-vous un reranker affiné sur les données spécifiques à un domaine ?

Quelle est la taille minimale de l'image pour les documents ?

Qu’est-ce que le réordonnancement par liste et en quoi diffère-t-il du réordonnancement par points ?

Pourquoi l'API prend-elle en charge une longueur de contexte différente de la capacité maximale du modèle ?

Quelles sont les limites de débit de l'API Reranker ?

Puis-je utiliser la même clé API pour les API de lecture, d'intégration, de reclassement, de classification et de réglage fin ?

Puis-je surveiller l’utilisation des jetons de ma clé API ?

Que dois-je faire si j'oublie ma clé API ?

Les clés API expirent-elles ?

Puis-je transférer des jetons entre des clés API ?

Puis-je révoquer ma clé API ?

Pourquoi la première demande de certains modèles est-elle lente ?

Mes données API sont-elles utilisées pour entraîner vos modèles ?

Quelles sont les limites de débit des API Jina ?

Existe-t-il des limites de taille de lot pour les API ?

La facturation est-elle basée sur le nombre de phrases ou de demandes ?

Existe-t-il un essai gratuit disponible pour les nouveaux utilisateurs ?

Les jetons sont-ils facturés pour les demandes ayant échoué ?

Quels moyens de paiement sont acceptés ?

La facturation est-elle disponible pour les achats de jetons ?

Qu'est-ce que DeepSearch ?

En quoi DeepSearch est-il différent des capacités de recherche approfondie d’OpenAI et de Gemini ?

De quelle clé API ai-je besoin pour utiliser DeepSearch ?

Que se passe-t-il lorsque DeepSearch atteint son budget de jetons ? Renvoie-t-il une réponse incomplète ?

DeepSearch garantit-il des réponses précises ?

Combien de temps dure une requête DeepSearch typique ?

DeepSearch peut-il fonctionner avec n’importe quel client compatible OpenAI comme Chatwise, CherryStudio ou ChatBox ?

Quelles sont les limites de débit pour l'API ?

Quel est le contenu à l'intérieur de la balise ?

DeepSearch utilise-t-il Jina Reader pour la recherche et la lecture sur le Web ?

Pourquoi DeepSearch utilise autant de jetons pour mes requêtes ?

Existe-t-il un moyen de contrôler ou de limiter le nombre d’étapes ?

Dans quelle mesure les références dans les réponses sont-elles fiables ?

DeepSearch peut-il gérer des questions sur des événements futurs ?

Quelle est la différence entre les étiquettes en mode zero-shot et en mode few-shot ?

À quoi sert num_iters et comment dois-je l'utiliser ?

Comment fonctionne le partage de classificateurs publics ?

De combien de données ai-je besoin pour que le mode FPS fonctionne bien ?

Peut-il gérer plusieurs langues et à la fois du texte et des images ?

Quelles sont les limites strictes que je devrais connaître ?

Comment gérer les changements de données au fil du temps ?

Qu'advient-il de mes données d'entraînement après les avoir envoyées ?

Zero-shot ou few-shot : quand utiliser lequel ?

Puis-je utiliser différents modèles pour différentes langues/tâches ?

Combien coûte l'API Segmenter ?

Si je ne fournis pas de clé API, quelle est la limite de débit ?

Si je fournis une clé API, quelle est la limite de débit ?

Allez-vous facturer les jetons à partir de ma clé API ?

L'API Segmenter prend-elle en charge plusieurs langues ?

Quelle est la différence entre les requêtes GET et POST ?

Quelle est la longueur maximale que je peux tokeniser par requête ?

Comment fonctionne la fonction de fragmentation ? S'agit-il d'une fragmentation sémantique ?

Comment gérez-vous les jetons spéciaux tels que « endoftext » dans l'API Segmenter ?

Le chunking prend-il en charge d'autres langues que l'anglais ?

Combien coûte l’API de réglage fin ?

Que dois-je saisir ? Dois-je fournir des données de formation ?

Combien de temps faut-il pour peaufiner un modèle ?

Où sont stockés les modèles peaufinés ?

Si je fournis une URL de référence, comment le système l'utilise-t-il ?

Puis-je affiner un modèle pour une langue spécifique ?

Puis-je affiner les intégrations non-Jina, par exemple bge-M3 ?

Comment garantissez-vous la qualité des modèles peaufinés ?

Comment générer des données synthétiques ?

Puis-je garder mes modèles affinés et mes données synthétiques privés ?

Comment puis-je utiliser le modèle affiné ?

Je n'ai jamais reçu l'e-mail avec les résultats de l'évaluation. Que dois-je faire?