Noticias
Modelos
API
keyboard_arrow_down
Lector
Lea las URL y busque en la web para obtener una base más sólida para su LLM.
Incrustaciones
Integraciones multilingües y multimodales de clase mundial.
reclasificador
Recuperador neuronal de clase mundial para maximizar la relevancia de la búsqueda.
MCP terminalCLIarticlellms.txtsmart_toyAgentesdata_objectEsquemamenu_bookDocumentos



Acceso
login

Incrustaciones

Incrustaciones de contexto largo multilingües y multimodales de alto rendimiento para aplicaciones de búsqueda, RAG y agentes.

API de incrustación

Pruebe nuestros modelos de integración de clase mundial para mejorar sus sistemas de búsqueda y RAG. ¡Empiece con una prueba gratuita!
keyClave API y facturación
codeUso
more_horizMás
chevron_leftchevron_right

home
speedLímite de velocidad
bug_reportPlantear un problema
help_outlinePreguntas más frecuentes
Estado
chevron_leftchevron_right


Entradas de ejemplo
¡Cámbialos y observa cómo cambia la respuesta!
Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.
Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.
Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.
针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。
新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

upload
Pedido
curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF


v5-text: Nuevas incrustaciones multilingües pequeñas de SOTA

jina-embeddings-v5-text ofrece calidad de incrustación de quinta generación en dos tamaños eficientes (un modelo pequeño de 677 M y un modelo nano de 239 M) con adaptadores LoRA específicos para cada tarea, dimensiones Matryoshka, contexto de 32 K y cuantificación GGUF/MLX para implementación en el borde, lo que establece nuevos puntos de referencia en MMTEB, MTEB English y tareas de recuperación.
Leer la nota de lanzamientoarrow_forward

v4: Integraciones universales para la recuperación multimodal multilingüe

jina-embeddings-v4 es nuestro salto más significativo hasta el momento: un modelo de 3.8B que integra texto e imágenes a través de una ruta unificada, que admite la recuperación tanto de interacción densa como tardía y, al mismo tiempo, supera los modelos propietarios de Google, OpenAI y Voyage AI, especialmente en la recuperación de documentos visualmente enriquecidos.

Dos formas de comprar

Suscríbete a nuestra API o compra a través de proveedores de la nube.
radio_button_unchecked
cloud
Con 3 proveedores de servicios en la nube
¿Su empresa utiliza AWS o Azure? Luego, implemente directamente nuestros modelos básicos de búsqueda en estas plataformas de su empresa, para que sus datos se mantengan seguros y cumplan con las normas.
AWS SageMaker
Incrustaciones
reclasificador
Microsoft Azure
Incrustaciones
reclasificador
Google Cloud
Incrustaciones
radio_button_checked
Con la API de Jina Search Foundation
La forma más sencilla de acceder a todos nuestros productos. Recarga tokens a medida que avanzas.
Recarga esta clave API con más tokens
Dependiendo de su ubicación, es posible que se le cobre en USD, EUR u otras monedas. Se pueden aplicar impuestos.
Ingrese la clave API correcta para recargar
Entender el límite de velocidad
Los límites de velocidad son la cantidad máxima de solicitudes que se pueden realizar a una API en un minuto por dirección IP/clave API (RPM). Obtenga más información sobre los límites de velocidad para cada producto y nivel a continuación.
keyboard_arrow_down
Límite de velocidad
Los límites de velocidad se controlan de tres maneras: RPM (solicitudes por minuto) y TPM (tokens por minuto). Los límites se aplican por IP/clave API y se activan cuando se alcanza primero el umbral de RPM o TPM. Al proporcionar una clave API en el encabezado de la solicitud, controlamos los límites de velocidad por clave, no por dirección IP.
ProductoPunto final de APIDescripciónarrow_upwardSin clave APIkey_offcon clave API gratuitakeycon clave API de pagokeycon clave API PremiumkeyLatencia mediaRecuento de uso de tokensSolicitud Permitida
API de lectorhttps://r.jina.aiConvertir URL a texto compatible con LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sCuente la cantidad de tokens en la respuesta de salida.GET/POST
API de lectorhttps://s.jina.aiBusque en la web y convierta los resultados en texto compatible con LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sCada solicitud cuesta una cantidad fija de tokens, a partir de 10000 tokensGET/POST
API de incrustaciónhttps://api.jina.ai/v1/embeddingsConvertir texto/imágenes en vectores de longitud fijablock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
depende del tamaño de entrada
help
Cuente la cantidad de tokens en la solicitud de entrada.POST
API de reclasificaciónhttps://api.jina.ai/v1/rerankClasificar documentos por consultablock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
depende del tamaño de entrada
help
Cuente la cantidad de tokens en la solicitud de entrada.POST
API de clasificadorhttps://api.jina.ai/v1/trainEntrenar un clasificador usando ejemplos etiquetadosblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
depende del tamaño de entrada
Los tokens se cuentan como: input_tokens × num_itersPOST
API de clasificador (Disparo cero)https://api.jina.ai/v1/classifyClasificar las entradas utilizando la clasificación de disparo ceroblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
depende del tamaño de entrada
Los tokens se cuentan como: input_tokens + label_tokensPOST
API de clasificador (Pocos disparos)https://api.jina.ai/v1/classifyClasifique las entradas utilizando un clasificador de pocos disparos entrenadoblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
depende del tamaño de entrada
Los tokens se cuentan como: input_tokensPOST
API de segmentaciónhttps://api.jina.ai/v1/segmentTokenizar y segmentar textos largos20 RPM200 RPM200 RPM1,000 RPM0.3sEl token no se cuenta como uso.GET/POST
Búsqueda profundahttps://deepsearch.jina.ai/v1/chat/completionsRazonar, buscar e iterar para encontrar la mejor respuesta.block50 RPM50 RPM500 RPM56.7sCuente el número total de tokens en todo el proceso.POST

Implementación local

Implemente modelos de Jina Embeddings en AWS Sagemaker y Microsoft Azure, y pronto en Google Cloud Services, o comuníquese con nuestro equipo de ventas para obtener implementaciones personalizadas de Kubernetes para su nube privada virtual y servidores locales.
AWS SageMaker
Incrustaciones
reclasificador
Microsoft Azure
Incrustaciones
reclasificador
Google Cloud
Incrustaciones
Integraciones API
Nuestra API de incrustación está integrada de forma nativa con varias bases de datos, almacenes de vectores, marcos RAG y LLMOps de renombre. Para comenzar, simplemente copie y pegue su clave API en cualquiera de las integraciones enumeradas para un comienzo rápido y sin problemas.
Tienda de vectores
LLMOps
TRAPO
Observabilidad
open_in_new
MongoDB
open_in_new
DataStax
open_in_new
Qdrant
open_in_new
Pinecone
open_in_new
Chroma
open_in_new
Weaviate
open_in_new
Milvus
open_in_new
Epsilla
open_in_new
MyScale
open_in_new
LlamaIndex
open_in_new
Haystack
open_in_new
Langchain
open_in_new
Dify
open_in_new
SuperDuperDB
open_in_new
DashVector
open_in_new
Portkey
open_in_new
Baseten
open_in_new
TiDB
open_in_new
LanceDB
open_in_new
Carbon

Nuestras Publicaciones

Comprenda cómo se entrenaron nuestros modelos de búsqueda de frontera desde cero; consulte nuestras últimas publicaciones. ¡Conozca a nuestro equipo en EMNLP, SIGIR, ICLR, NeurIPS e ICML!
arXiv
febrero 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
arXiv
febrero 11, 2026
Embedding Inversion via Conditional Masked Diffusion Language Models
ICLR 2026
enero 22, 2026
Embedding Compression via Spherical Coordinates
arXiv
diciembre 29, 2025
Vision Encoders in Vision-Language Models: A Survey
ICLR 2026
diciembre 04, 2025
Jina-VLM: Small Multilingual Vision Language Model
AAAI 2026
octubre 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
NeurIPS 2025
agosto 31, 2025
Efficient Code Embeddings from Code Generation Models
EMNLP 2025
junio 24, 2025
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval
ICLR 2025
marzo 04, 2025
ReaderLM-v2: Small Language Model for HTML to Markdown and JSON
ACL 2025
diciembre 17, 2024
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark
ICLR 2025
diciembre 12, 2024
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images
ECIR 2025
septiembre 18, 2024
jina-embeddings-v3: Multilingual Embeddings With Task LoRA
SIGIR 2025
septiembre 07, 2024
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models
EMNLP 2024
agosto 30, 2024
Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever
WWW 2025
junio 21, 2024
Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models
ICML 2024
mayo 30, 2024
Jina CLIP: Your CLIP Model Is Also Your Text Retriever
arXiv
febrero 26, 2024
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings
arXiv
octubre 30, 2023
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents
EMNLP 2023
julio 20, 2023
Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models
19 publicaciones en total.

Aprendiendo sobre incrustaciones

¿Por dónde empezar con las incrustaciones? Te tenemos cubierto. Aprenda sobre las incrustaciones desde cero con nuestra guía completa.
Abstract illustration of a sound wave or heartbeat, formed by blue, orange, and gray dots on a white background.
marzo 11, 2026 • 7 minutos de lectura
Bootstrapping Audio Embeddings from Multimodal LLMs
Turn any multimodal LLM into a small audio embedding model that beats CLAP with 25x less data.
Han Xiao
Fingerprint illustration made from numbers, showcasing digital and high-tech design on a light background.
marzo 06, 2026 • 6 minutos de lectura
Identifying Embedding Models from Raw Numerical Values
A tiny transformer that fingerprints embedding models by reading raw numerical digits. No feature engineering.
Han Xiao
Abstract digital artwork in black and white, featuring scattered dots forming letters in a halftone effect. The central lette
febrero 19, 2026 • 7 minutos de lectura
jina-embeddings-v5-text: New SOTA Small Multilingual Embeddings
Two sub-1B multilingual embeddings with best-in-class performance, available on Elastic Inference Service, Llama.cpp and MLX.
Han Xiao
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
febrero 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
Text embedding models are widely used for semantic similarity tasks, including information retrieval, clustering, and classification. General-purpose models are typically trained with single- or multi-stage processes using contrastive loss functions. We introduce a novel training regimen that combines model distillation techniques with task-specific contrastive loss to produce compact, high-performance embedding models. Our findings suggest that this approach is more effective for training small models than purely contrastive or distillation-based training paradigms alone. Benchmark scores for the resulting models, jina-embeddings-v5-text-small and jina-embeddings-v5-text-nano, exceed or match the state-of-the-art for models of similar size. jina-embeddings-v5-text models additionally support long texts (up to 32k tokens) in many languages, and generate embeddings that remain robust under truncation and binary quantization. Model weights are publicly available, hopefully inspiring further advances in embedding model development.

Comparación de Reranker, Vector Search y BM25

La siguiente tabla proporciona una comparación completa de Reranker, Vector/Inbeddings Search y BM25, destacando sus fortalezas y debilidades en varias categorías.
reclasificadorBúsqueda de vectoresBM25
Mejor paraPrecisión y relevancia de búsqueda mejoradasFiltrado inicial y rápidoRecuperación de texto general en consultas de amplio alcance
GranularidadDetallado: subdocumento y segmento de consultaAmplio: documentos completosIntermedio: varios segmentos de texto
Complejidad del tiempo de consultaAltoMedioBajo
Complejidad del tiempo de indexaciónNo requeridoAltoBajo, utiliza índice prediseñado
Complejidad del tiempo de entrenamientoAltoAltoNo requerido
Calidad de búsquedaSuperior para consultas matizadasEquilibrado entre eficiencia y precisiónConsistente y confiable para un amplio conjunto de consultas
FortalezasAltamente preciso con una profunda comprensión contextual.Rápido y eficiente, con precisión moderada.Altamente escalable, con eficacia establecida
Pruebe la API de reranker gratisPruebe incorporar API de forma gratuita

La evolución de las incrustaciones Póster

Descubra el póster ideal para su espacio, con infografías cautivadoras o imágenes impresionantes que rastrean la evolución de los modelos de incrustación de texto desde 1950.
Aprende cómo lo hicimos
shopping_cartCompre una copia impresa

Preguntas más frecuentes

¿Cómo se entrenaron los modelos de incrustación de Jina?
keyboard_arrow_down
Para obtener información detallada sobre nuestros procesos de capacitación, fuentes de datos y evaluaciones, consulte nuestros informes técnicos en arXiv para jina-embeddings-v3 y jina-embeddings-v4.
launcharXiv
¿Cuáles son sus modelos de incrustación multimodal?
keyboard_arrow_down
jina-embeddings-v4 es nuestro modelo multimodal universal más reciente (3800 millones de parámetros) compatible con texto e imágenes con contexto de 32 K, recuperación densa y de interacción tardía, y rendimiento SOTA en documentos visualmente ricos. jina-clip-v2 es una opción más ligera (865 millones de parámetros) compatible con 89 idiomas con una resolución de imagen de 512 x 512 y representaciones de Matryoshka. Ambos son excelentes en tareas de recuperación de texto a texto, texto a imagen e imagen a imagen.
launcharXiv
¿Qué idiomas admiten sus modelos?
keyboard_arrow_down
Tanto jina-embeddings-v4 como jina-embeddings-v3 admiten 89 idiomas con un excelente rendimiento multilingüe. Los 30 idiomas principales incluyen: alemán, árabe, bengalí, chino, coreano, danés, eslovaco, español, finlandés, francés, georgiano, griego, hindi, indonesio, inglés, italiano, japonés, letón, noruego, polaco, portugués, rumano, ruso, sueco, tailandés, turco, ucraniano, urdu y vietnamita. jina-clip-v2 también admite 89 idiomas para tareas multimodales.
launcharXiv
¿Cuál es la longitud máxima para la entrada de una sola oración?
keyboard_arrow_down
La longitud del contexto varía según el modelo: jina-embeddings-v4 admite hasta 32 000 tokens, mientras que jina-embeddings-v3 y jina-clip-v2 admiten hasta 8192 tokens. Un token puede abarcar desde un solo carácter hasta una palabra completa. Este contexto extendido permite un análisis exhaustivo de documentos y una mayor precisión en la comprensión del contexto para datos textuales extensos.
¿Cuál es el número máximo de frases que puedo incluir en una sola solicitud?
keyboard_arrow_down
No hay un límite estricto en la cantidad de elementos por solicitud. La API agrupa las entradas internamente por número de tokens para optimizar el uso de la GPU. Puedes enviar tantos textos o imágenes como necesites en una sola solicitud.
¿Cómo envío imágenes a modelos de incrustación multimodal?
keyboard_arrow_down
Para jina-embeddings-v4, jina-clip-v2 y jina-clip-v1, puede usar url o bytes en el campo input de la solicitud de API. Para url, proporcione la URL de la imagen que desea procesar. Para bytes, codifique la imagen en formato base64. jina-embeddings-v4 también puede incrustar documentos PDF directamente pasando una URL de PDF o bytes de PDF codificados en base64.
¿Cómo se comparan los modelos de Jina Embeddings con las últimas incorporaciones de OpenAI y Cohere?
keyboard_arrow_down
jina-embeddings-v4 es nuestro modelo insignia más reciente, que alcanza la excelencia en la recuperación de documentos visualmente enriquecidos (ViDoRe) y en pruebas multimodales. Para tareas de solo texto, jina-embeddings-v3 supera a OpenAI y Cohere en las pruebas MTEB de inglés y multilingüe, además de ser más pequeño y eficiente. Ambos modelos son compatibles con el aprendizaje de representación Matryoshka (MRL), lo que permite el truncamiento de dimensiones (hasta 32 para la versión 3 y hasta 128 para la versión 4) sin una pérdida significativa de rendimiento.
¿Qué tan fluida es la transición de text-embedding-3-large de OpenAI a su solución?
keyboard_arrow_down
La transición se simplifica, ya que nuestro punto final de API coincide con los esquemas JSON de entrada y salida del modelo text-embedding-3-large de OpenAI. Esta compatibilidad garantiza que los usuarios puedan reemplazar fácilmente el modelo de OpenAI por el nuestro cuando utilicen el punto final de OpenAI.
¿Cómo se calculan los tokens cuando se utilizan los modelos jina-clip?
keyboard_arrow_down
Los tokens se calculan en función de la longitud del texto y el tamaño de la imagen. Para el texto de la solicitud, los tokens se contabilizan de la forma estándar. Para las imágenes, se realizan los siguientes pasos: 1. Tamaño del mosaico: Cada imagen se divide en mosaicos. Para jina-embeddings-v4, los mosaicos miden 28x28 píxeles, para jina-clip-v2, los mosaicos miden 512x512 píxeles, mientras que para jina-clip-v1, los mosaicos miden 224x224 píxeles. 2. Cobertura: Se calcula el número de mosaicos necesarios para cubrir la imagen de entrada. Incluso si las dimensiones de la imagen no son perfectamente divisibles por el tamaño del mosaico, los mosaicos parciales se contabilizan como mosaicos completos. 3. Mosaicos totales: El número total de mosaicos que cubren la imagen determina el coste. Por ejemplo, una imagen de 600x600 píxeles estaría cubierta por mosaicos de 22x22 (484 mosaicos) en jina-embeddings-v4, por mosaicos de 2x2 (4 mosaicos) en jina-clip-v2 y por mosaicos de 3x3 (9 mosaicos) en jina-clip-v1. 4. Cálculo del coste: Para jina-embeddings-v4, cada mosaico cuesta 10 tokens; para jina-clip-v2, cada mosaico cuesta 4000 tokens; mientras que para jina-clip-v1, cada mosaico cuesta 1000 tokens. Ejemplo: Para una imagen con dimensiones de 600x600 píxeles: • Con jina-embeddings-v4 • La imagen se divide en mosaicos de 28x28 píxeles. • El número total de mosaicos requeridos es 22 (horizontales) x 22 (verticales) = 484 mosaicos. • El costo de jina-embeddings-v4 será de 484*10 = 4840 tokens. • Con jina-clip-v2 • La imagen se divide en mosaicos de 512x512 píxeles. • El número total de mosaicos requeridos es 2 (horizontales) x 2 (verticales) = 4 mosaicos. • El costo de jina-clip-v2 será de 4*4000 = 16000 tokens. • Con jina-clip-v1 • La imagen se divide en mosaicos de 224x224 píxeles. • El número total de fichas necesarias es 3 (horizontales) x 3 (verticales) = 9 fichas. • El coste de jina-clip-v1 será 9*1000 = 9000 tokens.
¿Proporcionan modelos para incrustar imágenes o audio?
keyboard_arrow_down
Sí, jina-clip-v2 y jina-clip-v1 pueden incorporar imágenes y textos. ¡Pronto anunciaremos la incorporación de modelos en más modalidades!
¿Se pueden ajustar los modelos de Jina Embedding con datos privados o de la empresa?
keyboard_arrow_down
Si tiene consultas sobre cómo ajustar nuestros modelos con datos específicos, contáctenos para analizar sus requisitos. Estamos abiertos a explorar cómo nuestros modelos se pueden adaptar para satisfacer sus necesidades.
Contacto
¿Se pueden alojar sus puntos finales de forma privada en AWS, Azure o GCP?
keyboard_arrow_down
Sí, nuestros servicios están disponibles en los mercados de AWS, Azure y GCP. Si tiene requisitos específicos, comuníquese con nosotros a sales AT jina.ai.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
¿Qué es el parámetro 'tarea' y cuándo debo usarlo?
keyboard_arrow_down
El parámetro task en jina-embeddings-v3 y jina-embeddings-v4 activa adaptadores LoRA específicos de cada tarea para un rendimiento óptimo. Utilice retrieval.query para consultas de búsqueda, retrieval.passage para documentos que se buscarán, text-matching para similitud semántica, classification para clasificación de texto y separation para tareas de agrupamiento.
¿Qué es la recuperación de interacción tardía y qué modelos la admiten?
keyboard_arrow_down
jina-embeddings-v4 admite la recuperación densa (de un solo vector) y la de interacción tardía (multivector) mediante el parámetro output_type. La interacción tardía conserva información más detallada a nivel de token para una mayor precisión de recuperación en consultas complejas. jina-colbert-v2 es un modelo dedicado a la interacción tardía.
¿Qué es la fragmentación tardía y cuándo debo utilizarla?
keyboard_arrow_down
La fragmentación tardía es una técnica que primero integra todo el documento mediante modelos de contexto extenso y luego extrae las incrustaciones de fragmentos de las representaciones a nivel de token. A diferencia de la fragmentación simple (fragmentar primero, luego incrustar), la fragmentación tardía preserva el contexto entre fragmentos, lo que mejora la recuperación para aplicaciones RAG. Habilítela mediante el parámetro late_chunking en jina-embeddings-v3.
¿Por qué la API admite una longitud de contexto diferente a la capacidad máxima del modelo?
keyboard_arrow_down
Si bien algunos de nuestros modelos de incrustación tienen la capacidad arquitectónica de procesar contextos más largos, la API puede imponer límites inferiores debido a las limitaciones de VRAM de la GPU en nuestra infraestructura de inferencia. Procesar secuencias muy largas requiere una cantidad considerable de memoria, por lo que optimizamos nuestra configuración de servicio para equilibrar el rendimiento, la latencia y el coste en la mayoría de los casos de uso. Si necesita compatibilidad con contextos más largos, póngase en contacto con nuestro equipo de ventas para hablar sobre opciones de implementación dedicadas.
¿Por qué jina-embeddings-v4 es gratuito y por qué es lento?
keyboard_arrow_down
jina-embeddings-v4 se basa en el modelo base Qwen2-VL, publicado bajo la Licencia de Investigación de Qwen. Esta licencia solo permite su uso con fines de investigación y no comerciales, lo que significa que no podemos ofrecer jina-embeddings-v4 como producto comercial. Por ello, ofrecemos acceso gratuito al modelo a través de nuestra API. Hay dos razones por las que jina-embeddings-v4 puede parecer más lento que otros modelos: en primer lugar, jina-embeddings-v4 es un modelo significativamente más grande que jina-embeddings-v3, por lo que requiere inherentemente más tiempo de cálculo por solicitud. En segundo lugar, dado que no podemos comercializar este modelo, limitamos intencionalmente el rendimiento de la API para gestionar los costes de infraestructura. Los usuarios no deben esperar un rendimiento de alto volumen ni de producción al utilizar la API jina-embeddings-v4. Para cargas de trabajo de producción que requieren un mayor rendimiento, recomendamos usar jina-embeddings-v3 o implementar jina-embeddings-v4 en su propia infraestructura a través de Hugging Face.
¿Cuáles son los límites de velocidad para la API de incrustaciones?
keyboard_arrow_down
Los límites de velocidad dependen del tipo de clave API:

Gratis: 100 RPM, 100 000 TPM, 2 solicitudes simultáneas
Pago: 500 RPM, 2 000 000 TPM, 50 solicitudes simultáneas
Premium: 5000 RPM, 50 000 000 TPM, 500 solicitudes simultáneas

Además, existe un límite de velocidad basado en IP de 10 000 solicitudes cada 60 segundos para evitar abusos. Si necesita límites mayores, póngase en contacto con nuestro equipo de ventas.
¿Cuáles son los límites de longitud de contexto para cada modelo de incrustación?
keyboard_arrow_down
Cada modelo tiene una longitud máxima de contexto por entrada:

jina-embeddings-v4: 32,768 tokens
jina-embeddings-v3: 8,192 tokens
jina-embeddings-v2-*: 8,192 tokens
jina-clip-v1/v2: 8,192 tokens
jina-colbert-v1/v2: 8,192 tokens
jina-code-embeddings-*: 32,768 tokens

Las entradas que excedan el límite devolverán un error a menos que se configure truncate: true, lo que trunca automáticamente a la longitud máxima.
¿Cuáles son los límites de tamaño de archivo para imágenes y archivos PDF?
keyboard_arrow_down
Los tamaños máximos de archivo son: Imágenes: 5 MB, PDF: 8 MB. Los archivos más grandes se rechazarán con un error.

¿Cómo obtener mi clave API?

video_not_supported

¿Cuál es el límite de velocidad?

Límite de velocidad
Los límites de velocidad se controlan de tres maneras: RPM (solicitudes por minuto) y TPM (tokens por minuto). Los límites se aplican por IP/clave API y se activan cuando se alcanza primero el umbral de RPM o TPM. Al proporcionar una clave API en el encabezado de la solicitud, controlamos los límites de velocidad por clave, no por dirección IP.
ProductoPunto final de APIDescripciónarrow_upwardSin clave APIkey_offcon clave API gratuitakeycon clave API de pagokeycon clave API PremiumkeyLatencia mediaRecuento de uso de tokensSolicitud Permitida
API de lectorhttps://r.jina.aiConvertir URL a texto compatible con LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sCuente la cantidad de tokens en la respuesta de salida.GET/POST
API de lectorhttps://s.jina.aiBusque en la web y convierta los resultados en texto compatible con LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sCada solicitud cuesta una cantidad fija de tokens, a partir de 10000 tokensGET/POST
API de incrustaciónhttps://api.jina.ai/v1/embeddingsConvertir texto/imágenes en vectores de longitud fijablock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
depende del tamaño de entrada
help
Cuente la cantidad de tokens en la solicitud de entrada.POST
API de reclasificaciónhttps://api.jina.ai/v1/rerankClasificar documentos por consultablock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
depende del tamaño de entrada
help
Cuente la cantidad de tokens en la solicitud de entrada.POST
API de clasificadorhttps://api.jina.ai/v1/trainEntrenar un clasificador usando ejemplos etiquetadosblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
depende del tamaño de entrada
Los tokens se cuentan como: input_tokens × num_itersPOST
API de clasificador (Disparo cero)https://api.jina.ai/v1/classifyClasificar las entradas utilizando la clasificación de disparo ceroblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
depende del tamaño de entrada
Los tokens se cuentan como: input_tokens + label_tokensPOST
API de clasificador (Pocos disparos)https://api.jina.ai/v1/classifyClasifique las entradas utilizando un clasificador de pocos disparos entrenadoblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
depende del tamaño de entrada
Los tokens se cuentan como: input_tokensPOST
API de segmentaciónhttps://api.jina.ai/v1/segmentTokenizar y segmentar textos largos20 RPM200 RPM200 RPM1,000 RPM0.3sEl token no se cuenta como uso.GET/POST
Búsqueda profundahttps://deepsearch.jina.ai/v1/chat/completionsRazonar, buscar e iterar para encontrar la mejor respuesta.block50 RPM50 RPM500 RPM56.7sCuente el número total de tokens en todo el proceso.POST

¿Necesito una licencia comercial?

Autocomprobación de licencia CC BY-NC

play_arrow
¿Está utilizando nuestra API oficial o imágenes oficiales en Azure, AWS o GCP?
play_arrow
Sí
Sin restricciones. Simplemente regístrate y paga a través de nuestro sitio web o plataforma en la nube.
play_arrow
No
play_arrow
¿Es usted un cliente pago de Elastic?
play_arrow
Sí
Es probable que el uso comercial ya esté incluido en su licencia de Elastic. Si tiene alguna duda, contacte con su representante de ventas de Elastic.
Contactar con ventas
play_arrow
No
Actualmente no podemos emitir contratos de licencia comerciales independientes. Para más información, contacte con el departamento de Ventas de Elastic.
Contactar con ventas
Preguntas comunes relacionadas con API
code
¿Puedo usar la misma clave API para las API de lectura, inserción, reclasificación, clasificación y ajuste?
keyboard_arrow_down
Sí, la misma clave API es válida para todos los productos de la base de búsqueda de Jina AI. Esto incluye las API de lectura, incrustación, reclasificación, clasificación y ajuste, con tokens compartidos entre todos los servicios.
code
¿Puedo monitorear el uso del token de mi clave API?
keyboard_arrow_down
Sí, el uso de tokens se puede monitorear en la pestaña "Clave API y facturación" ingresando su clave API, lo que le permite ver el historial de uso reciente y los tokens restantes. Si ha iniciado sesión en el panel de API, estos detalles también se pueden ver en la pestaña "Administrar clave API".
code
¿Qué debo hacer si olvido mi clave API?
keyboard_arrow_down
Si ha perdido una clave recargada y desea recuperarla, comuníquese con el servicio de asistencia de jina.ai con su correo electrónico registrado para recibir asistencia. Se recomienda iniciar sesión para mantener su clave API almacenada de forma segura y de fácil acceso.
Contacto
code
¿Caducan las claves API?
keyboard_arrow_down
No, nuestras claves API no tienen fecha de vencimiento. Sin embargo, si sospecha que su clave ha sido comprometida y desea retirarla, comuníquese con nuestro equipo de soporte para obtener ayuda. También puede revocar su clave en el panel de administración de claves API.
Contacto
code
¿Puedo transferir tokens entre claves API?
keyboard_arrow_down
Sí, puedes transferir tokens de una clave premium a otra. Después de iniciar sesión en tu cuenta en el panel de administración de claves API, usa la configuración de la clave que deseas transferir para mover todos los tokens pagos restantes.
code
¿Puedo revocar mi clave API?
keyboard_arrow_down
Sí, puedes revocar tu clave API si crees que se ha visto comprometida. Al revocar una clave, se deshabilitará de inmediato para todos los usuarios que la hayan almacenado, y todo el saldo restante y las propiedades asociadas quedarán inutilizables de forma permanente. Si la clave es una clave premium, tienes la opción de transferir el saldo restante pagado a otra clave antes de la revocación. Ten en cuenta que esta acción no se puede deshacer. Para revocar una clave, ve a la configuración de claves en el panel de control de administración de claves API.
code
¿Por qué la primera solicitud de algunos modelos es lenta?
keyboard_arrow_down
Esto se debe a que nuestra arquitectura sin servidor descarga ciertos modelos durante períodos de bajo uso. La solicitud inicial activa o "calienta" el modelo, lo que puede tardar unos segundos. Después de esta activación inicial, las solicitudes posteriores se procesan mucho más rápido.
code
¿Se utilizan mis datos de API para entrenar sus modelos?
keyboard_arrow_down
No. Nunca utilizamos sus solicitudes, entradas ni salidas de API para entrenar nuestros modelos de incrustación, reranking ni ningún otro. Sus datos siguen siendo suyos. Cumplimos con las normas SOC 2 Tipo I y Tipo II.
code
¿Cuáles son los límites de velocidad para las API de Jina?
keyboard_arrow_down
Se aplican límites de velocidad por clave de API:

Gratis: 100 RPM, 100 000 TPM, 2 solicitudes simultáneas
Pago: 500 RPM, 2 000 000 TPM, 50 solicitudes simultáneas
Premium: 5000 RPM, 50 000 000 TPM, 500 solicitudes simultáneas

También hay un límite de velocidad basado en IP de 10 000 solicitudes cada 60 segundos. Estos límites se aplican a todas las API de Jina (Incrustaciones, Reranker, Lector, etc.).
code
¿Existen límites de tamaño de lote para las API?
keyboard_arrow_down
No hay límite de tamaño de lote para las API de incrustaciones ni para las de reranking. Puede enviar tantos elementos o documentos como necesite por solicitud. Ambas API procesan las entradas internamente por lotes según el número de tokens para optimizar el uso de la GPU.
Preguntas comunes relacionadas con la facturación
attach_money
¿La facturación se basa en el número de sentencias o solicitudes?
keyboard_arrow_down
Nuestro modelo de precios se basa en la cantidad total de tokens procesados, lo que permite a los usuarios la flexibilidad de asignar estos tokens en cualquier cantidad de oraciones, ofreciendo una solución rentable para diversos requisitos de análisis de texto.
attach_money
¿Hay una prueba gratuita disponible para nuevos usuarios?
keyboard_arrow_down
Ofrecemos una prueba gratuita de bienvenida a los nuevos usuarios, que incluye diez millones de tokens para usar con cualquiera de nuestros modelos, gracias a una clave API generada automáticamente. Una vez alcanzado el límite de tokens gratuitos, los usuarios pueden comprar fácilmente tokens adicionales para sus claves API a través de la pestaña "Comprar tokens".
attach_money
¿Se cobran tokens por solicitudes fallidas?
keyboard_arrow_down
No, los tokens no se deducen por solicitudes fallidas.
attach_money
¿Qué métodos de pago se aceptan?
keyboard_arrow_down
Los pagos se procesan a través de Stripe y admiten una variedad de métodos de pago que incluyen tarjetas de crédito, Google Pay y PayPal para su comodidad.
attach_money
¿Está disponible la facturación para compras de tokens?
keyboard_arrow_down
Sí, se emitirá una factura a la dirección de correo electrónico asociada a su cuenta de Stripe tras la compra de tokens.
Oficinas
location_on
Sunnyvale, California
710 Lakeway Dr, Ste 200, Sunnyvale, CA 94085, EE. UU.
location_on
Berlín, Alemania
Prinzessinnenstraße 19-20, 10969 Berlín, Alemania
Fundación de búsqueda
Lector
Incrustaciones
reclasificador
Obtener la clave API de Jina
Límite de velocidad
Estado de la API
Compañía
Sobre nosotros
Contactar con ventas
Sala de prensa
Programa de prácticas
Descargar el logotipo de Jina
open_in_new
Descargar el logotipo de Elastic
open_in_new
Términos
Seguridad
Términos y condiciones
Privacidad
Administrar cookies
email
Jina AI de Elastic © 2020-2026.