Incrustaciones

Incrustaciones de contexto largo multilingües y multimodales de alto rendimiento para aplicaciones de búsqueda, RAG y agentes.

API de incrustación

Pruebe nuestros modelos de integración de clase mundial para mejorar sus sistemas de búsqueda y RAG. ¡Empiece con una prueba gratuita!

Límite de velocidad

Plantear un problema

Preguntas más frecuentes

Estado

Seleccionar incrustaciones

Normalización L2

Escalar las incrustaciones a longitud unitaria (norma L2 = 1). Requerido para la similitud de cosenos mediante el producto escalar.

Tipo de datos de salida

embedding_type

encoding_format

output_dtype

embedding_types

Elija el formato de salida: flotante (predeterminado), binario (almacenamiento compacto) o base64 (transmisión eficiente).

Predeterminado (como flotante)

Entradas de ejemplo

¡Cámbialos y observa cómo cambia la respuesta!

Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.

Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.

Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.

针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。

新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

Pedido

Bash

Idioma

curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF

Clave API

Fichas disponibles

Esta es tu clave única. ¡Guárdala de forma segura!

v5-omni: Una sola incrustación para todos

Texto, imagen, audio, vídeo: un único espacio de incrustación compartido, dos tamaños. v5-omni-small (1,6 B) es el modelo omni de peso abierto con mejor rendimiento para parámetros de 2 B. v5-omni-nano (0,9 B) ofrece una recuperación competitiva con menos de 1 B. Ambos son compatibles byte a byte con v5-text; no se requiere reindexación.

v5-text: Nuevas incrustaciones multilingües pequeñas de SOTA

jina-embeddings-v5-text ofrece calidad de incrustación de quinta generación en dos tamaños eficientes (un modelo pequeño de 677 M y un modelo nano de 239 M) con adaptadores LoRA específicos para cada tarea, dimensiones Matryoshka, contexto de 32 K y cuantificación GGUF/MLX para implementación en el borde, lo que establece nuevos puntos de referencia en MMTEB, MTEB English y tareas de recuperación.

Dos formas de comprar

Suscríbete a nuestra API o compra a través de proveedores de la nube.

Con 3 proveedores de servicios en la nube

¿Su empresa utiliza AWS o Azure? Luego, implemente directamente nuestros modelos básicos de búsqueda en estas plataformas de su empresa, para que sus datos se mantengan seguros y cumplan con las normas.

Con la API de Jina Search Foundation

La forma más sencilla de acceder a todos nuestros productos. Recarga tokens a medida que avanzas.

Ingresa la clave API que deseas recargar

Recarga esta clave API con más tokens

Dependiendo de su ubicación, es posible que se le cobre en USD, EUR u otras monedas. Se pueden aplicar impuestos.

Ingrese la clave API correcta para recargar

Entender el límite de velocidad

Los límites de velocidad son la cantidad máxima de solicitudes que se pueden realizar a una API en un minuto por dirección IP/clave API (RPM). Obtenga más información sobre los límites de velocidad para cada producto y nivel a continuación.

Límite de velocidad

Los límites de velocidad se controlan de tres maneras: RPM (solicitudes por minuto) y TPM (tokens por minuto). Los límites se aplican por IP/clave API y se activan cuando se alcanza primero el umbral de RPM o TPM. Al proporcionar una clave API en el encabezado de la solicitud, controlamos los límites de velocidad por clave, no por dirección IP.

Columnas

Producto	Punto final de API	Descripción	Sin clave API	con clave API gratuita	con clave API de pago	con clave API Premium	Latencia media	Recuento de uso de tokens	Solicitud Permitida
API de lector	`https://r.jina.ai`	Convertir URL a texto compatible con LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Cuente la cantidad de tokens en la respuesta de salida.	GET/POST
API de lector	`https://s.jina.ai`	Busque en la web y convierta los resultados en texto compatible con LLM		100 RPM	100 RPM	1000 RPM	2.5s	Cada solicitud cuesta una cantidad fija de tokens, a partir de 10000 tokens	GET/POST
API de incrustación	`https://api.jina.ai/v1/embeddings`	Convertir texto/imágenes en vectores de longitud fija		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	depende del tamaño de entrada	Cuente la cantidad de tokens en la solicitud de entrada.	POST
API de reclasificación	`https://api.jina.ai/v1/rerank`	Clasificar documentos por consulta		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	depende del tamaño de entrada	Cuente la cantidad de tokens en la solicitud de entrada.	POST
API de clasificador	`https://api.jina.ai/v1/train`	Entrenar un clasificador usando ejemplos etiquetados		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	depende del tamaño de entrada	Los tokens se cuentan como: input_tokens × num_iters	POST
API de clasificador (Disparo cero)	`https://api.jina.ai/v1/classify`	Clasificar las entradas utilizando la clasificación de disparo cero		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	depende del tamaño de entrada	Los tokens se cuentan como: input_tokens + label_tokens	POST
API de clasificador (Pocos disparos)	`https://api.jina.ai/v1/classify`	Clasifique las entradas utilizando un clasificador de pocos disparos entrenado		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	depende del tamaño de entrada	Los tokens se cuentan como: input_tokens	POST
API de segmentación	`https://api.jina.ai/v1/segment`	Tokenizar y segmentar textos largos	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	El token no se cuenta como uso.	GET/POST
Búsqueda profunda	`https://deepsearch.jina.ai/v1/chat/completions`	Razonar, buscar e iterar para encontrar la mejor respuesta.		50 RPM	50 RPM	500 RPM	56.7s	Cuente el número total de tokens en todo el proceso.	POST

Recarga automática de saldo de token bajo

Recomendado para un servicio ininterrumpido en producción. Cuando el saldo de su token caiga por debajo del límite establecido, recargaremos automáticamente su método de pago guardado por el último paquete comprado, hasta que se alcance el límite.

El 6 de mayo de 2025, implementamos un nuevo modelo de precios. Si habilitaste la recarga automática antes de esta fecha, seguirás pagando el precio anterior (el que pagaste al comprar). El nuevo precio solo aplica si modificas la configuración de recarga automática o compras una nueva clave API.

< 1M Fichas

Recargar cuando

Implementación local

Implemente modelos de Jina Embeddings en AWS Sagemaker y Microsoft Azure, y pronto en Google Cloud Services, o comuníquese con nuestro equipo de ventas para obtener implementaciones personalizadas de Kubernetes para su nube privada virtual y servidores locales.

AWS SageMaker

Incrustaciones

reclasificador

Microsoft Azure

Incrustaciones

reclasificador

Google Cloud

Incrustaciones

Integraciones API

Nuestra API de incrustación está integrada de forma nativa con varias bases de datos, almacenes de vectores, marcos RAG y LLMOps de renombre. Para comenzar, simplemente copie y pegue su clave API en cualquiera de las integraciones enumeradas para un comienzo rápido y sin problemas.

Tienda de vectores

LLMOps

TRAPO

Observabilidad

MongoDB

DataStax

Qdrant

Pinecone

Chroma

Weaviate

Milvus

Epsilla

MyScale

LlamaIndex

Haystack

Langchain

Dify

SuperDuperDB

DashVector

Portkey

Baseten

TiDB

LanceDB

Carbon

Nuestras Publicaciones

Comprenda cómo se entrenaron nuestros modelos de búsqueda de frontera desde cero; consulte nuestras últimas publicaciones. ¡Conozca a nuestro equipo en EMNLP, SIGIR, ICLR, NeurIPS e ICML!

arXiv

mayo 11, 2026

jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

SIGIR 2026

febrero 17, 2026

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

arXiv

febrero 11, 2026

Embedding Inversion via Conditional Masked Diffusion Language Models

ICLR 2026

enero 22, 2026

Embedding Compression via Spherical Coordinates

arXiv

diciembre 29, 2025

Vision Encoders in Vision-Language Models: A Survey

ICLR 2026

diciembre 04, 2025

Jina-VLM: Small Multilingual Vision Language Model

AAAI 2026

octubre 01, 2025

jina-reranker-v3: Last but Not Late Interaction for Document Reranking

NeurIPS 2025

agosto 31, 2025

Efficient Code Embeddings from Code Generation Models

EMNLP 2025

junio 24, 2025

jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval

ICLR 2025

marzo 04, 2025

ReaderLM-v2: Small Language Model for HTML to Markdown and JSON

ACL 2025

diciembre 17, 2024

AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark

ICLR 2025

diciembre 12, 2024

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

ECIR 2025

septiembre 18, 2024

jina-embeddings-v3: Multilingual Embeddings With Task LoRA

SIGIR 2025

septiembre 07, 2024

Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models

EMNLP 2024

agosto 30, 2024

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

WWW 2025

junio 21, 2024

Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models

ICML 2024

mayo 30, 2024

Jina CLIP: Your CLIP Model Is Also Your Text Retriever

arXiv

febrero 26, 2024

Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings

arXiv

octubre 30, 2023

Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents

EMNLP 2023

julio 20, 2023

Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models

20 publicaciones en total.

Aprendiendo sobre incrustaciones

¿Por dónde empezar con las incrustaciones? Te tenemos cubierto. Aprenda sobre las incrustaciones desde cero con nuestra guía completa.

Comparación de Reranker, Vector Search y BM25

La siguiente tabla proporciona una comparación completa de Reranker, Vector/Inbeddings Search y BM25, destacando sus fortalezas y debilidades en varias categorías.

	reclasificador	Búsqueda de vectores	BM25
Mejor para	Precisión y relevancia de búsqueda mejoradas	Filtrado inicial y rápido	Recuperación de texto general en consultas de amplio alcance
Granularidad	Detallado: subdocumento y segmento de consulta	Amplio: documentos completos	Intermedio: varios segmentos de texto
Complejidad del tiempo de consulta	Alto	Medio	Bajo
Complejidad del tiempo de indexación	No requerido	Alto	Bajo, utiliza índice prediseñado
Complejidad del tiempo de entrenamiento	Alto	Alto	No requerido
Calidad de búsqueda	Superior para consultas matizadas	Equilibrado entre eficiencia y precisión	Consistente y confiable para un amplio conjunto de consultas
Fortalezas	Altamente preciso con una profunda comprensión contextual.	Rápido y eficiente, con precisión moderada.	Altamente escalable, con eficacia establecida
	Pruebe la API de reranker gratis	Pruebe incorporar API de forma gratuita

La evolución de las incrustaciones Póster

Descubra el póster ideal para su espacio, con infografías cautivadoras o imágenes impresionantes que rastrean la evolución de los modelos de incrustación de texto desde 1950.

Aprende cómo lo hicimos

Compre una copia impresa

Preguntas más frecuentes

¿Cómo se entrenaron los modelos de incrustación de Jina?

¿Cuáles son sus modelos de incrustación multimodal?

¿Qué idiomas admiten sus modelos?

¿Cuál es la longitud máxima para la entrada de una sola oración?

¿Cuál es el número máximo de frases que puedo incluir en una sola solicitud?

¿Cómo envío imágenes a modelos de incrustación multimodal?

¿Cómo se comparan los modelos de Jina Embeddings con las últimas incorporaciones de OpenAI y Cohere?

¿Qué tan fluida es la transición de text-embedding-3-large de OpenAI a su solución?

¿Cómo se calculan los tokens cuando se utilizan los modelos jina-clip?

Los tokens se calculan en función de la longitud del texto y el tamaño de la imagen. Para el texto de la solicitud, los tokens se contabilizan de la forma estándar. Para las imágenes, se realizan los siguientes pasos: 1. Tamaño del mosaico: Cada imagen se divide en mosaicos. Para jina-embeddings-v4, los mosaicos miden 28x28 píxeles, para jina-clip-v2, los mosaicos miden 512x512 píxeles, mientras que para jina-clip-v1, los mosaicos miden 224x224 píxeles. 2. Cobertura: Se calcula el número de mosaicos necesarios para cubrir la imagen de entrada. Incluso si las dimensiones de la imagen no son perfectamente divisibles por el tamaño del mosaico, los mosaicos parciales se contabilizan como mosaicos completos. 3. Mosaicos totales: El número total de mosaicos que cubren la imagen determina el coste. Por ejemplo, una imagen de 600x600 píxeles estaría cubierta por mosaicos de 22x22 (484 mosaicos) en jina-embeddings-v4, por mosaicos de 2x2 (4 mosaicos) en jina-clip-v2 y por mosaicos de 3x3 (9 mosaicos) en jina-clip-v1. 4. Cálculo del coste: Para jina-embeddings-v4, cada mosaico cuesta 10 tokens; para jina-clip-v2, cada mosaico cuesta 4000 tokens; mientras que para jina-clip-v1, cada mosaico cuesta 1000 tokens. Ejemplo: Para una imagen con dimensiones de 600x600 píxeles: • Con jina-embeddings-v4 • La imagen se divide en mosaicos de 28x28 píxeles. • El número total de mosaicos requeridos es 22 (horizontales) x 22 (verticales) = 484 mosaicos. • El costo de jina-embeddings-v4 será de 484*10 = 4840 tokens. • Con jina-clip-v2 • La imagen se divide en mosaicos de 512x512 píxeles. • El número total de mosaicos requeridos es 2 (horizontales) x 2 (verticales) = 4 mosaicos. • El costo de jina-clip-v2 será de 4*4000 = 16000 tokens. • Con jina-clip-v1 • La imagen se divide en mosaicos de 224x224 píxeles. • El número total de fichas necesarias es 3 (horizontales) x 3 (verticales) = 9 fichas. • El coste de jina-clip-v1 será 9*1000 = 9000 tokens.

¿Proporcionan modelos para incrustar imágenes o audio?

¿Se pueden ajustar los modelos de Jina Embedding con datos privados o de la empresa?

¿Se pueden alojar sus puntos finales de forma privada en AWS, Azure o GCP?

¿Qué es el parámetro 'tarea' y cuándo debo usarlo?

¿Qué es la recuperación de interacción tardía y qué modelos la admiten?

¿Qué es la fragmentación tardía y cuándo debo utilizarla?

¿Por qué la API admite una longitud de contexto diferente a la capacidad máxima del modelo?

¿Por qué jina-embeddings-v4 es gratuito y por qué es lento?

¿Cuáles son los límites de velocidad para la API de incrustaciones?

¿Cuáles son los límites de longitud de contexto para cada modelo de incrustación?

¿Cuáles son los límites de tamaño de archivo para imágenes y archivos PDF?

¿Cómo obtener mi clave API?

¿Cuál es el límite de velocidad?

Límite de velocidad

Columnas

Producto	Punto final de API	Descripción	Sin clave API	con clave API gratuita	con clave API de pago	con clave API Premium	Latencia media	Recuento de uso de tokens	Solicitud Permitida
API de lector	`https://r.jina.ai`	Convertir URL a texto compatible con LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Cuente la cantidad de tokens en la respuesta de salida.	GET/POST
API de lector	`https://s.jina.ai`	Busque en la web y convierta los resultados en texto compatible con LLM		100 RPM	100 RPM	1000 RPM	2.5s	Cada solicitud cuesta una cantidad fija de tokens, a partir de 10000 tokens	GET/POST
API de incrustación	`https://api.jina.ai/v1/embeddings`	Convertir texto/imágenes en vectores de longitud fija		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	depende del tamaño de entrada	Cuente la cantidad de tokens en la solicitud de entrada.	POST
API de reclasificación	`https://api.jina.ai/v1/rerank`	Clasificar documentos por consulta		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	depende del tamaño de entrada	Cuente la cantidad de tokens en la solicitud de entrada.	POST
API de clasificador	`https://api.jina.ai/v1/train`	Entrenar un clasificador usando ejemplos etiquetados		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	depende del tamaño de entrada	Los tokens se cuentan como: input_tokens × num_iters	POST
API de clasificador (Disparo cero)	`https://api.jina.ai/v1/classify`	Clasificar las entradas utilizando la clasificación de disparo cero		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	depende del tamaño de entrada	Los tokens se cuentan como: input_tokens + label_tokens	POST
API de clasificador (Pocos disparos)	`https://api.jina.ai/v1/classify`	Clasifique las entradas utilizando un clasificador de pocos disparos entrenado		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	depende del tamaño de entrada	Los tokens se cuentan como: input_tokens	POST
API de segmentación	`https://api.jina.ai/v1/segment`	Tokenizar y segmentar textos largos	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	El token no se cuenta como uso.	GET/POST
Búsqueda profunda	`https://deepsearch.jina.ai/v1/chat/completions`	Razonar, buscar e iterar para encontrar la mejor respuesta.		50 RPM	50 RPM	500 RPM	56.7s	Cuente el número total de tokens en todo el proceso.	POST

¿Necesito una licencia comercial?

Autocomprobación de licencia CC BY-NC

¿Está utilizando nuestra API oficial o imágenes oficiales en Azure, AWS o GCP?

Sí

¿Puedo usar la misma clave API para las API de lectura, inserción, reclasificación, clasificación y ajuste?

¿Puedo monitorear el uso del token de mi clave API?

¿Qué debo hacer si olvido mi clave API?

¿Caducan las claves API?

¿Puedo transferir tokens entre claves API?

¿Puedo revocar mi clave API?

¿Por qué la primera solicitud de algunos modelos es lenta?

¿Se utilizan mis datos de API para entrenar sus modelos?

¿Cuáles son los límites de velocidad para las API de Jina?

¿Existen límites de tamaño de lote para las API?

¿La facturación se basa en el número de sentencias o solicitudes?

¿Hay una prueba gratuita disponible para nuevos usuarios?

¿Se cobran tokens por solicitudes fallidas?

¿Qué métodos de pago se aceptan?

¿Está disponible la facturación para compras de tokens?