Вложения

Высокопроизводительные мультимодальные многоязычные встраивания с длинным контекстом для приложений поиска, RAG и агентов.

Встраивание API

Попробуйте наши модели внедрения мирового класса, чтобы улучшить свои системы поиска и RAG. Начните с бесплатной пробной версии!

Ограничение скорости

Поднять вопрос

Часто задаваемые вопросы

Статус

Выберите вложения

Нормализация L2

Масштабирование векторных представлений до единичной длины (норма L2 = 1). Необходимо для определения косинусного сходства с помощью скалярного произведения.

Тип выходных данных

embedding_type

encoding_format

output_dtype

embedding_types

Выберите формат вывода: число с плавающей запятой (по умолчанию), двоичный (для компактного хранения) или base64 (для эффективной передачи).

По умолчанию (как плавающее значение)

Пример входных данных

Измените их и посмотрите, как изменится реакция!

Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.

Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.

Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.

针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。

新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

Запрос

Bash

Язык

curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF

API-ключ

Доступные токены

Это ваш уникальный ключ. Храните его в надежном месте!

v5-omni: Единое встраивание для всех

Текст, изображение, аудио, видео — одно общее пространство для встраивания, два размера. v5-omni-small (1,6 млрд) — это наиболее производительная модель омни с открытыми весами при параметрах менее 2 млрд. v5-omni-nano (0,9 млрд) обеспечивает конкурентоспособный поиск при параметрах менее 1 млрд. Обе модели побайтно совместимы с v5-text — переиндексация не требуется.

v5-text: Новые передовые малоформатные многоязычные эмбеддинги

jina-embeddings-v5-text обеспечивает качество встраивания пятого поколения в двух эффективных размерах — малом (677 МБ) и нано (239 МБ) — с адаптерами LoRA, специфичными для конкретных задач, размерами Matryoshka, контекстом 32K и квантизацией GGUF/MLX для развертывания на периферии сети, устанавливая новые стандарты в задачах MMTEB, MTEB English и поиска информации.

Два способа покупки

Подпишитесь на наш API или приобретите подписку через облачных провайдеров.

С 3 поставщиками облачных услуг

Ваша компания использует AWS или Azure? Затем напрямую разверните наши модели базы поиска на этих платформах в вашей компании, чтобы ваши данные оставались в безопасности и соответствовали требованиям.

С API Jina Search Foundation

Самый простой способ получить доступ ко всем нашим продуктам. Пополняйте токены по мере использования.

Введите ключ API, который вы хотите пополнить.

Пополните этот ключ API дополнительными токенами

В зависимости от вашего местоположения с вас может взиматься плата в долларах США, евро или других валютах. Могут взиматься налоги.

Пожалуйста, введите правильный ключ API для пополнения счета.

Понять ограничение скорости

Ограничения скорости — это максимальное количество запросов, которые можно сделать к API в течение минуты на IP-адрес/ключ API (RPM). Узнайте больше об ограничениях скорости для каждого продукта и уровня ниже.

Ограничение скорости

Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.

Колонки

Продукт	Конечная точка API	Описание	без API-ключа	с бесплатным API-ключом	с платным API-ключом	с премиум-ключом API	Средняя задержка	Подсчет использования токенов	Разрешенный запрос
API-интерфейс читателя	`https://r.jina.ai`	Преобразовать URL в текст, понятный LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Подсчитайте количество токенов в выходном ответе.	GET/POST
API-интерфейс читателя	`https://s.jina.ai`	Поиск в Интернете и преобразование результатов в текст, понятный LLM		100 RPM	100 RPM	1000 RPM	2.5s	Каждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.	GET/POST
API реранкера	`https://api.jina.ai/v1/rerank`	Ранжировать документы по запросу		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	зависит от размера входных данных	Подсчитайте количество токенов во входном запросе.	POST
Встраивание API	`https://api.jina.ai/v1/embeddings`	Преобразование текста/изображений в векторы фиксированной длины		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	зависит от размера входных данных	Подсчитайте количество токенов во входном запросе.	POST
API классификатора	`https://api.jina.ai/v1/train`	Обучить классификатор с использованием маркированных примеров		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	зависит от размера входных данных	Токены подсчитываются как: input_tokens × num_iters	POST
API классификатора (Несколько выстрелов)	`https://api.jina.ai/v1/classify`	Классифицируйте входные данные с помощью обученного классификатора с несколькими попытками		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	зависит от размера входных данных	Токены учитываются как: input_tokens	POST
API классификатора (Нулевой выстрел)	`https://api.jina.ai/v1/classify`	Классифицируйте входные данные, используя классификацию с нулевым результатом		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	зависит от размера входных данных	Токены считаются как: input_tokens + label_tokens	POST
API сегментатора	`https://api.jina.ai/v1/segment`	Токенизация и сегментация длинного текста	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Токен не считается использованием.	GET/POST
Глубокий поиск	`https://deepsearch.jina.ai/v1/chat/completions`	Рассуждайте, ищите и повторяйте, чтобы найти лучший ответ.		50 RPM	50 RPM	500 RPM	56.7s	Подсчитайте общее количество токенов за весь процесс.	POST

Автоматическое пополнение при низком балансе токенов

Рекомендуется для бесперебойной работы в производстве. Когда баланс вашего токена опустится ниже установленного порога, мы автоматически пополним ваш сохраненный способ оплаты за последний приобретенный пакет, пока порог не будет достигнут.

Мы ввели новую модель ценообразования 6 мая 2025 года. Если вы включили автоматическое пополнение счета до этой даты, вы продолжите платить старую цену (ту, которую вы приобрели). Новая цена применяется только в том случае, если вы измените настройки автоматического пополнения счета или приобретете новый ключ API.

< 1M Токены

Пополняйте, когда

Локальное развертывание

Развертывайте модели Jina Embeddings в AWS Sagemaker и Microsoft Azure, а вскоре и в Google Cloud Services, или свяжитесь с нашим отделом продаж, чтобы получить индивидуальные развертывания Kubernetes для вашего виртуального частного облака и локальных серверов.

AWS SageMaker

Вложения

Реранкер

Microsoft Azure

Вложения

Реранкер

Google Cloud

Вложения

API-интеграция

Наш API для встраивания изначально интегрирован с различными известными базами данных, векторными хранилищами, платформами RAG и LLMOps. Для начала просто скопируйте и вставьте свой ключ API в любую из перечисленных интеграций для быстрого и беспроблемного запуска.

Векторный магазин

LLMOps

ТРЯПКА

Наблюдаемость

MongoDB

DataStax

Qdrant

Pinecone

Chroma

Weaviate

Milvus

Epsilla

MyScale

LlamaIndex

Haystack

Langchain

Dify

SuperDuperDB

DashVector

Portkey

Baseten

TiDB

LanceDB

Carbon

Наши публикации

Поймите, как наши модели поиска на границе были обучены с нуля, ознакомьтесь с нашими последними публикациями. Познакомьтесь с нашей командой в EMNLP, SIGIR, ICLR, NeurIPS и ICML!

arXiv

май 11, 2026

jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

SIGIR 2026

февраль 17, 2026

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

arXiv

февраль 11, 2026

Embedding Inversion via Conditional Masked Diffusion Language Models

ICLR 2026

январь 22, 2026

Embedding Compression via Spherical Coordinates

arXiv

декабрь 29, 2025

Vision Encoders in Vision-Language Models: A Survey

ICLR 2026

декабрь 04, 2025

Jina-VLM: Small Multilingual Vision Language Model

AAAI 2026

октябрь 01, 2025

jina-reranker-v3: Last but Not Late Interaction for Document Reranking

NeurIPS 2025

август 31, 2025

Efficient Code Embeddings from Code Generation Models

EMNLP 2025

июнь 24, 2025

jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval

ICLR 2025

март 04, 2025

ReaderLM-v2: Small Language Model for HTML to Markdown and JSON

ACL 2025

декабрь 17, 2024

AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark

ICLR 2025

декабрь 12, 2024

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

ECIR 2025

сентябрь 18, 2024

jina-embeddings-v3: Multilingual Embeddings With Task LoRA

SIGIR 2025

сентябрь 07, 2024

Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models

EMNLP 2024

август 30, 2024

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

WWW 2025

июнь 21, 2024

Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models

ICML 2024

май 30, 2024

Jina CLIP: Your CLIP Model Is Also Your Text Retriever

arXiv

февраль 26, 2024

Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings

arXiv

октябрь 30, 2023

Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents

EMNLP 2023

июль 20, 2023

Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models

Всего публикаций 20.

Изучение вложений

С чего начать встраивание? Мы вас прикроем. Узнайте о встраиваниях с нуля с помощью нашего подробного руководства.

Сравнение реранкера, векторного поиска и BM25

В таблице ниже представлено всестороннее сравнение Reranker, Vector/Embeddings Search и BM25, подчеркивая их сильные и слабые стороны в различных категориях.

	Реранкер	Векторный поиск	БМ25
Лучшее для	Повышенная точность и релевантность поиска	Начальная, быстрая фильтрация	Общий поиск текста по широкому кругу запросов
Детализация	Подробно: вложенный документ и сегмент запроса.	Широкий: все документы.	Средний уровень: различные фрагменты текста.
Сложность времени запроса	Высокий	Середина	Низкий
Индексация временной сложности	Не требуется	Высокий	Низкий, использует готовый индекс
Сложность времени обучения	Высокий	Высокий	Не требуется
Качество поиска	Превосходно для тонких запросов	Баланс между эффективностью и точностью	Согласованность и надежность для широкого круга запросов
Сильные стороны	Высокая точность и глубокое понимание контекста	Быстро и эффективно, с умеренной точностью.	Высокая масштабируемость и доказанная эффективность
	Попробуйте API реранкера бесплатно	Попробуйте встроить API бесплатно

Плакат «Эволюция вложений»

Откройте для себя идеальный плакат для вашего помещения с увлекательной инфографикой или захватывающими визуальными эффектами, прослеживающими эволюцию моделей встраивания текста с 1950 года.

Узнайте, как мы это сделали

Купить бумажную копию

Часто задаваемые вопросы

Как обучались модели встраивания Jina?

Какие у вас модели мультимодального встраивания?

Какие языки поддерживают ваши модели?

Какова максимальная длина ввода одного предложения?

Какое максимальное количество предложений я могу включить в один запрос?

Как отправить изображения в модели мультимодального встраивания?

Как модели Jina Embeddings соотносятся с новейшими встраиваниями OpenAI и Cohere?

Насколько плавным будет переход от text-embedding-3-large от OpenAI к вашему решению?

Как рассчитываются токены при использовании моделей jina-clip?

Токены рассчитываются на основе длины текста и размера изображения. Для текста в запросе токены подсчитываются стандартным образом. Для изображений выполняются следующие шаги: 1. Размер плитки: каждое изображение делится на плитки. Для jina-embeddings-v4 плитки имеют размер 28x28 пикселей, для jina-clip-v2 — 512x512 пикселей, а для jina-clip-v1 — 224x224 пикселя. 2. Покрытие: вычисляется количество плиток, необходимых для покрытия входного изображения. Даже если размеры изображения не делятся на размер плитки, частичные плитки считаются полными плитками. 3. Общее количество плиток: общее количество плиток, покрывающих изображение, определяет стоимость. Например, изображение размером 600x600 пикселей будет покрыто плитками 22x22 (484 плитки) в jina-embeddings-v4, плитками 2x2 (4 плитки) в jina-clip-v2 и плитками 3x3 (9 плиток) в jina-clip-v1. 4. Расчет стоимости: для jina-embeddings-v4 каждая плитка стоит 10 токенов, для jina-clip-v2 каждая плитка стоит 4000 токенов, а для jina-clip-v1 каждая плитка стоит 1000 токенов. Пример: Для изображения размером 600x600 пикселей: • С jina-embeddings-v4 • Изображение делится на плитки размером 28x28 пикселей. • Общее количество требуемых плиток составляет 22 (по горизонтали) x 22 (по вертикали) = 484 плитки. • Стоимость для jina-embeddings-v4 составит 484*10 = 4840 токенов. • С jina-clip-v2 • Изображение делится на плитки размером 512x512 пикселей. • Общее количество требуемых плиток составляет 2 (по горизонтали) x 2 (по вертикали) = 4 плитки. • Стоимость для jina-clip-v2 составит 4*4000 = 16000 токенов. • С jina-clip-v1 • Изображение делится на плитки размером 224x224 пикселей. • Общее количество требуемых плиток составляет 3 (по горизонтали) x 3 (по вертикали) = 9 плиток. • Стоимость jina-clip-v1 составит 9*1000 = 9000 токенов.

Предоставляете ли вы модели для встраивания изображений или аудио?

Можно ли точно настроить модели Jina Embedding с использованием частных данных или данных компании?

Могут ли ваши конечные точки размещаться в частном порядке на AWS, Azure или GCP?

Что представляет собой параметр 'task' и когда его следует использовать?

Что такое извлечение информации при позднем взаимодействии и какие модели его поддерживают?

Что такое «позднее сегментирование» и когда его следует использовать?

Почему API поддерживает длину контекста, отличающуюся от максимальной емкости модели?

Почему jina-embeddings-v4 бесплатна и почему она работает медленно?

Каковы ограничения скорости запросов к API Embeddings?

Каковы ограничения по длине контекста для каждой модели встраивания?

Каковы ограничения по размеру файлов для изображений и PDF-файлов?

Как получить мой ключ API?

Каков предел ставки?

Ограничение скорости

Колонки

Продукт	Конечная точка API	Описание	без API-ключа	с бесплатным API-ключом	с платным API-ключом	с премиум-ключом API	Средняя задержка	Подсчет использования токенов	Разрешенный запрос
API-интерфейс читателя	`https://r.jina.ai`	Преобразовать URL в текст, понятный LLM	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Подсчитайте количество токенов в выходном ответе.	GET/POST
API-интерфейс читателя	`https://s.jina.ai`	Поиск в Интернете и преобразование результатов в текст, понятный LLM		100 RPM	100 RPM	1000 RPM	2.5s	Каждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.	GET/POST
API реранкера	`https://api.jina.ai/v1/rerank`	Ранжировать документы по запросу		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	зависит от размера входных данных	Подсчитайте количество токенов во входном запросе.	POST
Встраивание API	`https://api.jina.ai/v1/embeddings`	Преобразование текста/изображений в векторы фиксированной длины		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	зависит от размера входных данных	Подсчитайте количество токенов во входном запросе.	POST
API классификатора	`https://api.jina.ai/v1/train`	Обучить классификатор с использованием маркированных примеров		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	зависит от размера входных данных	Токены подсчитываются как: input_tokens × num_iters	POST
API классификатора (Несколько выстрелов)	`https://api.jina.ai/v1/classify`	Классифицируйте входные данные с помощью обученного классификатора с несколькими попытками		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	зависит от размера входных данных	Токены учитываются как: input_tokens	POST
API классификатора (Нулевой выстрел)	`https://api.jina.ai/v1/classify`	Классифицируйте входные данные, используя классификацию с нулевым результатом		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	зависит от размера входных данных	Токены считаются как: input_tokens + label_tokens	POST
API сегментатора	`https://api.jina.ai/v1/segment`	Токенизация и сегментация длинного текста	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Токен не считается использованием.	GET/POST
Глубокий поиск	`https://deepsearch.jina.ai/v1/chat/completions`	Рассуждайте, ищите и повторяйте, чтобы найти лучший ответ.		50 RPM	50 RPM	500 RPM	56.7s	Подсчитайте общее количество токенов за весь процесс.	POST

Нужна ли мне коммерческая лицензия?

Самостоятельная проверка лицензии CC BY-NC

Вы используете наш официальный API или официальные образы в Azure, AWS или GCP?

Да

Нет

Могу ли я использовать один и тот же ключ API для чтения, встраивания, переранжирования, классификации и тонкой настройки API?

Могу ли я отслеживать использование токена моего ключа API?

Что мне делать, если я забуду свой ключ API?

Срок действия ключей API истекает?

Могу ли я передавать токены между ключами API?

Могу ли я отозвать свой ключ API?

Почему первый запрос для некоторых моделей выполняется медленно?

Используются ли данные из моего API для обучения ваших моделей?

Каковы ограничения скорости запросов к API Jina?

Существуют ли ограничения на размер пакета для API?

Выставление счетов зависит от количества предложений или запросов?

Доступна ли бесплатная пробная версия для новых пользователей?

Взимаются ли токены за неудачные запросы?

Какие способы оплаты принимаются?

Доступно ли выставление счетов за покупку токенов?