Новости
Модели
API
keyboard_arrow_down
Читатель
Читайте URL-адреса и ищите информацию в Интернете для получения более подходящей подготовки для получения степени магистра права.
Вложения
Мультимодальные многоязычные вложения мирового класса.
Реранкер
Нейронный ретривер мирового класса для максимального повышения релевантности поиска.
MCP terminalCLIarticlellms.txtsmart_toyАгентыdata_objectСхемаmenu_bookДокументы



Авторизоваться
login

Вложения

Высокопроизводительные мультимодальные многоязычные встраивания с длинным контекстом для приложений поиска, RAG и агентов.

Встраивание API

Попробуйте наши модели внедрения мирового класса, чтобы улучшить свои системы поиска и RAG. Начните с бесплатной пробной версии!
keyКлюч API и биллинг
codeПрименение
more_horizБолее
chevron_leftchevron_right

home
speedОграничение скорости
bug_reportПоднять вопрос
help_outlineЧасто задаваемые вопросы
Статус
chevron_leftchevron_right


Пример входных данных
Измените их и посмотрите, как изменится реакция!
Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.
Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.
Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.
针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。
新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

upload
Запрос
curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品:体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计,温和滋润,保护您的肌肤不受刺激。让您的肌肤告别不适,迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF


v5-text: Новые передовые малоформатные многоязычные эмбеддинги

jina-embeddings-v5-text обеспечивает качество встраивания пятого поколения в двух эффективных размерах — малом (677 МБ) и нано (239 МБ) — с адаптерами LoRA, специфичными для конкретных задач, размерами Matryoshka, контекстом 32K и квантизацией GGUF/MLX для развертывания на периферии сети, устанавливая новые стандарты в задачах MMTEB, MTEB English и поиска информации.
Прочитать примечание к выпускуarrow_forward

v4: Универсальные вложения для мультимодального многоязычного поиска

jina-embeddings-v4 — это наш самый значительный шаг вперед на данный момент — модель объемом 3,8 млрд, которая встраивает текст и изображения с помощью единого пути, поддерживая как плотное, так и позднее взаимодействие при извлечении, превосходя при этом фирменные модели от Google, OpenAI и Voyage AI, особенно при извлечении визуально насыщенных документов.

Два способа покупки

Подпишитесь на наш API или приобретите подписку через облачных провайдеров.
radio_button_unchecked
cloud
С 3 поставщиками облачных услуг
Ваша компания использует AWS или Azure? Затем напрямую разверните наши модели базы поиска на этих платформах в вашей компании, чтобы ваши данные оставались в безопасности и соответствовали требованиям.
AWS SageMaker
Вложения
Реранкер
Microsoft Azure
Вложения
Реранкер
Google Cloud
Вложения
radio_button_checked
С API Jina Search Foundation
Самый простой способ получить доступ ко всем нашим продуктам. Пополняйте токены по мере использования.
Пополните этот ключ API дополнительными токенами
В зависимости от вашего местоположения с вас может взиматься плата в долларах США, евро или других валютах. Могут взиматься налоги.
Пожалуйста, введите правильный ключ API для пополнения счета.
Понять ограничение скорости
Ограничения скорости — это максимальное количество запросов, которые можно сделать к API в течение минуты на IP-адрес/ключ API (RPM). Узнайте больше об ограничениях скорости для каждого продукта и уровня ниже.
keyboard_arrow_down
Ограничение скорости
Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.
ПродуктКонечная точка APIОписаниеarrow_upwardбез API-ключаkey_offс бесплатным API-ключомkeyс платным API-ключомkeyс премиум-ключом APIkeyСредняя задержкаПодсчет использования токеновРазрешенный запрос
API-интерфейс читателяhttps://r.jina.aiПреобразовать URL в текст, понятный LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sПодсчитайте количество токенов в выходном ответе.GET/POST
API-интерфейс читателяhttps://s.jina.aiПоиск в Интернете и преобразование результатов в текст, понятный LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sКаждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.GET/POST
API реранкераhttps://api.jina.ai/v1/rerankРанжировать документы по запросуblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
Встраивание APIhttps://api.jina.ai/v1/embeddingsПреобразование текста/изображений в векторы фиксированной длиныblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
API классификатораhttps://api.jina.ai/v1/trainОбучить классификатор с использованием маркированных примеровblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены подсчитываются как: input_tokens × num_itersPOST
API классификатора (Несколько выстрелов)https://api.jina.ai/v1/classifyКлассифицируйте входные данные с помощью обученного классификатора с несколькими попыткамиblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены учитываются как: input_tokensPOST
API классификатора (Нулевой выстрел)https://api.jina.ai/v1/classifyКлассифицируйте входные данные, используя классификацию с нулевым результатомblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены считаются как: input_tokens + label_tokensPOST
API сегментатораhttps://api.jina.ai/v1/segmentТокенизация и сегментация длинного текста20 RPM200 RPM200 RPM1,000 RPM0.3sТокен не считается использованием.GET/POST
Глубокий поискhttps://deepsearch.jina.ai/v1/chat/completionsРассуждайте, ищите и повторяйте, чтобы найти лучший ответ.block50 RPM50 RPM500 RPM56.7sПодсчитайте общее количество токенов за весь процесс.POST

Локальное развертывание

Развертывайте модели Jina Embeddings в AWS Sagemaker и Microsoft Azure, а вскоре и в Google Cloud Services, или свяжитесь с нашим отделом продаж, чтобы получить индивидуальные развертывания Kubernetes для вашего виртуального частного облака и локальных серверов.
AWS SageMaker
Вложения
Реранкер
Microsoft Azure
Вложения
Реранкер
Google Cloud
Вложения
API-интеграция
Наш API для встраивания изначально интегрирован с различными известными базами данных, векторными хранилищами, платформами RAG и LLMOps. Для начала просто скопируйте и вставьте свой ключ API в любую из перечисленных интеграций для быстрого и беспроблемного запуска.
Векторный магазин
LLMOps
ТРЯПКА
Наблюдаемость
open_in_new
MongoDB
open_in_new
DataStax
open_in_new
Qdrant
open_in_new
Pinecone
open_in_new
Chroma
open_in_new
Weaviate
open_in_new
Milvus
open_in_new
Epsilla
open_in_new
MyScale
open_in_new
LlamaIndex
open_in_new
Haystack
open_in_new
Langchain
open_in_new
Dify
open_in_new
SuperDuperDB
open_in_new
DashVector
open_in_new
Portkey
open_in_new
Baseten
open_in_new
TiDB
open_in_new
LanceDB
open_in_new
Carbon

Наши публикации

Поймите, как наши модели поиска на границе были обучены с нуля, ознакомьтесь с нашими последними публикациями. Познакомьтесь с нашей командой в EMNLP, SIGIR, ICLR, NeurIPS и ICML!
arXiv
февраль 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
arXiv
февраль 11, 2026
Embedding Inversion via Conditional Masked Diffusion Language Models
ICLR 2026
январь 22, 2026
Embedding Compression via Spherical Coordinates
arXiv
декабрь 29, 2025
Vision Encoders in Vision-Language Models: A Survey
ICLR 2026
декабрь 04, 2025
Jina-VLM: Small Multilingual Vision Language Model
AAAI 2026
октябрь 01, 2025
jina-reranker-v3: Last but Not Late Interaction for Document Reranking
NeurIPS 2025
август 31, 2025
Efficient Code Embeddings from Code Generation Models
EMNLP 2025
июнь 24, 2025
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval
ICLR 2025
март 04, 2025
ReaderLM-v2: Small Language Model for HTML to Markdown and JSON
ACL 2025
декабрь 17, 2024
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark
ICLR 2025
декабрь 12, 2024
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images
ECIR 2025
сентябрь 18, 2024
jina-embeddings-v3: Multilingual Embeddings With Task LoRA
SIGIR 2025
сентябрь 07, 2024
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models
EMNLP 2024
август 30, 2024
Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever
WWW 2025
июнь 21, 2024
Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models
ICML 2024
май 30, 2024
Jina CLIP: Your CLIP Model Is Also Your Text Retriever
arXiv
февраль 26, 2024
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings
arXiv
октябрь 30, 2023
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents
EMNLP 2023
июль 20, 2023
Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models
Всего публикаций 19.

Изучение вложений

С чего начать встраивание? Мы вас прикроем. Узнайте о встраиваниях с нуля с помощью нашего подробного руководства.
Abstract illustration of a sound wave or heartbeat, formed by blue, orange, and gray dots on a white background.
март 11, 2026 • 7 минуты чтения
Bootstrapping Audio Embeddings from Multimodal LLMs
Turn any multimodal LLM into a small audio embedding model that beats CLAP with 25x less data.
Han Xiao
Fingerprint illustration made from numbers, showcasing digital and high-tech design on a light background.
март 06, 2026 • 6 минуты чтения
Identifying Embedding Models from Raw Numerical Values
A tiny transformer that fingerprints embedding models by reading raw numerical digits. No feature engineering.
Han Xiao
Abstract digital artwork in black and white, featuring scattered dots forming letters in a halftone effect. The central lette
февраль 19, 2026 • 7 минуты чтения
jina-embeddings-v5-text: New SOTA Small Multilingual Embeddings
Two sub-1B multilingual embeddings with best-in-class performance, available on Elastic Inference Service, Llama.cpp and MLX.
Han Xiao
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
февраль 17, 2026
jina-embeddings-v5-text: Task-Targeted Embedding Distillation
Text embedding models are widely used for semantic similarity tasks, including information retrieval, clustering, and classification. General-purpose models are typically trained with single- or multi-stage processes using contrastive loss functions. We introduce a novel training regimen that combines model distillation techniques with task-specific contrastive loss to produce compact, high-performance embedding models. Our findings suggest that this approach is more effective for training small models than purely contrastive or distillation-based training paradigms alone. Benchmark scores for the resulting models, jina-embeddings-v5-text-small and jina-embeddings-v5-text-nano, exceed or match the state-of-the-art for models of similar size. jina-embeddings-v5-text models additionally support long texts (up to 32k tokens) in many languages, and generate embeddings that remain robust under truncation and binary quantization. Model weights are publicly available, hopefully inspiring further advances in embedding model development.

Сравнение реранкера, векторного поиска и BM25

В таблице ниже представлено всестороннее сравнение Reranker, Vector/Embeddings Search и BM25, подчеркивая их сильные и слабые стороны в различных категориях.
РеранкерВекторный поискБМ25
Лучшее дляПовышенная точность и релевантность поискаНачальная, быстрая фильтрацияОбщий поиск текста по широкому кругу запросов
ДетализацияПодробно: вложенный документ и сегмент запроса.Широкий: все документы.Средний уровень: различные фрагменты текста.
Сложность времени запросаВысокийСерединаНизкий
Индексация временной сложностиНе требуетсяВысокийНизкий, использует готовый индекс
Сложность времени обученияВысокийВысокийНе требуется
Качество поискаПревосходно для тонких запросовБаланс между эффективностью и точностьюСогласованность и надежность для широкого круга запросов
Сильные стороныВысокая точность и глубокое понимание контекстаБыстро и эффективно, с умеренной точностью.Высокая масштабируемость и доказанная эффективность
Попробуйте API реранкера бесплатноПопробуйте встроить API бесплатно

Плакат «Эволюция вложений»

Откройте для себя идеальный плакат для вашего помещения с увлекательной инфографикой или захватывающими визуальными эффектами, прослеживающими эволюцию моделей встраивания текста с 1950 года.
Узнайте, как мы это сделали
shopping_cartКупить бумажную копию

Часто задаваемые вопросы

Как обучались модели встраивания Jina?
keyboard_arrow_down
Подробную информацию о наших процессах обучения, источниках данных и оценках можно найти в наших технических отчетах на arXiv по jina-embeddings-v3 и jina-embeddings-v4.
launcharXiv
Какие у вас модели мультимодального встраивания?
keyboard_arrow_down
jina-embeddings-v4 — это наша новейшая универсальная мультимодальная модель (3,8 млрд параметров), поддерживающая текст и изображения с контекстом 32 тыс., плотным поиском и поиском с поздним взаимодействием, а также демонстрирующая лучшие результаты на визуально насыщенных документах. jina-clip-v2 — это более лёгкий вариант (865 млн параметров), поддерживающий 89 языков, с разрешением изображений 512x512 и представлением в виде матрёшки. Обе модели превосходно справляются с задачами поиска текста-текста, текста-изображения и изображения-изображения.
launcharXiv
Какие языки поддерживают ваши модели?
keyboard_arrow_down
Оба модуля jina-embeddings-v4 и jina-embeddings-v3 поддерживают 89 языков и демонстрируют высокую производительность в многоязычной среде. В число 30 наиболее популярных языков входят: арабский, бенгальский, китайский, датский, нидерландский, английский, финский, французский, грузинский, немецкий, греческий, хинди, индонезийский, итальянский, японский, корейский, латышский, норвежский, польский, португальский, румынский, русский, словацкий, испанский, шведский, тайский, турецкий, украинский, урду и вьетнамский. jina-clip-v2 также поддерживает 89 языков для мультимодальных задач.
launcharXiv
Какова максимальная длина ввода одного предложения?
keyboard_arrow_down
Длина контекста варьируется в зависимости от модели: jina-embeddings-v4 поддерживает до 32 000 токенов, в то время как jina-embeddings-v3 и jina-clip-v2 поддерживают до 8192 токенов. Токен может представлять собой как один символ, так и целое слово. Расширенный контекст обеспечивает всесторонний анализ документов и более высокую точность понимания контекста для больших объемов текстовых данных.
Какое максимальное количество предложений я могу включить в один запрос?
keyboard_arrow_down
Жестких ограничений на количество элементов в одном запросе нет. API внутренне группирует входные данные по количеству токенов для оптимального использования графического процессора. Вы можете отправить столько текстовых сообщений или изображений, сколько необходимо, в одном запросе.
Как отправить изображения в модели мультимодального встраивания?
keyboard_arrow_down
Для jina-embeddings-v4, jina-clip-v2 и jina-clip-v1 в поле input запроса API можно использовать либо url, либо bytes. Для url укажите URL изображения, которое вы хотите обработать. Для bytes закодируйте изображение в формате base64. jina-embeddings-v4 также может напрямую встраивать PDF-документы, передавая URL PDF-файла или закодированные в base64 байта PDF-файла.
Как модели Jina Embeddings соотносятся с новейшими встраиваниями OpenAI и Cohere?
keyboard_arrow_down
jina-embeddings-v4 — наша новейшая флагманская модель, демонстрирующая лучшие результаты в задачах поиска визуально насыщенных документов (ViDoRe) и многомодальных тестах. В задачах, связанных только с текстом, jina-embeddings-v3 превосходит OpenAI и Cohere в тестах MTEB English и Multilingual, при этом будучи меньше по размеру и эффективнее. Обе модели поддерживают обучение представлению «матрёшка» (MRL), позволяющее усекать размерность (до 32 для v3, до 128 для v4) без существенной потери производительности.
Насколько плавным будет переход от text-embedding-3-large от OpenAI к вашему решению?
keyboard_arrow_down
Переход оптимизирован, так как наша конечная точка API соответствует входным и выходным схемам JSON модели OpenAI text-embedding-3-large. Эта совместимость гарантирует, что пользователи могут легко заменить модель OpenAI на нашу при использовании конечной точки OpenAI.
Как рассчитываются токены при использовании моделей jina-clip?
keyboard_arrow_down
Токены рассчитываются на основе длины текста и размера изображения. Для текста в запросе токены подсчитываются стандартным образом. Для изображений выполняются следующие шаги: 1. Размер плитки: каждое изображение делится на плитки. Для jina-embeddings-v4 плитки имеют размер 28x28 пикселей, для jina-clip-v2 — 512x512 пикселей, а для jina-clip-v1 — 224x224 пикселя. 2. Покрытие: вычисляется количество плиток, необходимых для покрытия входного изображения. Даже если размеры изображения не делятся на размер плитки, частичные плитки считаются полными плитками. 3. Общее количество плиток: общее количество плиток, покрывающих изображение, определяет стоимость. Например, изображение размером 600x600 пикселей будет покрыто плитками 22x22 (484 плитки) в jina-embeddings-v4, плитками 2x2 (4 плитки) в jina-clip-v2 и плитками 3x3 (9 плиток) в jina-clip-v1. 4. Расчет стоимости: для jina-embeddings-v4 каждая плитка стоит 10 токенов, для jina-clip-v2 каждая плитка стоит 4000 токенов, а для jina-clip-v1 каждая плитка стоит 1000 токенов. Пример: Для изображения размером 600x600 пикселей: • С jina-embeddings-v4 • Изображение делится на плитки размером 28x28 пикселей. • Общее количество требуемых плиток составляет 22 (по горизонтали) x 22 (по вертикали) = 484 плитки. • Стоимость для jina-embeddings-v4 составит 484*10 = 4840 токенов. • С jina-clip-v2 • Изображение делится на плитки размером 512x512 пикселей. • Общее количество требуемых плиток составляет 2 (по горизонтали) x 2 (по вертикали) = 4 плитки. • Стоимость для jina-clip-v2 составит 4*4000 = 16000 токенов. • С jina-clip-v1 • Изображение делится на плитки размером 224x224 пикселей. • Общее количество требуемых плиток составляет 3 (по горизонтали) x 3 (по вертикали) = 9 плиток. • Стоимость jina-clip-v1 составит 9*1000 = 9000 токенов.
Предоставляете ли вы модели для встраивания изображений или аудио?
keyboard_arrow_down
Да, jina-clip-v2 и jina-clip-v1 могут встраивать как изображения, так и тексты. Скоро будет объявлено о встраивании моделей в большем количестве модальностей!
Можно ли точно настроить модели Jina Embedding с использованием частных данных или данных компании?
keyboard_arrow_down
По вопросам точной настройки наших моделей с использованием конкретных данных свяжитесь с нами, чтобы обсудить ваши требования. Мы открыты для изучения того, как наши модели могут быть адаптированы к вашим потребностям.
Контакт
Могут ли ваши конечные точки размещаться в частном порядке на AWS, Azure или GCP?
keyboard_arrow_down
Да, наши услуги доступны на торговых площадках AWS, Azure и GCP. Если у вас есть особые требования, свяжитесь с нами по адресу sales AT jina.ai.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
Что представляет собой параметр 'task' и когда его следует использовать?
keyboard_arrow_down
Параметр task в пакетах jina-embeddings-v3 и jina-embeddings-v4 активирует адаптеры LoRA, специфичные для каждой задачи, для оптимальной производительности. Используйте retrieval.query для поисковых запросов, retrieval.passage для поиска документов, text-matching для определения семантического сходства, classification для классификации текста и separation для задач кластеризации.
Что такое извлечение информации при позднем взаимодействии и какие модели его поддерживают?
keyboard_arrow_down
jina-embeddings-v4 поддерживает как плотный (одновекторный), так и многовекторный (с поздним взаимодействием) поиск с помощью параметра output_type. Позднее взаимодействие сохраняет более детальную информацию на уровне токенов для повышения точности поиска сложных запросов. jina-colbert-v2 — это специализированная модель для позднего взаимодействия.
Что такое «позднее сегментирование» и когда его следует использовать?
keyboard_arrow_down
Метод поздней сегментации (late chunking) сначала встраивает весь документ, используя модели с длинным контекстом, а затем извлекает векторные представления фрагментов из представлений на уровне токенов. В отличие от наивной сегментации (сначала фрагмент, затем встраивание), поздная сегментация сохраняет контекст между фрагментами, улучшая поиск для приложений RAG. Включить её можно с помощью параметра late_chunking в файле jina-embeddings-v3.
Почему API поддерживает длину контекста, отличающуюся от максимальной емкости модели?
keyboard_arrow_down
Хотя некоторые из наших моделей встраивания архитектурно способны обрабатывать контексты большей длины, API может устанавливать более низкие ограничения из-за ограничений видеопамяти графического процессора в нашей инфраструктуре вывода. Обработка очень длинных последовательностей требует значительного объема памяти, и мы оптимизируем нашу конфигурацию обслуживания, чтобы сбалансировать пропускную способность, задержку и стоимость для большинства сценариев использования. Если вам требуется поддержка контекстов большей длины, пожалуйста, свяжитесь с нашей командой продаж, чтобы обсудить варианты выделенного развертывания.
Почему jina-embeddings-v4 бесплатна и почему она работает медленно?
keyboard_arrow_down
Модель `jina-embeddings-v4` построена на основе базовой модели Qwen2-VL, распространяемой под лицензией Qwen Research License. Эта лицензия разрешает только исследовательское и некоммерческое использование, что означает, что мы не можем предлагать `jina-embeddings-v4` в качестве коммерческого продукта. В результате мы предоставляем доступ к модели бесплатно через наш API. Существует две причины, по которым `jina-embeddings-v4` может казаться медленнее, чем другие модели: во-первых, `jina-embeddings-v4` значительно больше, чем `jina-embeddings-v3`, поэтому она по своей природе требует больше вычислительного времени на каждый запрос. Во-вторых, поскольку мы не можем коммерциализировать эту модель, мы намеренно ограничиваем пропускную способность API для управления затратами на инфраструктуру. Пользователям не следует ожидать высокой пропускной способности или уровня производственной среды при использовании API `jina-embeddings-v4`. Для производственных нагрузок, требующих более высокой пропускной способности, мы рекомендуем использовать jina-embeddings-v3 или развернуть jina-embeddings-v4 на вашей собственной инфраструктуре с помощью Hugging Face.
Каковы ограничения скорости запросов к API Embeddings?
keyboard_arrow_down
Ограничения скорости зависят от типа вашего API-ключа:

Бесплатно: 100 RPM, 100K TPM, 2 одновременных запроса
Платно: 500 RPM, 2M TPM, 50 одновременных запросов
Премиум: 5000 RPM, 50M TPM, 500 одновременных запросов

Кроме того, существует ограничение скорости на основе IP-адреса в 10 000 запросов за 60 секунд для предотвращения злоупотреблений. Если вам нужны более высокие лимиты, пожалуйста, свяжитесь с нашей командой продаж.
Каковы ограничения по длине контекста для каждой модели встраивания?
keyboard_arrow_down
Для каждой модели существует максимальная длина контекста на вход:

jina-embeddings-v4: 32 768 токенов
jina-embeddings-v3: 8 192 токена
jina-embeddings-v2-*: 8 192 токена
jina-clip-v1/v2: 8 192 токена
jina-colbert-v1/v2: 8 192 токена
jina-code-embeddings-*: 32 768 токенов

Входные данные, превышающие лимит, будут возвращать ошибку, если не установлен параметр truncate: true, который автоматически обрезает данные до максимальной длины.
Каковы ограничения по размеру файлов для изображений и PDF-файлов?
keyboard_arrow_down
Максимальный размер файлов: Изображения: 5 МБ, PDF: 8 МБ. Файлы большего размера будут отклонены с ошибкой.

Как получить мой ключ API?

video_not_supported

Каков предел ставки?

Ограничение скорости
Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.
ПродуктКонечная точка APIОписаниеarrow_upwardбез API-ключаkey_offс бесплатным API-ключомkeyс платным API-ключомkeyс премиум-ключом APIkeyСредняя задержкаПодсчет использования токеновРазрешенный запрос
API-интерфейс читателяhttps://r.jina.aiПреобразовать URL в текст, понятный LLM20 RPM500 RPM500 RPMtrending_up5000 RPM7.9sПодсчитайте количество токенов в выходном ответе.GET/POST
API-интерфейс читателяhttps://s.jina.aiПоиск в Интернете и преобразование результатов в текст, понятный LLMblock100 RPM100 RPMtrending_up1000 RPM2.5sКаждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.GET/POST
API реранкераhttps://api.jina.ai/v1/rerankРанжировать документы по запросуblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
Встраивание APIhttps://api.jina.ai/v1/embeddingsПреобразование текста/изображений в векторы фиксированной длиныblock100 RPM & 100,000 TPM500 RPM & 2,000,000 TPMtrending_up5,000 RPM & 50,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
API классификатораhttps://api.jina.ai/v1/trainОбучить классификатор с использованием маркированных примеровblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены подсчитываются как: input_tokens × num_itersPOST
API классификатора (Несколько выстрелов)https://api.jina.ai/v1/classifyКлассифицируйте входные данные с помощью обученного классификатора с несколькими попыткамиblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены учитываются как: input_tokensPOST
API классификатора (Нулевой выстрел)https://api.jina.ai/v1/classifyКлассифицируйте входные данные, используя классификацию с нулевым результатомblock25 RPM & 25,000 TPM125 RPM & 500,000 TPM1,250 RPM & 12,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены считаются как: input_tokens + label_tokensPOST
API сегментатораhttps://api.jina.ai/v1/segmentТокенизация и сегментация длинного текста20 RPM200 RPM200 RPM1,000 RPM0.3sТокен не считается использованием.GET/POST
Глубокий поискhttps://deepsearch.jina.ai/v1/chat/completionsРассуждайте, ищите и повторяйте, чтобы найти лучший ответ.block50 RPM50 RPM500 RPM56.7sПодсчитайте общее количество токенов за весь процесс.POST

Нужна ли мне коммерческая лицензия?

Самостоятельная проверка лицензии CC BY-NC

play_arrow
Вы используете наш официальный API или официальные образы в Azure, AWS или GCP?
play_arrow
Да
Никаких ограничений. Просто зарегистрируйтесь и оплатите через наш сайт или облачную торговую площадку.
play_arrow
Нет
play_arrow
Вы являетесь платным клиентом Elastic?
play_arrow
Да
Вероятно, коммерческое использование уже включено в вашу лицензию Elastic. Если вы не уверены, свяжитесь с представителем отдела продаж Elastic.
Связаться с отделом продаж
play_arrow
Нет
В настоящее время мы не можем заключать отдельные коммерческие лицензионные соглашения. Для получения дополнительной информации, пожалуйста, свяжитесь с отделом продаж Elastic.
Связаться с отделом продаж
Общие вопросы, связанные с API
code
Могу ли я использовать один и тот же ключ API для чтения, встраивания, переранжирования, классификации и тонкой настройки API?
keyboard_arrow_down
Да, тот же ключ API действителен для всех продуктов search foundation от Jina AI. Это включает в себя API считывателя, встраивания, переранжирования, классификации и тонкой настройки, с общими токенами для всех сервисов.
code
Могу ли я отслеживать использование токена моего ключа API?
keyboard_arrow_down
Да, использование токенов можно отслеживать на вкладке «API Key & Billing», введя свой API-ключ, что позволит вам просматривать недавнюю историю использования и оставшиеся токены. Если вы вошли в панель управления API, эти данные также можно просмотреть на вкладке «Manage API Key».
code
Что мне делать, если я забуду свой ключ API?
keyboard_arrow_down
Если вы потеряли пополненный ключ и хотите его восстановить, обратитесь в службу поддержки AT jina.ai, указав зарегистрированный адрес электронной почты, чтобы получить помощь. Рекомендуется войти в систему, чтобы ваш ключ API был надежно сохранен и легко доступен.
Контакт
code
Срок действия ключей API истекает?
keyboard_arrow_down
Нет, наши ключи API не имеют срока действия. Однако, если вы подозреваете, что ваш ключ был скомпрометирован, и хотите его удалить, обратитесь в нашу службу поддержки за помощью. Вы также можете отозвать свой ключ в панели управления ключами API.
Контакт
code
Могу ли я передавать токены между ключами API?
keyboard_arrow_down
Да, вы можете перенести токены с одного премиум-ключа на другой. После входа в свою учетную запись на панели управления ключами API используйте настройки ключа, который вы хотите перенести, чтобы переместить все оставшиеся оплаченные токены.
code
Могу ли я отозвать свой ключ API?
keyboard_arrow_down
Да, вы можете отозвать свой ключ API, если считаете, что он был скомпрометирован. Отзыв ключа немедленно отключит его для всех пользователей, которые его сохранили, а весь оставшийся баланс и связанные с ним свойства станут навсегда непригодными для использования. Если ключ является премиум-ключом, у вас есть возможность перевести оставшийся оплаченный баланс на другой ключ перед отзывом. Обратите внимание, что это действие нельзя отменить. Чтобы отозвать ключ, перейдите к настройкам ключа на панели управления ключами API.
code
Почему первый запрос для некоторых моделей выполняется медленно?
keyboard_arrow_down
Это происходит потому, что наша архитектура Serverless выгружает определенные модели в периоды низкого использования. Первоначальный запрос активирует или «разогревает» модель, что может занять несколько секунд. После этой первоначальной активации последующие запросы обрабатываются гораздо быстрее.
code
Используются ли данные из моего API для обучения ваших моделей?
keyboard_arrow_down
Нет. Мы никогда не используем ваши API-запросы, входные или выходные данные для обучения наших моделей эмбеддинга, реранжирования или любых других моделей. Ваши данные остаются вашими. Мы соответствуем стандартам SOC 2 Type I и Type II.
code
Каковы ограничения скорости запросов к API Jina?
keyboard_arrow_down
Для каждого ключа API действуют ограничения по количеству запросов:

Бесплатно: 100 RPM, 100K TPM, 2 одновременных запроса
Платно: 500 RPM, 2M TPM, 50 одновременных запросов
Премиум: 5000 RPM, 50M TPM, 500 одновременных запросов

Также существует ограничение по IP-адресу в 10 000 запросов за 60 секунд. Эти ограничения применяются ко всем API Jina (Embeddings, Reranker, Reader и т. д.).
code
Существуют ли ограничения на размер пакета для API?
keyboard_arrow_down
Для API Embeddings и Reranker нет ограничений по размеру пакета. Вы можете отправлять столько элементов или документов, сколько необходимо, за один запрос. Оба API обрабатывают входные данные пакетами по количеству токенов для оптимального использования графического процессора.
Общие вопросы, связанные с выставлением счетов
attach_money
Выставление счетов зависит от количества предложений или запросов?
keyboard_arrow_down
Наша модель ценообразования основана на общем количестве обработанных токенов, что позволяет пользователям гибко распределять эти токены по любому количеству предложений, предлагая экономически эффективное решение для разнообразных требований к анализу текста.
attach_money
Доступна ли бесплатная пробная версия для новых пользователей?
keyboard_arrow_down
Мы предлагаем приветственную бесплатную пробную версию для новых пользователей, которая включает десять миллионов токенов для использования с любой из наших моделей, с помощью автоматически сгенерированного ключа API. После того, как будет достигнут лимит бесплатных токенов, пользователи могут легко приобрести дополнительные токены для своих ключей API через вкладку «Купить токены».
attach_money
Взимаются ли токены за неудачные запросы?
keyboard_arrow_down
Нет, токены не снимаются за неудачные запросы.
attach_money
Какие способы оплаты принимаются?
keyboard_arrow_down
Платежи обрабатываются через Stripe, поддерживающий для вашего удобства различные способы оплаты, включая кредитные карты, Google Pay и PayPal.
attach_money
Доступно ли выставление счетов за покупку токенов?
keyboard_arrow_down
Да, после покупки токенов на адрес электронной почты, связанный с вашей учетной записью Stripe, будет выставлен счет.
Офисы
location_on
Саннивейл, Калифорния
710 Lakeway Dr, Ste 200, Саннивейл, Калифорния 94085, США
location_on
Берлин, Германия
Prinzessinnenstraße 19-20, 10969 Берлин, Германия
Поиск Фонда
Читатель
Вложения
Реранкер
Получить API-ключ Jina
Ограничение скорости
Статус API
Компания
О нас
Связаться с отделом продаж
отдел новостей
Стажерская программа
Загрузить логотип Jina
open_in_new
Скачать логотип Elastic
open_in_new
Условия
Безопасность
Условия использования
Конфиденциальность
Управление файлами cookie
email
Jina AI от Elastic © 2020-2026.