Новости
Модели
Продукты
keyboard_arrow_down
Читатель
Читайте URL-адреса и ищите информацию в Интернете для получения более подходящей подготовки для получения степени магистра права.
Вложения
Мультимодальные многоязычные вложения мирового класса.
Реранкер
Нейронный ретривер мирового класса для максимального повышения релевантности поиска.
Глубокий поиск
Ищите, читайте и рассуждайте, пока не найдете лучший ответ.
Более
keyboard_arrow_down
Классификатор
Классификация изображений и текста по нулевому и небольшому количеству кадров.
Сегментатор
Разрежьте длинный текст на куски и выполните токенизацию.

API-документы
Автоматическая генерация кода для вашего второго пилота IDE или LLM
open_in_new


Компания
keyboard_arrow_down
О нас
Связаться с отделом продаж
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия использования


Авторизоваться
login

Связаться с отделом продаж

Развивайте свой бизнес с Jina AI.
calculateКонфигуратор корпоративной лицензии

Три способа покупки

Оформите подписку на наш API, приобретите его у поставщиков облачных услуг или получите коммерческую лицензию для своей организации.
radio_button_unchecked
cloud
С 3 поставщиками облачных услуг
Ваша компания использует AWS или Azure? Затем напрямую разверните наши модели базы поиска на этих платформах в вашей компании, чтобы ваши данные оставались в безопасности и соответствовали требованиям.
AWS SageMaker
Вложения
Реранкер
Microsoft Azure
Вложения
Реранкер
Google Cloud
Вложения
Реранкер
radio_button_checked
С API Jina Search Foundation
Самый простой способ получить доступ ко всем нашим продуктам. Пополняйте токены по мере использования.
Пополните этот ключ API дополнительными токенами
В зависимости от вашего местоположения с вас может взиматься плата в долларах США, евро или других валютах. Могут взиматься налоги.
Пожалуйста, введите правильный ключ API для пополнения счета.
Понять ограничение скорости
Ограничения скорости — это максимальное количество запросов, которые можно сделать к API в течение минуты на IP-адрес/ключ API (RPM). Узнайте больше об ограничениях скорости для каждого продукта и уровня ниже.
keyboard_arrow_down
Ограничение скорости
Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.
ПродуктКонечная точка APIОписаниеarrow_upwardбез API-ключаkey_offс API-ключомkeyс премиум-ключом APIkeyСредняя задержкаПодсчет использования токеновРазрешенный запрос
API-интерфейс читателяhttps://r.jina.aiПреобразовать URL в текст, понятный LLM20 RPM500 RPMtrending_up5000 RPM7.9sПодсчитайте количество токенов в выходном ответе.GET/POST
API-интерфейс читателяhttps://s.jina.aiПоиск в Интернете и преобразование результатов в текст, понятный LLMblock100 RPMtrending_up1000 RPM2.5sКаждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.GET/POST
Глубокий поискhttps://deepsearch.jina.ai/v1/chat/completionsРассуждайте, ищите и повторяйте, чтобы найти лучший ответ.block50 RPM500 RPM56.7sПодсчитайте общее количество токенов за весь процесс.POST
API реранкераhttps://api.jina.ai/v1/rerankРанжировать документы по запросуblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
Встраивание APIhttps://api.jina.ai/v1/embeddingsПреобразование текста/изображений в векторы фиксированной длиныblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
API классификатораhttps://api.jina.ai/v1/trainОбучить классификатор с использованием маркированных примеровblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены подсчитываются как: input_tokens × num_itersPOST
API классификатора (Несколько выстрелов)https://api.jina.ai/v1/classifyКлассифицируйте входные данные с помощью обученного классификатора с несколькими попыткамиblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены учитываются как: input_tokensPOST
API классификатора (Нулевой выстрел)https://api.jina.ai/v1/classifyКлассифицируйте входные данные, используя классификацию с нулевым результатомblock200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены считаются как: input_tokens + label_tokensPOST
API сегментатораhttps://api.jina.ai/v1/segmentТокенизация и сегментация длинного текста20 RPM200 RPM1,000 RPM0.3sТокен не считается использованием.GET/POST
radio_button_unchecked
encrypted
С коммерческой лицензией для локального использования
Приобретите коммерческую лицензию для использования наших моделей локально.

Часто задаваемые вопросы

Как получить мой ключ API?

video_not_supported

Каков предел ставки?

Ограничение скорости
Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.
ПродуктКонечная точка APIОписаниеarrow_upwardбез API-ключаkey_offс API-ключомkeyс премиум-ключом APIkeyСредняя задержкаПодсчет использования токеновРазрешенный запрос
API-интерфейс читателяhttps://r.jina.aiПреобразовать URL в текст, понятный LLM20 RPM500 RPMtrending_up5000 RPM7.9sПодсчитайте количество токенов в выходном ответе.GET/POST
API-интерфейс читателяhttps://s.jina.aiПоиск в Интернете и преобразование результатов в текст, понятный LLMblock100 RPMtrending_up1000 RPM2.5sКаждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.GET/POST
Глубокий поискhttps://deepsearch.jina.ai/v1/chat/completionsРассуждайте, ищите и повторяйте, чтобы найти лучший ответ.block50 RPM500 RPM56.7sПодсчитайте общее количество токенов за весь процесс.POST
API реранкераhttps://api.jina.ai/v1/rerankРанжировать документы по запросуblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
Встраивание APIhttps://api.jina.ai/v1/embeddingsПреобразование текста/изображений в векторы фиксированной длиныblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
API классификатораhttps://api.jina.ai/v1/trainОбучить классификатор с использованием маркированных примеровblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены подсчитываются как: input_tokens × num_itersPOST
API классификатора (Несколько выстрелов)https://api.jina.ai/v1/classifyКлассифицируйте входные данные с помощью обученного классификатора с несколькими попыткамиblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены учитываются как: input_tokensPOST
API классификатора (Нулевой выстрел)https://api.jina.ai/v1/classifyКлассифицируйте входные данные, используя классификацию с нулевым результатомblock200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены считаются как: input_tokens + label_tokensPOST
API сегментатораhttps://api.jina.ai/v1/segmentТокенизация и сегментация длинного текста20 RPM200 RPM1,000 RPM0.3sТокен не считается использованием.GET/POST

Нужна ли мне коммерческая лицензия?

Самостоятельная проверка лицензии CC BY-NC

play_arrow
Используете ли вы наш официальный API или официальные образы на Azure или AWS?
play_arrow
done
Да
play_arrow
Используете ли вы платный ключ API или бесплатный пробный ключ?
play_arrow
done
Платный API-ключ
Никаких ограничений. Используйте согласно текущему соглашению.
play_arrow
info
Бесплатный API-ключ
Бесплатный пробный ключ можно использовать только в некоммерческих целях. Для коммерческого использования приобретите платный пакет.
play_arrow
Используете ли вы наши официальные образы моделей в AWS и Azure?
Никаких ограничений. Используйте согласно текущему соглашению.
play_arrow
close
Нет
play_arrow
Используете ли вы эти модели?
jina-embeddings-v4
jina-reranker-m0
jina-clip-v2
jina-embeddings-v3
jina-reranker-v2-base-multilingual
jina-colbert-v2
reader-lm-1.5b
reader-lm-0.5b
ReaderLM-v2
play_arrow
close
Нет
Ограничения не применяются.
play_arrow
done
Да
play_arrow
Является ли Ваше использование коммерческим?
play_arrow
question_mark
Не уверен
play_arrow
Ты:
play_arrow
Используете ли вы его для личных или любительских проектов?
Это некоммерческое использование. Вы можете использовать модели свободно.
play_arrow
Коммерческая компания, использующая его для внутренних целей?
Это коммерческое предложение. Свяжитесь с нашим отделом продаж.
Связаться с отделом продаж
play_arrow
Образовательное учреждение, использующее его для обучения?
Это обычно некоммерческое использование. Вы можете свободно использовать модели.
play_arrow
Некоммерческая или неправительственная организация использует его для своей миссии?
Обычно это некоммерческое использование, но если вы не уверены, свяжитесь с нами.
Связаться с отделом продаж
play_arrow
Используете ли вы его в продаваемом вами продукте или услуге?
Это коммерческое предложение. Свяжитесь с нашим отделом продаж.
Связаться с отделом продаж
play_arrow
Государственное учреждение использует его для оказания государственных услуг?
Это может быть коммерческим. Пожалуйста, свяжитесь с нами для уточнения.
Связаться с отделом продаж
play_arrow
close
Нет
Вы можете свободно использовать модели.
play_arrow
done
Да
Для получения лицензии свяжитесь с нашим отделом продаж.
Связаться с отделом продаж

Другие вопросы

Распространенные вопросы, связанные с DeepSearch
Что такое DeepSearch?
keyboard_arrow_down
DeepSearch — это API LLM, который выполняет итеративный поиск, чтение и рассуждения до тех пор, пока не найдет точный ответ на запрос или не достигнет лимита бюджета токенов.
Чем DeepSearch отличается от возможностей глубоких исследований OpenAI и Gemini?
keyboard_arrow_down
В отличие от OpenAI и Gemini, DeepSearch специально фокусируется на предоставлении точных ответов посредством итерации, а не на создании длинных статей. Он оптимизирован для быстрых, точных ответов из глубокого веб-поиска, а не для создания всесторонних отчетов.
Какой ключ API мне нужен для использования DeepSearch?
keyboard_arrow_down
Вам нужен ключ API Jina. Мы предлагаем 10M бесплатных токенов для новых ключей API.
Что происходит, когда DeepSearch достигает своего бюджета токенов? Возвращает ли он неполный ответ?
keyboard_arrow_down
Он генерирует окончательный ответ на основе всех накопленных знаний, а не просто отказывается от ответа или возвращает неполный ответ.
Гарантирует ли DeepSearch точные ответы?
keyboard_arrow_down
Нет. Хотя для повышения точности используется итеративный процесс поиска, оценка показывает, что он достигает 75%-ного процента успешных ответов на тестовых вопросах, что значительно лучше базового показателя в 0% (gemini-2.0-flash), но не идеально.
Сколько времени занимает типичный запрос DeepSearch?
keyboard_arrow_down
Он значительно варьируется - запросы могут занимать от 1 до 42 шагов, в среднем 4 шага на основе данных оценки. Это 20 секунд. Простые запросы могут быть решены быстро, в то время как сложные исследовательские вопросы могут включать много итераций и до 120 секунд.
Может ли DeepSearch работать с любым совместимым с OpenAI клиентом, таким как Chatwise, CherryStudio или ChatBox?
keyboard_arrow_down
Да, официальный API DeepSearch по адресу deepsearch.jina.ai/v1/chat/completions полностью совместим со схемой API OpenAI, используя 'jina-deepsearch-v1' в качестве имени модели. Поэтому очень легко переключиться с OpenAI на DeepSearch и использовать с локальными клиентами или любым клиентом, совместимым с OpenAI. Мы настоятельно рекомендуем Chatwise для бесперебойного опыта.
Каковы ограничения скорости для API?
keyboard_arrow_down
Ограничения скорости зависят от уровня ключа API и составляют от 10 RPM до 30 RPM. Это важно учитывать для приложений с большим объемом запросов.
Каково содержимое тега <think>?
keyboard_arrow_down
DeepSearch оборачивает шаги мышления в теги XML ... и затем предоставляет окончательный ответ, следуя формату потоковой передачи OpenAI, но с этими специальными маркерами для цепочки мыслей.
Использует ли DeepSearch Jina Reader для веб-поиска и чтения?
keyboard_arrow_down
Да. Jina Reader используется для веб-поиска и чтения, предоставляя системе возможность эффективного доступа и обработки веб-контента.
Почему DeepSearch использует так много токенов для моих запросов?
keyboard_arrow_down
Да, использование токенов DeepSearch в сложных запросах, возможно, высоко — в среднем 70 000 токенов по сравнению с 500 для базовых ответов LLM. Это показывает глубину исследования, но также имеет финансовые последствия.
Есть ли способ контролировать или ограничивать количество шагов?
keyboard_arrow_down
Система в первую очередь контролируется бюджетом токенов, а не количеством шагов. После превышения бюджета токенов она переходит в режим Beast Mode для генерации окончательного ответа. Проверьте reasoning_effort для получения более подробной информации.
Насколько надежны ссылки в ответах?
keyboard_arrow_down
Ссылки считаются настолько важными, что если ответ считается окончательным, но не имеет ссылок, система продолжает поиск, а не принимает ответ.
Может ли DeepSearch обрабатывать вопросы о будущих событиях?
keyboard_arrow_down
Да, но с обширными этапами исследования. Пример «кто будет президентом в 2028 году» показывает, что он может обрабатывать спекулятивные вопросы посредством нескольких итераций исследования, хотя точность таких прогнозов не гарантируется.
Общие вопросы, связанные с читателями
Каковы затраты, связанные с использованием Reader API?
keyboard_arrow_down
API Reader предоставляется бесплатно и не требует ключа API. Просто добавьте https://r.jina.ai/ к своему URL-адресу.
Как работает API Reader?
keyboard_arrow_down
API Reader использует прокси-сервер для получения любого URL-адреса, отображая его содержимое в браузере для извлечения высококачественного основного контента.
Является ли Reader API открытым исходным кодом?
keyboard_arrow_down
Да, Reader API имеет открытый исходный код и доступен в репозитории Jina AI GitHub.
Какова типичная задержка для Reader API?
keyboard_arrow_down
Reader API обычно обрабатывает URL-адреса и возвращает контент в течение 2 секунд, хотя для сложных или динамических страниц может потребоваться больше времени.
Почему мне следует использовать Reader API вместо того, чтобы самостоятельно очищать страницу?
keyboard_arrow_down
Парсинг может быть сложным и ненадежным, особенно для сложных или динамических страниц. Reader API обеспечивает оптимизированный и надежный вывод чистого текста, готового к LLM.
Поддерживает ли Reader API несколько языков?
keyboard_arrow_down
API Reader возвращает контент на исходном языке URL-адреса. Он не предоставляет услуги перевода.
Что делать, если веб-сайт блокирует Reader API?
keyboard_arrow_down
Если у вас возникли проблемы с блокировкой, обратитесь в нашу службу поддержки для помощи и решения.
Может ли Reader API извлекать контент из PDF-файлов?
keyboard_arrow_down
Хотя Reader API в первую очередь предназначен для веб-страниц, он может извлекать контент из PDF-файлов, просматриваемых в формате HTML на таких веб-сайтах, как arXiv, но он не оптимизирован для общего извлечения PDF-файлов.
Может ли Reader API обрабатывать медиаконтент с веб-страниц?
keyboard_arrow_down
В настоящее время Reader API не обрабатывает мультимедийный контент, но будущие улучшения будут включать субтитры к изображениям и обобщение видео.
Можно ли использовать Reader API для локальных файлов HTML?
keyboard_arrow_down
Нет, Reader API может обрабатывать контент только с общедоступных URL-адресов.
Кэширует ли Reader API контент?
keyboard_arrow_down
Если вы запросите тот же URL-адрес в течение 5 минут, Reader API вернет кэшированный контент.
Могу ли я использовать API Reader для доступа к контенту после входа в систему?
keyboard_arrow_down
К сожалению нет.
Могу ли я использовать Reader API для доступа к PDF-файлам на arXiv?
keyboard_arrow_down
Да, вы можете использовать встроенную поддержку PDF в Reader (https://r.jina.ai/https://arxiv.org/pdf/2310.19923v4) или HTML-версию из arXiv (https:// r.jina.ai/https://arxiv.org/html/2310.19923v4)
Как работает подпись к изображению в Reader?
keyboard_arrow_down
Reader подписывает все изображения по указанному URL-адресу и добавляет `Image [idx]: [caption]` в качестве альтернативного тега (если он изначально отсутствует). Это позволяет последующим LLM-специалистам взаимодействовать с изображениями при рассуждениях, обобщениях и т. д.
Какова масштабируемость Reader? Могу ли я использовать его в производстве?
keyboard_arrow_down
Reader API разработан с учетом высокой масштабируемости. Он автоматически масштабируется на основе трафика в реальном времени, а максимальное количество параллельных запросов сейчас составляет около 4000. Мы активно поддерживаем его как один из основных продуктов Jina AI. Так что смело используйте его в производстве.
Каков предел скорости API Reader?
keyboard_arrow_down
Актуальную информацию об ограничениях скорости можно найти в таблице ниже. Обратите внимание, что мы активно работаем над улучшением ограничения скорости и производительности Reader API, таблица будет соответствующим образом обновлена.
speedОграничение скорости
Что такое Reader-LM? Как им пользоваться?
keyboard_arrow_down
Reader-LM — это новая модель малого языка (SLM), разработанная для извлечения и очистки данных из открытого Интернета. Она преобразует сырой, шумный HTML в чистый markdown, черпая вдохновение из Jina Reader. С упором на экономическую эффективность и небольшой размер модели, Reader-LM является как практичным, так и мощным. В настоящее время он доступен на торговых площадках AWS, Azure и GCP. Если у вас есть особые требования, свяжитесь с нами по адресу sales AT jina.ai.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
Общие вопросы, связанные с реранкером
Сколько стоит API Reranker?
keyboard_arrow_down
Цены на API Reranker соответствуют нашей структуре ценообразования Embedding API. Они начинаются с 10 миллионов бесплатных токенов за каждый новый ключ API. Помимо бесплатных токенов, для покупки доступны различные пакеты. Для получения более подробной информации посетите наш раздел цен.
В чем разница между двумя реранкерами?
keyboard_arrow_down
jina-reranker-v2-base-multilingual отличается многоязычной поддержкой, превосходя bge-reranker-v2-m3 и предлагая в 15 раз более высокую пропускную способность, чем jina-reranker-v1-base-en. Он также поддерживает агентские задачи и извлечение кода. jina-colbert-v2 превосходит ColBERTv2, обеспечивая на 6,5% лучшую производительность извлечения и добавляя многоязычную поддержку для 89 языков. Он имеет контролируемые пользователем размеры встраивания для оптимальной эффективности и точности.
Имеют ли Jina Rerankers открытый исходный код?
keyboard_arrow_down
Да, jina-reranker-v2-base-multilingual и jina-colbert-v2 имеют открытый исходный код и доступны по лицензии CC-BY-NC 4.0. Вы можете свободно использовать, делиться и адаптировать модели в некоммерческих целях.
Поддерживают ли рераннеры несколько языков?
keyboard_arrow_down
Да, и jina-reranker-v2-base-multilingual, и jina-colbert-v2 поддерживают более 100 языков, включая английский, китайский и другие основные мировые языки. Они оптимизированы для многоязычных задач и превосходят предыдущие модели.
Какова максимальная длина запросов и документов?
keyboard_arrow_down
Максимальная длина токена запроса — 512. Для документов ограничения на токен не существует.
Какое максимальное количество документов я могу переоценить по одному запросу?
keyboard_arrow_down
Вы можете переоценить до 2048 документов по одному запросу.
Каков размер пакета и сколько кортежей документов-запросов я могу отправить в одном запросе?
keyboard_arrow_down
В отличие от нашего API внедрения, понятия размера пакета не существует. Вы можете отправить только один кортеж запроса-документа за запрос, но кортеж может включать до 2048 документов-кандидатов.
Какую задержку можно ожидать при изменении ранжирования 100 документов?
keyboard_arrow_down
Задержка варьируется от 100 миллисекунд до 7 секунд и во многом зависит от длины документов и запроса. Например, переоценка 100 документов по 256 токенов каждый с помощью запроса из 64 токенов занимает около 150 миллисекунд. Увеличение длины документа до 4096 токенов увеличивает время до 3,5 секунд. Если длина запроса увеличивается до 512 токенов, время увеличивается до 7 секунд.
Ниже приведены временные затраты на переоценку одного запроса и 100 документов в миллисекундах:
Количество токенов в каждом документе
Количество токенов в запросе256512102420484096
64156323136621073571
128194369137721233598
256273475139721554299
5124681385211435367068
Можно ли разместить ваши конечные точки в частном порядке на AWS, Azure или GCP?
keyboard_arrow_down
Да, наши услуги доступны на торговых площадках AWS, Azure и GCP. Если у вас есть особые требования, свяжитесь с нами по адресу sales AT jina.ai.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
Предлагаете ли вы точно настроенный механизм изменения рейтинга на основе данных, специфичных для конкретного домена?
keyboard_arrow_down
Если вы заинтересованы в точно настроенном механизме изменения рейтинга, адаптированном к конкретным данным домена, свяжитесь с нашим отделом продаж. Наша команда оперативно ответит на ваш запрос.
Контакт
Каков минимальный размер изображения для документов?
keyboard_arrow_down
Минимально допустимый размер изображения для модели jina-reranker-m0 составляет 28x28 пикселей.
Общие вопросы, связанные с встраиваниями
Как обучались модели jina-embeddings-v3?
keyboard_arrow_down
Подробную информацию о наших процессах обучения, источниках данных и оценках можно найти в нашем техническом отчете, доступном на arXiv.
launcharXiv
Что такое модели jina-clip и можно ли их использовать для поиска текста и изображений?
keyboard_arrow_down
Jina CLIP jina-clip-v2 — это усовершенствованная модель мультимодального встраивания, которая поддерживает задачи поиска текст-текст, текст-изображение, изображение-изображение и изображение-текст. В отличие от оригинального OpenAI CLIP, который испытывает трудности с поиском текст-текст, Jina CLIP преуспевает в качестве извлекателя текста. jina-clip-v2 обеспечивает повышение производительности на 3% по сравнению с jina-clip-v1 в задачах поиска текст-изображение и текст-текст, поддерживает 89 языков для многоязычного поиска изображений, обрабатывает изображения с более высоким разрешением (512x512) и снижает требования к хранению с помощью представлений Matryoshka. Подробнее об этом можно прочитать в нашем техническом отчете.
launcharXiv
Какие языки поддерживают ваши модели?
keyboard_arrow_down
На момент выпуска 18 сентября 2024 года jina-embeddings-v3 является лучшей многоязычной моделью и занимает 2-е место в рейтинге MTEB English для моделей с менее чем 1 миллиардом параметров. v3 поддерживает в общей сложности 89 языков, включая 30 лучших с лучшей производительностью: арабский, бенгальский, китайский, датский, голландский, английский, финский, французский, грузинский, немецкий, греческий, хинди, индонезийский, итальянский, японский, корейский, латышский, норвежский, польский, португальский, румынский, русский, словацкий, испанский, шведский, тайский, турецкий, украинский, урду и вьетнамский. Более подробную информацию см. в техническом отчете jina-embeddings-v3.
launcharXiv
Какова максимальная длина ввода одного предложения?
keyboard_arrow_down
Наши модели допускают длину ввода до 8192 токенов, что значительно больше, чем у большинства других моделей. Токен может быть от одного символа, например «a», до целого слова, например «apple». Общее количество символов, которые можно ввести, зависит от длины и сложности используемых слов. Эта расширенная возможность ввода позволяет нашим моделям jina-embeddings-v3 и jina-clip выполнять более полный анализ текста и достигать более высокой точности в понимании контекста, особенно для обширных текстовых данных.
Какое максимальное количество предложений я могу включить в один запрос?
keyboard_arrow_down
Один вызов API может обрабатывать до 2048 предложений или текстов, что позволяет выполнить обширный анализ текста за один запрос.
Как отправить изображения моделям jina-clip?
keyboard_arrow_down
Вы можете использовать либо url, либо bytes в поле input запроса API. В поле url укажите URL-адрес изображения, которое вы хотите обработать. Для bytes закодируйте изображение в формате base64 и включите его в запрос. Модель вернет вложения изображения в ответ.
Как модели Jina Embeddings соотносятся с новейшими встраиваниями OpenAI и Cohere?
keyboard_arrow_down
В оценках на бенчмарках MTEB English, Multilingual и LongEmbed jina-embeddings-v3 превосходит новейшие фирменные вложения от OpenAI и Cohere на задачах на английском языке и превосходит multilingual-e5-large-instruct на всех многоязычных задачах. С выходным измерением по умолчанию 1024 пользователи могут урезать измерения вложения до 32 без ущерба для производительности благодаря интеграции Matryoshka Representation Learning (MRL).
Насколько плавным будет переход от text-embedding-3-large от OpenAI к вашему решению?
keyboard_arrow_down
Переход оптимизирован, так как наша конечная точка API соответствует входным и выходным схемам JSON модели OpenAI text-embedding-3-large. Эта совместимость гарантирует, что пользователи могут легко заменить модель OpenAI на нашу при использовании конечной точки OpenAI.
Как рассчитываются токены при использовании моделей jina-clip?
keyboard_arrow_down
Токены рассчитываются на основе длины текста и размера изображения. Для текста в запросе токены подсчитываются стандартным образом. Для изображений выполняются следующие шаги: 1. Размер плитки: каждое изображение делится на плитки. Для jina-embeddings-v4 плитки имеют размер 28x28 пикселей, для jina-clip-v2 — 512x512 пикселей, а для jina-clip-v1 — 224x224 пикселя. 2. Покрытие: вычисляется количество плиток, необходимых для покрытия входного изображения. Даже если размеры изображения не делятся на размер плитки, частичные плитки считаются полными плитками. 3. Общее количество плиток: общее количество плиток, покрывающих изображение, определяет стоимость. Например, изображение размером 600x600 пикселей будет покрыто плитками 22x22 (484 плитки) в jina-embeddings-v4, плитками 2x2 (4 плитки) в jina-clip-v2 и плитками 3x3 (9 плиток) в jina-clip-v1. 4. Расчет стоимости: для jina-embeddings-v4 каждая плитка стоит 10 токенов, для jina-clip-v2 каждая плитка стоит 4000 токенов, а для jina-clip-v1 каждая плитка стоит 1000 токенов. Пример: Для изображения размером 600x600 пикселей: • С jina-embeddings-v4 • Изображение делится на плитки размером 28x28 пикселей. • Общее количество требуемых плиток составляет 22 (по горизонтали) x 22 (по вертикали) = 484 плитки. • Стоимость для jina-embeddings-v4 составит 484*10 = 4840 токенов. • С jina-clip-v2 • Изображение делится на плитки размером 512x512 пикселей. • Общее количество требуемых плиток составляет 2 (по горизонтали) x 2 (по вертикали) = 4 плитки. • Стоимость для jina-clip-v2 составит 4*4000 = 16000 токенов. • С jina-clip-v1 • Изображение делится на плитки размером 224x224 пикселей. • Общее количество требуемых плиток составляет 3 (по горизонтали) x 3 (по вертикали) = 9 плиток. • Стоимость jina-clip-v1 составит 9*1000 = 9000 токенов.
Предоставляете ли вы модели для встраивания изображений или аудио?
keyboard_arrow_down
Да, jina-clip-v2 и jina-clip-v1 могут встраивать как изображения, так и тексты. Скоро будет объявлено о встраивании моделей в большем количестве модальностей!
Можно ли точно настроить модели Jina Embedding с использованием частных данных или данных компании?
keyboard_arrow_down
По вопросам точной настройки наших моделей с использованием конкретных данных свяжитесь с нами, чтобы обсудить ваши требования. Мы открыты для изучения того, как наши модели могут быть адаптированы к вашим потребностям.
Контакт
Могут ли ваши конечные точки размещаться в частном порядке на AWS, Azure или GCP?
keyboard_arrow_down
Да, наши услуги доступны на торговых площадках AWS, Azure и GCP. Если у вас есть особые требования, свяжитесь с нами по адресу sales AT jina.ai.
launchAWS SageMakerlaunchGoogle CloudlaunchMicrosoft Azure
Общие вопросы, связанные с классификатором
Чем отличаются метки в нулевом и малом количестве снимков?
keyboard_arrow_down
Zero-shot требует семантических меток во время классификации и ничего во время обучения, в то время как few-shot требует меток во время обучения, но не классификации. Это означает, что zero-shot лучше подходит для гибких, немедленных потребностей в классификации, в то время как few-shot лучше подходит для фиксированных, специфичных для домена категорий, которые могут меняться со временем.
Для чего нужен num_iters и как его использовать?
keyboard_arrow_down
num_iters контролирует интенсивность обучения — более высокие значения усиливают важные примеры, а более низкие значения минимизируют влияние менее надежных данных. Его можно использовать для внедрения обучения с учетом времени, предоставляя недавним примерам более высокие числа итераций, что делает его ценным для развивающихся шаблонов данных.
Как работает публичный обмен классификаторами?
keyboard_arrow_down
Публичные классификаторы могут использоваться любым человеком с classifier_id, потребляя собственную квоту токенов. Пользователи не могут получить доступ к данным обучения или конфигурации и не могут видеть запросы классификации других, что позволяет безопасно делиться классификаторами.
Сколько данных мне нужно для эффективной работы метода few-shot?
keyboard_arrow_down
Few-shot требует 200-400 обучающих примеров, чтобы превзойти классификацию zero-shot. Хотя в конечном итоге он достигает более высокой точности, ему необходим этот период разминки, чтобы стать эффективным. Zero-shot обеспечивает постоянную производительность немедленно без обучающих данных.
Может ли он обрабатывать несколько языков и текст/изображения?
keyboard_arrow_down
Да — API поддерживает многоязычные запросы с использованием jina-embeddings-v3 и мультимодальную (текст/изображение) классификацию с использованием jina-clip-v1, с поддержкой URL или изображений в кодировке base64 в одном запросе.
О каких жестких ограничениях мне следует знать?
keyboard_arrow_down
Zero-shot поддерживает 256 классов без ограничения по классификаторам, в то время как few-shot ограничен 16 классами и 16 классификаторами. Оба поддерживают 1024 входа на запрос и 8192 токена на вход.
Как обрабатывать изменения данных с течением времени?
keyboard_arrow_down
Режим Few-shot позволяет непрерывно обновлять конечную точку /train для адаптации к изменяющимся шаблонам данных. Вы можете постепенно добавлять новые примеры или классы при изменении распределения данных, не перестраивая весь классификатор.
Что происходит с моими тренировочными данными после их отправки?
keyboard_arrow_down
API использует однопроходное онлайн-обучение — обучающие примеры обновляют веса классификатора, но не сохраняются после этого. Это означает, что вы не можете извлечь исторические обучающие данные, но это обеспечивает конфиденциальность и эффективность ресурсов.
Нулевой или малый выстрел — когда какой использовать?
keyboard_arrow_down
Начните с нулевого выстрела для немедленных результатов и когда вам нужна гибкая классификация с семантическими метками. Переключитесь на несколько выстрелов, когда у вас 200-400 примеров, нужна более высокая точность или вам нужно обрабатывать доменно-зависимые/временные данные.
Могу ли я использовать разные модели для разных языков/задач?
keyboard_arrow_down
Да, вы можете выбрать между jina-embeddings-v3 для классификации текста (особенно хорошо для многоязычных) и jina-clip-v1 для мультимодальной классификации. Новые модели, такие как jina-clip-v2, будут автоматически доступны через API после выпуска.
Распространенные вопросы, связанные с сегментатором
Сколько стоит API Segmenter?
keyboard_arrow_down
API Segmenter можно использовать бесплатно. Предоставляя свой ключ API, вы можете получить доступ к более высокому пределу скорости, и ваш ключ не будет оплачиваться.
Если я не предоставлю ключ API, каков предел скорости?
keyboard_arrow_down
Без ключа API вы можете получить доступ к API Segmenter со скоростью 20 об/мин.
Если я предоставлю ключ API, каков предел скорости?
keyboard_arrow_down
С помощью API-ключа вы можете получить доступ к API Segmenter с ограничением скорости 200 RPM. Для платных пользователей премиум-подписки ограничение скорости составляет 1000 RPM.
Будете ли вы взимать плату за токены с моего ключа API?
keyboard_arrow_down
Нет, ваш ключ API используется только для доступа к более высокому лимиту скорости.
Поддерживает ли API Segmenter несколько языков?
keyboard_arrow_down
Да, API Segmenter многоязычен и поддерживает более 100 языков.
В чем разница между запросами GET и POST?
keyboard_arrow_down
Запросы GET используются исключительно для подсчета количества токенов в тексте, что позволяет вам легко интегрировать его в качестве счетчика в ваше приложение. Запросы POST поддерживают больше параметров и функций, таких как возврат первых/последних N токенов.
Какую максимальную длину я могу токенизировать за один запрос?
keyboard_arrow_down
Вы можете отправить до 64 тыс. символов за один запрос.
Как работает функция фрагментации? Это семантическая фрагментация?
keyboard_arrow_down
Функция фрагментации сегментирует длинные документы на более мелкие фрагменты на основе общих структурных сигналов, обеспечивая точную сегментацию текста на значимые фрагменты. По сути, это (большой!) шаблон регулярного выражения, который сегментирует текст на основе определенных синтаксических признаков, которые часто совпадают с семантическими границами, такими как окончания предложений, разрывы абзацев, пунктуация и определенные союзы. Это не семантическое фрагментирование. Это (большое) регулярное выражение настолько мощно, насколько это возможно в рамках ограничений регулярных выражений. Оно уравновешивает сложность и производительность. Хотя истинное семантическое понимание невозможно с помощью регулярных выражений, оно хорошо аппроксимирует контекст с помощью общих структурных сигналов.
Как вы обрабатываете специальные токены, такие как «endoftext» в API Segmenter?
keyboard_arrow_down
Если входные данные содержат специальные токены, наш API Segmenter поместит их в поле «special_tokens». Это позволяет вам легко идентифицировать их и обрабатывать соответствующим образом для ваших последующих задач, например, удаляя их перед подачей текста в LLM для предотвращения атак с инъекциями.
Поддерживает ли функция фрагментации другие языки, кроме английского?
keyboard_arrow_down
Помимо западных языков, разбиение на фрагменты также хорошо работает с китайским, японским и корейским языками.
Распространенные вопросы, связанные с автоматической точной настройкой
Сколько стоит API тонкой настройки?
keyboard_arrow_down
Функция в настоящее время находится в стадии бета-тестирования и стоит 1 млн токенов за тонкую настройку модели. Вы можете использовать существующий ключ API из API Embedding/Reranker, если у него достаточно токенов, или вы можете создать новый ключ API, который включает 10 млн бесплатных токенов.
Что мне нужно ввести? Нужно ли мне предоставлять данные обучения?
keyboard_arrow_down
Вам не нужно предоставлять какие-либо данные для обучения. Просто опишите свой целевой домен (домен, для которого вы хотите оптимизировать точно настроенные внедрения) на естественном языке или используйте URL-адрес в качестве ссылки, и наша система сгенерирует синтетические данные для обучения модели.
Сколько времени занимает доводка модели?
keyboard_arrow_down
Около 30 минут.
Где хранятся доработанные модели?
keyboard_arrow_down
Точно настроенные модели и синтетические данные хранятся публично в хабе моделей Hugging Face.
Если я предоставлю ссылочный URL-адрес, как система его будет использовать?
keyboard_arrow_down
Система использует API Reader для получения контента по URL-адресу. Затем он анализирует контент, чтобы обобщить тон и предметную область, которые он использует в качестве ориентиров для создания синтетических данных. Следовательно, URL-адрес должен быть общедоступным и представлять целевой домен.
Могу ли я точно настроить модель для конкретного языка?
keyboard_arrow_down
Да, вы можете настроить модель для языка, отличного от английского. Система автоматически определяет язык инструкций вашего домена и соответствующим образом генерирует синтетические данные. Мы также рекомендуем выбрать подходящую базовую модель для целевого языка. Например, если вы ориентируетесь на немецкий домен, вам следует выбрать jina-embeddings-v2-base-de в качестве базовой модели.
Могу ли я точно настроить встраивания, отличные от Jina, например, bge-M3?
keyboard_arrow_down
Нет, наш API тонкой настройки поддерживает только модели Jina v2.
Как вы обеспечиваете качество доработанных моделей?
keyboard_arrow_down
В конце процесса точной настройки система оценивает модель с использованием отложенного набора тестов и сообщает показатели производительности. Вы получите электронное письмо с подробным описанием производительности до и после этого набора тестов. Вам также рекомендуется оценить модель на собственном тестовом наборе, чтобы убедиться в ее качестве.
Как генерировать синтетические данные?
keyboard_arrow_down
Система генерирует синтетические данные путем интеграции предоставленных вами инструкций целевой области с рассуждениями агентов LLM. Он создает жесткие отрицательные триплеты, которые необходимы для обучения высококачественных моделей внедрения. Для получения более подробной информации, пожалуйста, обратитесь к нашему предстоящему исследованию Arxiv.
Могу ли я сохранить конфиденциальность своих точно настроенных моделей и синтетических данных?
keyboard_arrow_down
В данный момент нет. Обратите внимание, что эта функция все еще находится в стадии бета-тестирования. Публичное хранение точно настроенных моделей и синтетических данных в центре моделей Hugging Face помогает нам и сообществу оценить качество обучения. В будущем мы планируем предложить вариант частного хранения.
Как я могу использовать доработанную модель?
keyboard_arrow_down
Поскольку все доработанные модели загружаются в Hugging Face, вы можете получить к ним доступ через SentenceTransformers, просто указав имя модели.
Я так и не получил письмо с результатами оценки. Что я должен делать?
keyboard_arrow_down
Пожалуйста, проверьте папку со спамом. Если вы все еще не можете его найти, свяжитесь с нашей службой поддержки, используя указанный вами адрес электронной почты.
Контакт
Общие вопросы, связанные с API
code
Могу ли я использовать один и тот же ключ API для чтения, встраивания, переранжирования, классификации и тонкой настройки API?
keyboard_arrow_down
Да, тот же ключ API действителен для всех продуктов search foundation от Jina AI. Это включает в себя API считывателя, встраивания, переранжирования, классификации и тонкой настройки, с общими токенами для всех сервисов.
code
Могу ли я отслеживать использование токена моего ключа API?
keyboard_arrow_down
Да, использование токенов можно отслеживать на вкладке «API Key & Billing», введя свой API-ключ, что позволит вам просматривать недавнюю историю использования и оставшиеся токены. Если вы вошли в панель управления API, эти данные также можно просмотреть на вкладке «Manage API Key».
code
Что мне делать, если я забуду свой ключ API?
keyboard_arrow_down
Если вы потеряли пополненный ключ и хотите его восстановить, обратитесь в службу поддержки AT jina.ai, указав зарегистрированный адрес электронной почты, чтобы получить помощь. Рекомендуется войти в систему, чтобы ваш ключ API был надежно сохранен и легко доступен.
Контакт
code
Срок действия ключей API истекает?
keyboard_arrow_down
Нет, наши ключи API не имеют срока действия. Однако, если вы подозреваете, что ваш ключ был скомпрометирован, и хотите его удалить, обратитесь в нашу службу поддержки за помощью. Вы также можете отозвать свой ключ в панели управления ключами API.
Контакт
code
Могу ли я передавать токены между ключами API?
keyboard_arrow_down
Да, вы можете перенести токены с одного премиум-ключа на другой. После входа в свою учетную запись на панели управления ключами API используйте настройки ключа, который вы хотите перенести, чтобы переместить все оставшиеся оплаченные токены.
code
Могу ли я отозвать свой ключ API?
keyboard_arrow_down
Да, вы можете отозвать свой ключ API, если считаете, что он был скомпрометирован. Отзыв ключа немедленно отключит его для всех пользователей, которые его сохранили, а весь оставшийся баланс и связанные с ним свойства станут навсегда непригодными для использования. Если ключ является премиум-ключом, у вас есть возможность перевести оставшийся оплаченный баланс на другой ключ перед отзывом. Обратите внимание, что это действие нельзя отменить. Чтобы отозвать ключ, перейдите к настройкам ключа на панели управления ключами API.
code
Почему первый запрос для некоторых моделей выполняется медленно?
keyboard_arrow_down
Это происходит потому, что наша архитектура Serverless выгружает определенные модели в периоды низкого использования. Первоначальный запрос активирует или «разогревает» модель, что может занять несколько секунд. После этой первоначальной активации последующие запросы обрабатываются гораздо быстрее.
code
Используются ли входные данные пользователя для обучения ваших моделей?
keyboard_arrow_down
Мы придерживаемся строгой политики конфиденциальности и не используем данные пользовательского ввода для обучения наших моделей. Мы также соответствуем требованиям SOC 2 Type I и Type II, обеспечивая высокие стандарты безопасности и конфиденциальности.
Общие вопросы, связанные с выставлением счетов
attach_money
Выставление счетов зависит от количества предложений или запросов?
keyboard_arrow_down
Наша модель ценообразования основана на общем количестве обработанных токенов, что позволяет пользователям гибко распределять эти токены по любому количеству предложений, предлагая экономически эффективное решение для разнообразных требований к анализу текста.
attach_money
Доступна ли бесплатная пробная версия для новых пользователей?
keyboard_arrow_down
Мы предлагаем приветственную бесплатную пробную версию для новых пользователей, которая включает десять миллионов токенов для использования с любой из наших моделей, с помощью автоматически сгенерированного ключа API. После того, как будет достигнут лимит бесплатных токенов, пользователи могут легко приобрести дополнительные токены для своих ключей API через вкладку «Купить токены».
attach_money
Взимаются ли токены за неудачные запросы?
keyboard_arrow_down
Нет, токены не снимаются за неудачные запросы.
attach_money
Какие способы оплаты принимаются?
keyboard_arrow_down
Платежи обрабатываются через Stripe, поддерживающий для вашего удобства различные способы оплаты, включая кредитные карты, Google Pay и PayPal.
attach_money
Доступно ли выставление счетов за покупку токенов?
keyboard_arrow_down
Да, после покупки токенов на адрес электронной почты, связанный с вашей учетной записью Stripe, будет выставлен счет.
Офисы
location_on
Саннивейл, Калифорния
710 Lakeway Dr, Ste 200, Саннивейл, Калифорния 94085, США
location_on
Берлин, Германия (штаб-квартира)
Prinzessinnenstraße 19-20, 10969 Берлин, Германия
location_on
Пекин, Китай
Уровень 5, здание 6, ул. Хайдянь Вест, д. 48, Пекин, Китай
location_on
Шэньчжэнь, Китай
402, этаж 4, здание Fu'an Technology, Шэньчжэнь, Китай
Поиск Фонда
Читатель
Вложения
Реранкер
Глубокий поиск
Классификатор
Сегментатор
API-документация
Получить API-ключ Jina
Ограничение скорости
Статус API
Компания
О нас
Связаться с отделом продаж
отдел новостей
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия
Безопасность
Условия использования
Конфиденциальность
Управление файлами cookie
email
Jina AI © 2020-2025.