Новости
Модели
Продукты
keyboard_arrow_down
Читатель
Читайте URL-адреса и ищите информацию в Интернете для получения более подходящей подготовки для получения степени магистра права.
Вложения
Мультимодальные многоязычные вложения мирового класса.
Реранкер
Нейронный ретривер мирового класса для максимального повышения релевантности поиска.
Глубокий поиск
Ищите, читайте и рассуждайте, пока не найдете лучший ответ.
Более
keyboard_arrow_down
Классификатор
Классификация изображений и текста по нулевому и небольшому количеству кадров.
Сегментатор
Разрежьте длинный текст на куски и выполните токенизацию.

API-документы
Автоматическая генерация кода для вашего второго пилота IDE или LLM
open_in_new


Компания
keyboard_arrow_down
О нас
Связаться с отделом продаж
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия использования


Авторизоваться
login

Сегментатор

Бесплатный API для сегментации длинного текста на фрагменты и токенизации.

API сегментатора

Наш API Segmenter имеет решающее значение для помощи LLM в управлении вводом в рамках контекстных ограничений и оптимизации производительности модели. Он позволяет разработчикам подсчитывать токены и извлекать соответствующие текстовые сегменты, обеспечивая эффективную обработку данных и управление затратами.
key
Ключ API и биллинг
code
Применение
more_horiz
Более
chevron_leftchevron_right

home
speedОграничение скорости
help_outlineЧасто задаваемые вопросы
api
Статус
chevron_leftchevron_right

Используйте GET-запрос для подсчета токенов

Используйте POST-запрос для получения дополнительных функций

upload
Запрос
curl -X POST 'https://api.jina.ai/v1/segment' \
  -H "Content-Type: application/json" \
  -d @- <<EOFEOF
  {
    "content": "Jina AI: Your Search Foundation, Supercharged! 🚀\nIhrer Suchgrundlage, aufgeladen! 🚀\n您的搜索底座,从此不同!🚀\n検索ベース,もう二度と同じことはありません!🚀"
  }
EOFEOF



Что такое сегментатор?

Сегментатор — это важный компонент, который преобразует текст в токены или фрагменты, которые являются основными единицами данных, обрабатываемыми моделью внедрения/переранжирования или LLM. Токены могут представлять целые слова, части слов или даже отдельные символы.

Молниеносная обработка длинных документов!

Вы также можете использовать API Segmenter для разрезания длинных документов на более мелкие фрагменты, что упрощает их обработку в встраиваниях или рераннерах. Мы используем общие структурные подсказки и создаем набор правил и эвристик, которые хорошо работают с различными типами контента, например, языками Markdown, HTML, LaTeX и CJK.
Максимальная длина каждого фрагмента: 1000
Максимальное количество символов в каждом фрагменте. На практике длина фрагмента может быть меньше этого значения, если в тексте есть естественная граница.

0 кусков всего


API сегментатора бесплатен!

Указав свой ключ API, вы сможете получить доступ к более высокому лимиту скорости, и плата за ваш ключ взиматься не будет.
Ограничение скорости
Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.
ПродуктКонечная точка APIОписаниеarrow_upwardбез API-ключаkey_offс API-ключомkeyс премиум-ключом APIkeyСредняя задержкаПодсчет использования токеновРазрешенный запрос
API-интерфейс читателяhttps://r.jina.aiПреобразовать URL в текст, понятный LLM20 RPM500 RPMtrending_up5000 RPM7.9sПодсчитайте количество токенов в выходном ответе.GET/POST
API-интерфейс читателяhttps://s.jina.aiПоиск в Интернете и преобразование результатов в текст, понятный LLMblock100 RPMtrending_up1000 RPM2.5sКаждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.GET/POST
Глубокий поискhttps://deepsearch.jina.ai/v1/chat/completionsРассуждайте, ищите и повторяйте, чтобы найти лучший ответ.block50 RPM500 RPM56.7sПодсчитайте общее количество токенов за весь процесс.POST
API реранкераhttps://api.jina.ai/v1/rerankРанжировать документы по запросуblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
Встраивание APIhttps://api.jina.ai/v1/embeddingsПреобразование текста/изображений в векторы фиксированной длиныblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
API классификатораhttps://api.jina.ai/v1/trainОбучить классификатор с использованием маркированных примеровblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены подсчитываются как: input_tokens × num_itersPOST
API классификатора (Несколько выстрелов)https://api.jina.ai/v1/classifyКлассифицируйте входные данные с помощью обученного классификатора с несколькими попыткамиblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены учитываются как: input_tokensPOST
API классификатора (Нулевой выстрел)https://api.jina.ai/v1/classifyКлассифицируйте входные данные, используя классификацию с нулевым результатомblock200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены считаются как: input_tokens + label_tokensPOST
API сегментатораhttps://api.jina.ai/v1/segmentТокенизация и сегментация длинного текста20 RPM200 RPM1,000 RPM0.3sТокен не считается использованием.GET/POST
keyПолучите свой API-ключ
handshakeСвязаться с отделом продаж

Часто задаваемые вопросы

Сколько стоит API Segmenter?
keyboard_arrow_down
API Segmenter можно использовать бесплатно. Предоставляя свой ключ API, вы можете получить доступ к более высокому пределу скорости, и ваш ключ не будет оплачиваться.
Если я не предоставлю ключ API, каков предел скорости?
keyboard_arrow_down
Без ключа API вы можете получить доступ к API Segmenter со скоростью 20 об/мин.
Если я предоставлю ключ API, каков предел скорости?
keyboard_arrow_down
С помощью API-ключа вы можете получить доступ к API Segmenter с ограничением скорости 200 RPM. Для платных пользователей премиум-подписки ограничение скорости составляет 1000 RPM.
Будете ли вы взимать плату за токены с моего ключа API?
keyboard_arrow_down
Нет, ваш ключ API используется только для доступа к более высокому лимиту скорости.
Поддерживает ли API Segmenter несколько языков?
keyboard_arrow_down
Да, API Segmenter многоязычен и поддерживает более 100 языков.
В чем разница между запросами GET и POST?
keyboard_arrow_down
Запросы GET используются исключительно для подсчета количества токенов в тексте, что позволяет вам легко интегрировать его в качестве счетчика в ваше приложение. Запросы POST поддерживают больше параметров и функций, таких как возврат первых/последних N токенов.
Какую максимальную длину я могу токенизировать за один запрос?
keyboard_arrow_down
Вы можете отправить до 64 тыс. символов за один запрос.
Как работает функция фрагментации? Это семантическая фрагментация?
keyboard_arrow_down
Функция фрагментации сегментирует длинные документы на более мелкие фрагменты на основе общих структурных сигналов, обеспечивая точную сегментацию текста на значимые фрагменты. По сути, это (большой!) шаблон регулярного выражения, который сегментирует текст на основе определенных синтаксических признаков, которые часто совпадают с семантическими границами, такими как окончания предложений, разрывы абзацев, пунктуация и определенные союзы. Это не семантическое фрагментирование. Это (большое) регулярное выражение настолько мощно, насколько это возможно в рамках ограничений регулярных выражений. Оно уравновешивает сложность и производительность. Хотя истинное семантическое понимание невозможно с помощью регулярных выражений, оно хорошо аппроксимирует контекст с помощью общих структурных сигналов.
Как вы обрабатываете специальные токены, такие как «endoftext» в API Segmenter?
keyboard_arrow_down
Если входные данные содержат специальные токены, наш API Segmenter поместит их в поле «special_tokens». Это позволяет вам легко идентифицировать их и обрабатывать соответствующим образом для ваших последующих задач, например, удаляя их перед подачей текста в LLM для предотвращения атак с инъекциями.
Поддерживает ли функция фрагментации другие языки, кроме английского?
keyboard_arrow_down
Помимо западных языков, разбиение на фрагменты также хорошо работает с китайским, японским и корейским языками.

Как получить мой ключ API?

video_not_supported

Каков предел ставки?

Ограничение скорости
Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.
ПродуктКонечная точка APIОписаниеarrow_upwardбез API-ключаkey_offс API-ключомkeyс премиум-ключом APIkeyСредняя задержкаПодсчет использования токеновРазрешенный запрос
API-интерфейс читателяhttps://r.jina.aiПреобразовать URL в текст, понятный LLM20 RPM500 RPMtrending_up5000 RPM7.9sПодсчитайте количество токенов в выходном ответе.GET/POST
API-интерфейс читателяhttps://s.jina.aiПоиск в Интернете и преобразование результатов в текст, понятный LLMblock100 RPMtrending_up1000 RPM2.5sКаждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.GET/POST
Глубокий поискhttps://deepsearch.jina.ai/v1/chat/completionsРассуждайте, ищите и повторяйте, чтобы найти лучший ответ.block50 RPM500 RPM56.7sПодсчитайте общее количество токенов за весь процесс.POST
API реранкераhttps://api.jina.ai/v1/rerankРанжировать документы по запросуblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
Встраивание APIhttps://api.jina.ai/v1/embeddingsПреобразование текста/изображений в векторы фиксированной длиныblock500 RPM & 1,000,000 TPMtrending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.POST
API классификатораhttps://api.jina.ai/v1/trainОбучить классификатор с использованием маркированных примеровblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены подсчитываются как: input_tokens × num_itersPOST
API классификатора (Несколько выстрелов)https://api.jina.ai/v1/classifyКлассифицируйте входные данные с помощью обученного классификатора с несколькими попыткамиblock20 RPM & 200,000 TPM60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены учитываются как: input_tokensPOST
API классификатора (Нулевой выстрел)https://api.jina.ai/v1/classifyКлассифицируйте входные данные, используя классификацию с нулевым результатомblock200 RPM & 500,000 TPM1,000 RPM & 3,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены считаются как: input_tokens + label_tokensPOST
API сегментатораhttps://api.jina.ai/v1/segmentТокенизация и сегментация длинного текста20 RPM200 RPM1,000 RPM0.3sТокен не считается использованием.GET/POST
Общие вопросы, связанные с API
code
Могу ли я использовать один и тот же ключ API для чтения, встраивания, переранжирования, классификации и тонкой настройки API?
keyboard_arrow_down
Да, тот же ключ API действителен для всех продуктов search foundation от Jina AI. Это включает в себя API считывателя, встраивания, переранжирования, классификации и тонкой настройки, с общими токенами для всех сервисов.
code
Могу ли я отслеживать использование токена моего ключа API?
keyboard_arrow_down
Да, использование токенов можно отслеживать на вкладке «API Key & Billing», введя свой API-ключ, что позволит вам просматривать недавнюю историю использования и оставшиеся токены. Если вы вошли в панель управления API, эти данные также можно просмотреть на вкладке «Manage API Key».
code
Что мне делать, если я забуду свой ключ API?
keyboard_arrow_down
Если вы потеряли пополненный ключ и хотите его восстановить, обратитесь в службу поддержки AT jina.ai, указав зарегистрированный адрес электронной почты, чтобы получить помощь. Рекомендуется войти в систему, чтобы ваш ключ API был надежно сохранен и легко доступен.
Контакт
code
Срок действия ключей API истекает?
keyboard_arrow_down
Нет, наши ключи API не имеют срока действия. Однако, если вы подозреваете, что ваш ключ был скомпрометирован, и хотите его удалить, обратитесь в нашу службу поддержки за помощью. Вы также можете отозвать свой ключ в панели управления ключами API.
Контакт
code
Могу ли я передавать токены между ключами API?
keyboard_arrow_down
Да, вы можете перенести токены с одного премиум-ключа на другой. После входа в свою учетную запись на панели управления ключами API используйте настройки ключа, который вы хотите перенести, чтобы переместить все оставшиеся оплаченные токены.
code
Могу ли я отозвать свой ключ API?
keyboard_arrow_down
Да, вы можете отозвать свой ключ API, если считаете, что он был скомпрометирован. Отзыв ключа немедленно отключит его для всех пользователей, которые его сохранили, а весь оставшийся баланс и связанные с ним свойства станут навсегда непригодными для использования. Если ключ является премиум-ключом, у вас есть возможность перевести оставшийся оплаченный баланс на другой ключ перед отзывом. Обратите внимание, что это действие нельзя отменить. Чтобы отозвать ключ, перейдите к настройкам ключа на панели управления ключами API.
code
Почему первый запрос для некоторых моделей выполняется медленно?
keyboard_arrow_down
Это происходит потому, что наша архитектура Serverless выгружает определенные модели в периоды низкого использования. Первоначальный запрос активирует или «разогревает» модель, что может занять несколько секунд. После этой первоначальной активации последующие запросы обрабатываются гораздо быстрее.
code
Используются ли входные данные пользователя для обучения ваших моделей?
keyboard_arrow_down
Мы придерживаемся строгой политики конфиденциальности и не используем данные пользовательского ввода для обучения наших моделей. Мы также соответствуем требованиям SOC 2 Type I и Type II, обеспечивая высокие стандарты безопасности и конфиденциальности.
Общие вопросы, связанные с выставлением счетов
attach_money
Выставление счетов зависит от количества предложений или запросов?
keyboard_arrow_down
Наша модель ценообразования основана на общем количестве обработанных токенов, что позволяет пользователям гибко распределять эти токены по любому количеству предложений, предлагая экономически эффективное решение для разнообразных требований к анализу текста.
attach_money
Доступна ли бесплатная пробная версия для новых пользователей?
keyboard_arrow_down
Мы предлагаем приветственную бесплатную пробную версию для новых пользователей, которая включает десять миллионов токенов для использования с любой из наших моделей, с помощью автоматически сгенерированного ключа API. После того, как будет достигнут лимит бесплатных токенов, пользователи могут легко приобрести дополнительные токены для своих ключей API через вкладку «Купить токены».
attach_money
Взимаются ли токены за неудачные запросы?
keyboard_arrow_down
Нет, токены не снимаются за неудачные запросы.
attach_money
Какие способы оплаты принимаются?
keyboard_arrow_down
Платежи обрабатываются через Stripe, поддерживающий для вашего удобства различные способы оплаты, включая кредитные карты, Google Pay и PayPal.
attach_money
Доступно ли выставление счетов за покупку токенов?
keyboard_arrow_down
Да, после покупки токенов на адрес электронной почты, связанный с вашей учетной записью Stripe, будет выставлен счет.
Офисы
location_on
Саннивейл, Калифорния
710 Lakeway Dr, Ste 200, Саннивейл, Калифорния 94085, США
location_on
Берлин, Германия (штаб-квартира)
Prinzessinnenstraße 19-20, 10969 Берлин, Германия
location_on
Пекин, Китай
Уровень 5, здание 6, ул. Хайдянь Вест, д. 48, Пекин, Китай
location_on
Шэньчжэнь, Китай
402, этаж 4, здание Fu'an Technology, Шэньчжэнь, Китай
Поиск Фонда
Читатель
Вложения
Реранкер
Глубокий поиск
Классификатор
Сегментатор
API-документация
Получить API-ключ Jina
Ограничение скорости
Статус API
Компания
О нас
Связаться с отделом продаж
отдел новостей
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия
Безопасность
Условия использования
Конфиденциальность
Управление файлами cookie
email
Jina AI © 2020-2025.