Ваш фонд поиска полный вперёд!
Наши клиенты
Для лучшего поиска
Наши передовые модели формируют поисковую основу для высококачественных систем корпоративного поиска и RAG.
Читатель
Преобразуйте URL-адрес в формат ввода, удобный для LLM, просто добавив
r.jina.ai
в начало.Вложения
Мультимодальные многоязычные вложения мирового класса.
Реранкер
Нейронный ретривер мирового класса для максимального повышения релевантности поиска.
Глубокий поиск
Ищите, читайте и рассуждайте, пока не найдете лучший ответ.
Классификатор
Классификация изображений и текста по нулевому и небольшому количеству кадров.
Сегментатор
Разрежьте длинный текст на куски и выполните токенизацию.
Начните прямо сейчас — кредитная карта или регистрация не требуются!
verified_user Мы соответствуем требованиям SOC 2 Type 1 и 2 Американского института сертифицированных бухгалтеров (AICPA). open_in_new
chevron_leftchevron_right
globe_book
Используйте
r.jina.ai
для чтения URL-адреса и извлечения его содержимого.travel_explore
Используйте
s.jina.ai
для поиска в Интернете и получения результатов поискаФормат контента
Вы можете контролировать уровень детализации ответа, чтобы предотвратить чрезмерную фильтрацию. Конвейер по умолчанию оптимизирован для большинства веб-сайтов и входных данных LLM.
По умолчанию
arrow_drop_down
JSON-ответ
Ответ будет в формате JSON, содержащий URL-адрес, заголовок, контент и временную метку (если имеется). В режиме поиска он возвращает список из пяти записей, каждая из которых соответствует описанной структуре JSON.
Тайм-аут
Максимальное время ожидания загрузки страницы (не общее время обработки запроса).
Бюджет токенов
Ограничивает максимальное количество токенов, используемых для этого запроса. Превышение этого лимита приведет к сбою запроса.
Использовать ReaderLM-v2
Экспериментальный
Использует ReaderLM-v2 для преобразования HTML в Markdown, чтобы обеспечить высококачественные результаты для веб-сайтов со сложной структурой и содержимым. Стоит 3x токенов!
Селектор CSS: Только
Список селекторов CSS для выбора определенных элементов страницы.
CSS-селектор: Ожидание
Селекторы CSS, которые необходимо дождаться перед возвратом результатов.
Селектор CSS: Исключение
Селекторы CSS для удаляемых элементов (заголовки, нижние колонтитулы и т. д.).
Удалить все изображения
Удалить все изображения из ответа.
Соберите все ссылки в конце
В конце будет создан раздел «Кнопки и ссылки». Это помогает нижестоящим LLM или веб-агентам перемещаться по странице или предпринимать дальнейшие действия.
Никто
arrow_drop_down
Соберите все изображения в конце
В конце будет создан раздел «Изображения». Это дает последующим специалистам LLM обзор всех визуальных элементов на странице, что может улучшить логику.
Никто
arrow_drop_down
Конфигурация области просмотра
POST
Устанавливает размеры области просмотра браузера для адаптивного рендеринга.
Переслать файл cookie
Наш сервер API может пересылать ваши пользовательские настройки файлов cookie при доступе к URL-адресу, что полезно для страниц, требующих дополнительной аутентификации. Обратите внимание, что запросы с файлами cookie не кэшируются.
Подпись к изображению
Подписывает все изображения по указанному URL-адресу, добавляя «Image [idx]: [caption]» в качестве альтернативного тега для тех, у кого его нет. Это позволяет последующим LLM взаимодействовать с изображениями в таких действиях, как рассуждение и подведение итогов.
Используйте прокси-сервер
Наш сервер API может использовать ваш прокси-сервер для доступа к URL-адресам, что полезно для страниц, доступных только через определенные прокси.
Используйте прокси-сервер для конкретной страны
Установите код страны для прокси-сервера на основе местоположения. Используйте «auto» для оптимального выбора или «none» для отключения.
Обход кэша
Наш сервер API кэширует содержимое режима чтения и поиска в течение определенного периода времени. Чтобы обойти этот кеш, установите для этого заголовка значение true.
Не кэшировать/не отслеживать!
Если эта функция включена, результаты запроса не будут кэшироваться на наших серверах.
Github Flavored Markdown
Включение/отключение функций GFM (Github Flavored Markdown).
Включено
arrow_drop_down
Режим потока
Режим потока полезен для больших целевых страниц, поскольку дает больше времени для полной визуализации страницы. Если в стандартном режиме контент получается неполным, рассмотрите возможность использования режима Stream.
Настроить локаль браузера
Управляйте локалью браузера для отображения страницы. Множество веб-сайтов предоставляют разный контент в зависимости от локали.
Строго соблюдайте политику в отношении роботов
Определите User-Agent бота для проверки по robots.txt перед извлечением контента.
Извлечение iframe
Обрабатывает содержимое всех встроенных фреймов в дереве DOM.
Извлечение теневого DOM
Извлекает содержимое из всех корневых элементов Shadow DOM в документе.
Следуйте за страницей перенаправления
Выберите, следует ли разрешать конечный целевой URL после прохождения всех перенаправлений. Включите, чтобы следовать полной цепочке перенаправлений.
Локальный файл PDF/HTML
POST
Используйте Reader на локальных файлах PDF и HTML, загрузив их. Поддерживает только файлы PDF и HTML.
upload
Предварительно запущенный JavaScript
POST
Выполняет предварительную обработку JS-кода (встроенной строки или удаленного URL-адреса).
Стиль заголовка
Устанавливает формат заголовка markdown (передается в Turndown).
Альтернативный синтаксис заголовка
arrow_drop_down
Стиль горизонтальной линейки
Определяет формат горизонтальной линии разметки (передается в Turndown).
Стиль маркера
Устанавливает символ маркера маркированного списка (передается в Turndown).
*
arrow_drop_down
Акцентный стиль
Определяет разделитель акцента в разметке (передается в Turndown).
_
arrow_drop_down
Сильный акцентный стиль
Устанавливает разделитель сильного акцента markdown (передается в Turndown).
**
arrow_drop_down
Стиль ссылки
Определяет формат ссылки markdown (передается в Turndown).
В соответствии
arrow_drop_down
Соответствие нормам ЕС
Экспериментальный
Все операции по инфраструктуре и обработке данных полностью находятся в юрисдикции ЕС.
upload
Запрос
GET
Bash
Язык
arrow_drop_down
curl "https://r.jina.ai/https://example.com"
key
API-ключ
visibility_off
Доступные токены
0
Наши публикации
Поймите, как наши модели поиска на границе были обучены с нуля, ознакомьтесь с нашими последними публикациями. Познакомьтесь с нашей командой в EMNLP, SIGIR, ICLR, NeurIPS и ICML!