Ваш фонд поиска полный вперёд!
Начните прямо сейчас — кредитная карта или регистрация не требуются!
verified_userМы соответствуем требованиям SOC 2 Type 1 и 2 Американского института сертифицированных бухгалтеров (AICPA).open_in_new
chevron_leftchevron_right
globe_book
Используйте
r.jina.ai для чтения URL-адреса и извлечения его содержимого.travel_explore
Используйте
s.jina.ai для поиска в Интернете и получения результатов поискаДобавьте
mcp.jina.ai в качестве сервера MCP для доступа к нашему API в LLM.Формат контента
Вы можете контролировать уровень детализации ответа, чтобы предотвратить чрезмерную фильтрацию. Конвейер по умолчанию оптимизирован для большинства веб-сайтов и входных данных LLM.
По умолчанию
arrow_drop_down
JSON-ответ
Ответ будет в формате JSON, содержащий URL-адрес, заголовок, контент и временную метку (если имеется). В режиме поиска он возвращает список из пяти записей, каждая из которых соответствует описанной структуре JSON.
Тайм-аут (секунды)
Максимальное время ожидания загрузки страницы. Увеличивайте его для медленно загружаемых страниц, уменьшайте для простых статических страниц.
Бюджет токенов
Ограничивает максимальное количество токенов, используемых для этого запроса. Превышение этого лимита приведет к сбою запроса.
Использовать ReaderLM-v2
Экспериментальный
Использует ReaderLM-v2 для преобразования HTML в Markdown, чтобы обеспечить высококачественные результаты для веб-сайтов со сложной структурой и содержимым. Стоит 3x токенов!open_in_newУзнать больше
Извлечь только (селектор CSS)
Извлекайте только контент, соответствующий этим CSS-селекторам. Пример: article, .main-content, #post-body
Ожидание (CSS-селектора)
Подождите, пока эти элементы появятся, прежде чем извлекать контент. Полезно для динамически загружаемого контента.
Исключить (селектор CSS)
Удалите эти элементы перед извлечением. Например: nav, footer, .sidebar, #ads
Удалить все изображения
Удаляет все изображения из выходных данных. Уменьшает использование токенов, когда изображения не нужны.
Формат цитирования OpenAI
Форматирование ссылок для инструмента веб-браузера OpenAI. Использует специальные маркеры цитирования, совместимые с моделями GPT.open_in_newУзнать больше
Раздел «Краткая информация о ссылках»
В конце будет создан раздел «Кнопки и ссылки». Это помогает нижестоящим LLM или веб-агентам перемещаться по странице или предпринимать дальнейшие действия.
Никто
arrow_drop_down
Раздел «Краткое описание изображений»
В конце будет создан раздел «Изображения». Это дает последующим специалистам LLM обзор всех визуальных элементов на странице, что может улучшить логику.
Никто
arrow_drop_down
Размер области просмотра браузера
POST
Задает размеры окна браузера. Влияет на адаптивный дизайн и видимость контента.open_in_newУзнать больше
Переслать файл cookie
Наш сервер API может пересылать ваши пользовательские настройки файлов cookie при доступе к URL-адресу, что полезно для страниц, требующих дополнительной аутентификации. Обратите внимание, что запросы с файлами cookie не кэшируются.open_in_newУзнать больше
Подпись к изображению
Подписывает все изображения по указанному URL-адресу, добавляя «Image [idx]: [caption]» в качестве альтернативного тега для тех, у кого его нет. Это позволяет последующим LLM взаимодействовать с изображениями в таких действиях, как рассуждение и подведение итогов.
Используйте прокси-сервер
Наш сервер API может использовать ваш прокси-сервер для доступа к URL-адресам, что полезно для страниц, доступных только через определенные прокси.open_in_newУзнать больше
Используйте прокси-сервер для конкретной страны
Установите код страны для прокси-сервера на основе местоположения. Используйте «auto» для оптимального выбора или «none» для отключения.
Обход кэша
Наш сервер API кэширует содержимое режима чтения и поиска в течение определенного периода времени. Чтобы обойти этот кеш, установите для этого заголовка значение true.
Допустимое отклонение кэша (в секундах)
Принимать кэшированное содержимое, если оно моложе N секунд. Установите значение 0 для свежего содержимого (аналогично параметру «Обход кэша») или более высокие значения для более быстрой обработки данных из кэша.
Время готовности страницы
Когда следует считать страницу полностью загруженной? Более поздние значения времени загрузки позволяют подождать дольше, но при этом захватывают более динамичный контент.
По умолчанию
arrow_drop_down
Пользовательский агент
Переопределяет строку User-Agent браузера. Полезно для доступа к сайтам, требующим определенных браузеров или блокирующим поисковых роботов.
Пользовательский реферер
Установите заголовок HTTP Referer. Некоторые сайты проверяют его, чтобы убедиться, что трафик поступает из ожидаемых источников.
Сохранение изображений Base64
Сохраняйте изображения, закодированные в base64, непосредственно в выходном файле Markdown, вместо того чтобы преобразовывать их во внешние URL-адреса.
Не кэшировать и не отслеживать
Предотвратите кэширование или запись этого запроса на наших серверах. Используйте для конфиденциальных URL-адресов.
Github Flavored Markdown
Включение/отключение функций GFM (Github Flavored Markdown).
Включено
arrow_drop_down
Режим потока
Режим потока полезен для больших целевых страниц, поскольку дает больше времени для полной визуализации страницы. Если в стандартном режиме контент получается неполным, рассмотрите возможность использования режима Stream.open_in_newУзнать больше
Настроить локаль браузера
Управляйте локалью браузера для отображения страницы. Множество веб-сайтов предоставляют разный контент в зависимости от локали.open_in_newУзнать больше
Уважайте robots.txt
Перед выполнением запроса проверьте правила в файле robots.txt. Укажите имя бота, которое следует использовать для проверки.
Включить содержимое iframe
Извлекать контент из встроенных iframe. Включить для страниц, контент которых загружается во фреймы.
Включить теневой DOM
Извлекать контент из компонентов Shadow DOM. Включить эту функцию для страниц, использующих веб-компоненты.
Используйте конечный URL в качестве базового.
Для разрешения относительных URL-адресов используйте конечный URL-адрес назначения после перенаправлений, а не исходный URL-адрес.
Локальный файл PDF/HTML
POST
Используйте Reader на локальных файлах PDF и HTML, загрузив их. Поддерживает только файлы PDF и HTML.
upload
Перед извлечением выполните JavaScript.
POST
Выполните пользовательский JavaScript для изменения страницы перед извлечением контента. Это может быть встроенный код или URL-адрес файла скрипта.open_in_newУзнать больше
Стиль заголовка
Устанавливает формат заголовка markdown (передается в Turndown).
Хэш-стиль
arrow_drop_down
Стиль горизонтальной линейки
Определяет формат горизонтальной линии разметки (передается в Turndown).
Стиль маркера
Устанавливает символ маркера маркированного списка (передается в Turndown).
*
arrow_drop_down
Акцентный стиль
Определяет разделитель акцента в разметке (передается в Turndown).
_
arrow_drop_down
Сильный акцентный стиль
Устанавливает разделитель сильного акцента markdown (передается в Turndown).
**
arrow_drop_down
Стиль ссылки
Определяет формат ссылки markdown (передается в Turndown).
В соответствии
arrow_drop_down
Соответствие нормам ЕС
Экспериментальный
Все операции по инфраструктуре и обработке данных полностью находятся в юрисдикции ЕС.
upload
Запрос
GET
Bash
Язык
arrow_drop_down
curl "https://r.jina.ai/https://www.example.com"
key
API-ключ
visibility_off
Доступные токены
0
Для лучшего поиска
Наши передовые модели формируют поисковую основу для высококачественных систем корпоративного поиска и RAG.
Наши публикации
Поймите, как наши модели поиска на границе были обучены с нуля, ознакомьтесь с нашими последними публикациями. Познакомьтесь с нашей командой в EMNLP, SIGIR, ICLR, NeurIPS и ICML!
февраль 17, 2026
февраль 11, 2026
ICLR 2026
январь 22, 2026
декабрь 29, 2025
ICLR 2026
декабрь 04, 2025
AAAI 2026
октябрь 01, 2025
NeurIPS 2025
август 31, 2025
EMNLP 2025
июнь 24, 2025
ICLR 2025
март 04, 2025
ACL 2025
декабрь 17, 2024
ICLR 2025
декабрь 12, 2024
ECIR 2025
сентябрь 18, 2024
SIGIR 2025
сентябрь 07, 2024
EMNLP 2024
август 30, 2024
WWW 2025
июнь 21, 2024
ICML 2024
май 30, 2024
февраль 26, 2024
октябрь 30, 2023
EMNLP 2023
июль 20, 2023
Всего публикаций 19.







































