Новости
Модели
Продукты
keyboard_arrow_down
Глубокий поиск
Ищите, читайте и рассуждайте, пока не найдете лучший ответ.
Читатель
Читайте URL-адреса и ищите информацию в Интернете для получения более подходящей подготовки для получения степени магистра права.
Вложения
Мультимодальные многоязычные вложения мирового класса.
Реранкер
Нейронный ретривер мирового класса для максимального повышения релевантности поиска.
Более
keyboard_arrow_down
Классификатор
Классификация изображений и текста по нулевому и небольшому количеству кадров.
Сегментатор
Разрежьте длинный текст на куски и выполните токенизацию.

API-документы
Автоматическая генерация кода для вашего второго пилота IDE или LLM
open_in_new


Компания
keyboard_arrow_down
О нас
Связаться с отделом продаж
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия использования


Авторизоваться
login
Проблема фактической точности LLM
Как Jina Reader помогает улучшить привязку к источникам
Jina Reader как комплексное решение для привязки к источникам
Повышенный лимит запросов с API-ключами
Заключение
star
Избранное
пресс-релиз
май 14, 2024

Jina Reader для поисковой привязки с целью улучшения фактологичности LLM

Граундинг является важнейшим элементом приложений на основе GenAI. Наш новый сервис https://s.jina.ai/ позволяет LLM получать доступ к актуальным знаниям из интернета, обеспечивая поисковый граундинг и делая ответы более достоверными.
Flowchart detailing Jina AI's info search using LLM, starting with "when was Jina AI founded?" and various process steps.
Jina AI
Jina AI • 5 минуты чтения

Привязка к источникам абсолютно необходима для приложений GenAI.

Вы, вероятно, видели множество инструментов, промптов и RAG-конвейеров, разработанных для повышения фактической точности LLM с 2023 года. Почему? Потому что основным барьером, мешающим предприятиям развертывать LLM для миллионов пользователей, является доверие: является ли ответ подлинным или это просто галлюцинация модели? Это проблема всей отрасли, и Jina AI усердно работает над её решением. Сегодня, с новой функцией поисковой привязки Jina Reader, вы можете просто использовать https://s.jina.ai/YOUR_SEARCH_QUERY для поиска актуальных знаний о мире в интернете. С этим вы на шаг ближе к повышению фактической точности LLM, делая их ответы более надежными и полезными.

Reader API
Read URLs or search the web, get better grounding for LLMs.

API, демо можно найти на странице продукта

tagПроблема фактической точности LLM

Мы все знаем, что LLM могут выдумывать вещи и подрывать доверие пользователей. LLM могут говорить вещи, которые не соответствуют действительности (так называемые галлюцинации), особенно в отношении тем, о которых они не узнали во время обучения. Это может быть либо новая информация, появившаяся после обучения, либо узкоспециализированные знания, которые были "маргинализированы" во время обучения.

В результате, когда речь идет о таких вопросах, как "Какая сегодня погода?" или "Кто получил Оскар за лучшую женскую роль в этом году?", модель либо ответит "Я не знаю", либо даст устаревшую информацию.

Interactive web interface for querying Jina AI's founding details with input fields, navigation options, and informational no
Пример "маргинализации" узкоспециализированных знаний во время обучения можно увидеть, когда мы спросили GPT-3.5-turbo "Когда была основана Jina AI?" и получили неверный ответ. Однако при использовании Reader для поисковой привязки та же LLM смогла дать правильный ответ. Фактически, она указала точную дату.
Screen interface for inquiring about SpaceX launches with a query field and details about upcoming missions.
Пример новой информации, появившейся после обучения. Мы спросили GPT-3.5-turbo "Когда будет следующий запуск SpaceX?" (сегодня 14 мая 2024 года), и модель ответила устаревшей информацией 2021 года.

tagКак Jina Reader помогает улучшить привязку к источникам

Ранее пользователи могли легко добавлять префикс https://r.jina.ai, чтобы считывать текстовое и графическое содержимое с определенного URL в LLM-совместимый формат и использовать его для проверки и верификации фактов. С момента первого релиза 15 апреля мы обработали более 18 миллионов запросов со всего мира, что говорит о его популярности.

Сегодня мы рады сделать следующий шаг, представляя API поисковой привязки https://s.jina.ai. Просто добавив его перед вашим запросом, Reader будет искать в интернете и извлекать 5 лучших результатов. Каждый результат включает заголовок, LLM-совместимый markdown (полное содержание! не аннотацию) и URL, который позволяет указать источник. Вот пример ниже, вы также можете попробовать наше живое демо здесь.

Слева: Режим Markdown (прямой переход по https://s.jina.ai/who+is+han+xiao); Справа режим JSON (используя curl https://s.jina.ai/who+is+han+xiao -H 'accept: application/json'). Кстати, такой эгоистичный вопрос всегда служит хорошим тестовым случаем.

При разработке поисковой привязки в Reader мы руководствовались тремя принципами:

  • Повышение фактической точности;
  • Доступ к актуальной информации, т.е. знаниям о мире;
  • Связывание ответа с его источником.

Помимо крайней простоты использования, s.jina.ai также хорошо масштабируется и настраивается, поскольку использует существующую гибкую и масштабируемую инфраструктуру r.jina.ai. Вы можете установить параметры для управления подписями к изображениям, гранулярностью фильтрации и т.д. через заголовки запросов.

Configuration screen of Reader API with options for API behavior, proxy settings, and cookie forwarding against a dark backgr
Попробуйте интерактивный фрагмент кода для расширенного использования Reader API

tagJina Reader как комплексное решение для привязки к источникам

Technical flowchart on a black background illustrating the processing of knowledge through various AI-related URLs.

Если мы объединим поисковую привязку (s.jina.ai) и проверочную привязку (r.jina.ai), мы можем создать очень комплексное решение для привязки к источникам для LLM, агентов и RAG-систем. В типичном надежном RAG-рабочем процессе Jina Reader работает следующим образом:

  1. Пользователь вводит вопрос;
  2. Получение актуальной информации из интернета с помощью s.jina.ai;
  3. Генерация первоначального ответа со ссылкой на результат поиска из предыдущего шага;
  4. Использованиеr.jina.ai для подтверждения ответа с помощью вашего собственного URL; или прочитайте URL-адреса из источника, полученного на шаге 3, чтобы получить более глубокое обоснование;
  5. Генерация окончательного ответа и выделение потенциально необоснованных утверждений для пользователя.

tagПовышенный лимит запросов с API-ключами

Пользователи могут бесплатно использовать новую конечную точку поискового обоснования без авторизации. Более того, при указании API-ключа Jina AI в заголовке запроса (тот же ключ можно использовать в API для Embedding/Reranking), вы сразу получаете 200 запросов в минуту с одного IP для r.jina.ai и 40 запросов в минуту с одного IP для s.jina.ai. Подробности можно найти в таблице ниже:

Конечная точкаОписаниеЛимит запросов без API-ключаЛимит запросов с API-ключомСхема подсчета токеновСредняя задержка
r.jina.aiЧтение URL и возврат его содержимого, полезно для проверки обоснования20 RPM200 RPMНа основе выходных токенов3 секунды
s.jina.aiПоиск в интернете с возвратом топ-5 результатов, полезно для поискового обоснования5 RPM40 RPMНа основе выходных токенов для всех 5 результатов поиска30 секунд

tagЗаключение

Мы считаем, что обоснование крайне важно для GenAI-приложений, и создание обоснованных решений должно быть простым для каждого. Именно поэтому мы представили новую конечную точку поискового обоснования, s.jina.ai, которая позволяет разработчикам легко интегрировать мировые знания в свои GenAI-приложения. Мы хотим, чтобы разработчики укрепляли доверие пользователей, предоставляли объяснимые ответы и вдохновляли миллионы пользователей на любознательность.

Категории:
star
Избранное
пресс-релиз
rss_feed
Офисы
location_on
Саннивейл, Калифорния
710 Lakeway Dr, Ste 200, Саннивейл, Калифорния 94085, США
location_on
Берлин, Германия (штаб-квартира)
Prinzessinnenstraße 19-20, 10969 Берлин, Германия
location_on
Пекин, Китай
Уровень 5, здание 6, ул. Хайдянь Вест, д. 48, Пекин, Китай
location_on
Шэньчжэнь, Китай
402, этаж 4, здание Fu'an Technology, Шэньчжэнь, Китай
Поиск Фонда
Глубокий поиск
Читатель
Вложения
Реранкер
Классификатор
Сегментатор
API-документация
Получить API-ключ Jina
Ограничение скорости
Статус API
Компания
О нас
Связаться с отделом продаж
отдел новостей
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия
Безопасность
Условия использования
Конфиденциальность
Управление файлами cookie
email
Jina AI © 2020-2025.