Корпоративный поиск - сложная задача. Запросы могут различаться по качеству, детализации и специфике предметной области, но ответы должны быть точными, прямыми и максимально релевантными. При этом исходные данные обычно слабо структурированы, плохо организованы или полностью неструктурированы, хранятся в различных форматах с разной степенью доступности.
Наличие правильной и актуальной информации крайне важно для качественного обслуживания клиентов. Самые высокооплачиваемые сотрудники компании — не только руководство, но и квалифицированный технический персонал и инженеры — тратят ресурсы компании, когда им приходится часами просматривать массивы слабоструктурированной документации в поисках нужной информации.
Именно такие задачи демонстрируют реальную мощь ИИ в корпоративном секторе.

DeepSearch от Jina AI использует новые разработки в области ИИ для корпоративного поиска, применяя агентное рассуждение к мультимодальному поиску информации. Он делает больше, чем просто находит набор потенциальных совпадений по запросу. DeepSearch интеллектуально анализирует запросы пользователей, переформулирует их и оценивает результаты, глубже погружаясь в данные от имени пользователя, пока не будет удовлетворен общим результатом. Он может выявлять неоднозначности в запросах, о которых пользователи могут не подозревать, обобщать релевантную информацию и представлять результаты. Если для правильного ответа на запрос требуется информация из нескольких документов, он делает это прозрачно и понятно для пользователя.
DeepSearch действует как агент пользователя, использует существующие поисковые системы, а не заменяет всю технологическую инфраструктуру. Он добавляет мощный ИИ в критически важные системы без дорогостоящих инфраструктурных изменений.
tagКак работает DeepSearch?

DeepSearch работает итеративно, через процесс поиска, чтения, размышления и переформулирования поиска, отслеживая то, что он узнал, и применяя это заново. Короче говоря, он имитирует идеальное поведение пользователя при работе с поисковой системой и массивом документов.

DeepSearch выходит за рамки простого улучшения обычного поиска. Он не просто находит документы для представления пользователям; он читает их и затем формирует новые запросы на основе того, что узнал. Он думает и отвечает.
tagDeepSearch с визуальными документами
Чтобы показать, как это работает на практике, мы будем использовать коллекцию PDF-документов, предоставленных нашим партнером Sikla GmbH, немецкой компанией, поставляющей модульные строительные и инженерные системы по всему миру. Эти документы состоят из каталогов продукции, спецификаций и документации по креплениям и различным строительным изделиям.
Хотя DeepSearch работает с любыми поисковыми и архивными системами, которые у вас уже есть, для этой статьи мы будем использовать наш прототип Enterprise Visual Document Search. Это хранилище документов на базе ИИ поддерживает неструктурированные смешанные медиа, особенно PDF и HTML5/SVG-рендеринги, объединяющие как диаграммы, так и текст, извлекая документы с помощью мультимодальной и многоязычной семантической индексации. Короче говоря: он просто работает с тем, что у вас есть.
Рассмотрим пример запроса:
Какой момент затяжки для балочного зажима TCS F VdS/FM?
Если обрабатывать это как обычный запрос и использовать DocumentSearch без DeepSearch, результаты выглядят так:

Это не очень полезно. Термины запроса в основном совпадают, но найденные страницы не очень релевантны моменту затяжки.
Одна из стратегий улучшения запросов — удаление ненужных слов:
Момент затяжки TCS F VdS/FM Beam Clamp.
Этот запрос находит инструкции по монтажу, в которых указан правильный момент затяжки.

Это подчеркивает особенности информационно-поисковых систем, которые часто чувствительны к точной формулировке запроса. Независимо от того, насколько хорошо настроена ваша система, такие проблемы все равно могут возникать.
DeepSearch способен пробовать различные способы построения запросов и оценки результатов, действуя от имени пользователя. Вместо того чтобы тратить человеческое время и усилия на подбор формулировок запроса, ИИ делает это за них.
Но DeepSearch может делать больше, чем просто показывать нужный документ. "Какой момент затяжки для балочного зажима TCS F VdS/FM?" — это вопрос с конкретным правильным ответом: 10 Нм (ньютон-метров). DeepSearch читает найденные документы и может дать вам ответ напрямую со ссылкой на соответствующий документ для проверки при необходимости:
Момент затяжки гаек балочного зажима Sikla TCS F VdS / FM составляет 10 Нм[^1]. Установите балочный зажим и затяните обе гайки вручную, затем затяните гайки с моментом 10 Нм.
tagDeepSearch, также известный как TiefenSuche
DeepSearch многоязычен, обучен более чем на 100 языках. Это означает, что мы можем искать и на немецком языке. Например:
Was ist der Anzugsmoment für eine 25mm Stabilrohrschelle?
(Какой момент затяжки для 25-мм трубного хомута Stabil (торговая марка)?)
При прямом использовании DocumentSearch первый результат поиска действительно содержит ответ:

Это довольно хорошо, хотя вам нужно прочитать таблицу и знать, что 25 мм входит в диапазон 24-65 мм, чтобы получить правильное значение: 2 Нм.
Но есть еще одна проблема: этот запрос неоднозначен. Sikla продает несколько различных трубных хомутов марки Stabil с разными моментами затяжки. Страница выше содержит правильный ответ только для хомута Stabil D3G.
Третья по релевантности страница более ясно говорит об этом:

Здесь мы видим три различных хомута бренда Stabil с разными моментами затяжки. Чтобы получить полный и правильный ответ, пользователи должны понимать, во-первых, что их запрос соответствует более чем одному варианту, и во-вторых, необходимо смотреть дальше первой найденной страницы.
DeepSearch делает это автоматически. Он даёт гораздо более информативный ответ на тот же запрос:
Der Anzugsmoment für eine 25-mm-Stabilrohrschelle von Sikla variiert je nach Modell. Hier eine Übersicht relevanter Modelle und zugehöriger Anzugsmomente, basierend auf den Spannbereichen:
- Stabil D-3G m.E.: Für den Spannbereich 24-65 mm beträgt der Anzugsmoment 2 Nm [^1]. Dieser Wert gilt sowohl für statische als auch für seismische Belastungen. Diese Schelle ist aus galvanisch verzinktem Stahl gefertigt.
- Stabil RB-A: Diese Schelle hat keinen expliziten Wert für 25 mm genannt. Jedoch beträgt der Anzugsmoment für den Spannbereich 13-49 mm 20 Nm. Diese Schelle ist aus blankem Stahl gefertigt.
Es ist zu beachten, dass der korrekte Anzugsmoment entscheidend für die sichere Befestigung ist. Bei Unsicherheiten sollte immer die spezifische Montageanleitung des jeweiligen Sikla Produkts konsultiert werden.
Перевод:
Момент затяжки для 25-мм трубного хомута Stabil от Sikla варьируется в зависимости от модели. Вот обзор соответствующих моделей и моментов затяжки, основанный на диапазонах зажима:
- Stabil D-3G m.E.: Для диапазона зажима 24-65 мм момент затяжки составляет 2 Nm [^1]. Это значение применимо как для статических, так и для сейсмических нагрузок. Этот хомут изготовлен из оцинкованной стали.
- Stabil RB-A: Для этого хомута нет точного значения для 25 мм. Однако момент затяжки для диапазона зажима 13-49 мм составляет 20 Nm. Этот хомут изготовлен из светлой стали.
Следует отметить, что правильный момент затяжки имеет решающее значение для надежного крепления. В случае сомнений всегда следует обращаться к инструкции по монтажу конкретного продукта Sikla.
Это показывает реальную мощь, которую DeepSearch добавляет к системам поиска: он выполняет глубокую проверку, которую даже хорошо информированные и опытные пользователи часто не делают.
tagDeepSearch отсекает лишнее
Документы от Sikla часто полны таблиц с очень специфическими названиями и цифрами. Это очень важная информация для инженерного дела, но она также утомляет глаза и может быть неправильно прочитана или пропущена человеком, который немного устал или заскучал.
Например:
Welches ist die notwendige Verankerungstiefe in Porenbeton beim VMU plus System?
(Какая необходимая глубина анкеровки для системы VMU plus в ячеистом бетоне?)
Это возвращает правильную информацию, но на странице, полной таблиц и цифр:

DeepSearch отсекает лишнее и даёт ответ, исключающий то, что не отвечает на запрос:
Die notwendige Verankerungstiefe für das VMU plus System in Porenbeton hängt von der Steindruckfestigkeit des Porenbetons (fb) und dem Durchmesser der Ankerstange ab. Gemäß ETA-17/0307 sind folgende Werte für Porenbeton AAC6 (ρ: 0,6 kg/dm³) mit einer Steindruckfestigkeit von ≥ 6 N/mm² zu berücksichtigen [^1]:
Für Ankerstangen M8 bis M16 gilt eine Verankerungstiefe (hef) von 80 mm bis 100 mm. […]
Перевод:
Необходимая глубина анкеровки для системы VMU plus в ячеистом бетоне зависит от прочности бетона на сжатие (fb) и диаметра анкерного стержня. Согласно ETA-17/0307, следующие значения должны учитываться для ячеистого бетона AAC6 (ρ: 0,6 кг/дм³) с прочностью на сжатие ≥ 6 Н/мм² [^1]:
Для анкерных стержней от M8 до M16 глубина анкеровки (hef) составляет от 80 мм до 100 мм. [...]
tagDeepSearch для предприятий: позвольте ИИ искать за вас
Нет такой области корпоративных ИТ, где технология ИИ была бы более актуальной, чем поиск информации. Jina AI предлагает полный стек технологий поиска на основе ИИ, от мультимедийной семантической индексации до языковых моделей и моделей рассуждения ИИ, которые встраиваются в весь технологический стек и берут на себя управление хранящейся в нём информацией. Надёжные, доступные и даже недорогие решения на базе ИИ уже сейчас доступны для обслуживания клиентов и поддержки сотрудников.
Если у вашего бизнеса есть хранящиеся данные, которые должны быть под рукой, у нас есть решения для предприятий любого размера и с любыми требованиями к защите данных. Jina AI — европейский поставщик, предоставляющий доступ к моделям ИИ по мере необходимости через совместимый с GDPR публичный API, готовый к установке в вашем облачном развертывании или для установки на месте в вашей серверной.