Новости
Модели
Продукты
keyboard_arrow_down
Читатель
Читайте URL-адреса и ищите информацию в Интернете для получения более подходящей подготовки для получения степени магистра права.
Вложения
Мультимодальные многоязычные вложения мирового класса.
Реранкер
Нейронный ретривер мирового класса для максимального повышения релевантности поиска.
Глубокий поиск
Ищите, читайте и рассуждайте, пока не найдете лучший ответ.
Более
keyboard_arrow_down
Классификатор
Классификация изображений и текста по нулевому и небольшому количеству кадров.
Сегментатор
Разрежьте длинный текст на куски и выполните токенизацию.

API-документы
Автоматическая генерация кода для вашего второго пилота IDE или LLM
open_in_new


Компания
keyboard_arrow_down
О нас
Связаться с отделом продаж
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия использования


Авторизоваться
login
Что такое API?
API в действии: SceneXplain в блокноте
За пределами блокнота: Использование API в реальной жизни
Улучшите доступность ваших изображений с помощью API SceneXplain
Технический блог
январь 23, 2024

Делаем доступность доступной: создание Alt-текста с помощью API SceneXplain

SceneXplain — ваш помощник в обеспечении доступности контента, позволяющий легко создавать альтернативные текстовые описания изображений для помощи пользователям с нарушениями зрения и улучшения SEO
A striking, holographic diamond-shaped object with a gradient of pink and purple floats centrally against a black background
Alex C-G
Alex C-G • 4 минуты чтения

Доступность (или сокращенно "a11y") быстро становится важной частью веб-разработки и электронной коммерции. Раньше средства обеспечения доступности, такие как альтернативный текст или цветовые схемы для дальтоников, не считались приоритетными для разработчиков и компаний. Но теперь, с принятием законодательства о доступности в Европе и США, обеспечение доступности вашего сайта становится важнее, чем когда-либо.

💡
Alt text, или альтернативный текст — это краткое описание изображения, используемое на веб-сайтах и в цифровых документах. Он помогает людям, которые не могут видеть изображение, понять, о чем оно. Это включает людей, использующих программы чтения с экрана из-за нарушений зрения, и тех, у кого медленное интернет-соединение, когда изображения не загружаются. Alt text также полезен для поисковых систем, чтобы понимать и индексировать изображения.

Но как создать alt text для каждого изображения на вашем сайте? Вручную просматривать каждое изображение и писать альтернативный текст может занять вечность, особенно если у вас тысячи (или миллионы) изображений. А если новые добавляются каждый день, это становится бесконечной битвой.

Вот тут и приходит на помощь SceneXplain. Это ваш помощник в обеспечении доступности! Вы можете просто загрузить изображение и получить для него alt text, не ломая голову над формулировками.

Если у вас, скажем, несколько десятков изображений, это хороший способ дать отдых мозгу. Но вам все равно нужно делать все клики и перетаскивания самостоятельно. Ваш мозг выигрывает, но пальцы - нет. А если у вас несколько тысяч изображений? Записывайтесь к врачу прямо сейчас на прием по поводу туннельного синдрома.

Если бы только был способ автоматизировать весь процесс. Тогда и ваш мозг, и пальцы могли бы оба сосредоточиться на более интересных вещах.

Вот тут-то и приходит на помощь API SceneXplain. Вы можете написать скрипт, который просмотрит ваши тысячи изображений, отправит их пакетами в SceneXplain и сгенерирует CSV файл с результатами (или при небольшой дополнительной разработке интегрируется непосредственно в ваш рабочий процесс).

В конце концов, как говорится, в слове "счастье" не зря есть API.

💡
После дальнейших размышлений я обнаружил, что русский язык, на самом деле, так не работает.

tagЧто такое API?

Но прежде чем погрузиться в как, давайте посмотрим на что. Оксфордский словарь английского языка определяет API как:

Белый баннер из Оксфордского словаря английского языка с приветственным сообщением, благодарящим посетителей, сопровождаемый инструкциями войти или приобрести подписку для продолжения чтения. В центре баннера синяя кнопка с надписью "Посмотреть варианты подписки".
Что ж, это совсем не полезно

Однако, любимый всеми AI, GPT-4 определяет API так:

API, или Application Programming Interface (интерфейс программирования приложений) — это набор правил и протоколов для создания и взаимодействия с программными приложениями. Он определяет методы и форматы данных, которые приложения могут использовать для общения друг с другом. API используются для обеспечения интеграции различных программных систем, позволяя им эффективно обмениваться данными и функциональностью. Другими словами, API подобен официанту в ресторане. Как официант принимает ваш заказ и приносит еду из кухни, API принимает запросы от одной программы и получает информацию или выполняет действия в другой программе. Это помогает разным программам общаться друг с другом и работать вместе.

Или, если вы предпочитаете видео-объяснение:

Если кратко, вы можете написать программу на Python (или любом другом языке) для взаимодействия со SceneXplain через его API и автоматизировать весь процесс создания alt-тегов. У нас есть фрагмент кода на Python, который делает именно это.

💡
Не можете запустить код на своем компьютере? Продолжайте читать до блокнота Google Colab, который позволяет использовать его в браузере.

Вот как это использовать:

  1. Установите библиотеку requests:
pip install requests
  1. Перейдите на страницу API SceneXplain, чтобы сгенерировать секретный ключ и скопируйте его в буфер обмена.
  2. Вставьте его в код Python ниже.
  3. Скопируйте URL изображения в код там, где написано .....
  4. Запустите код!
import requests
import json

# generate token on SceneXplain's API page
YOUR_GENERATED_SECRET = "your_generated_secret_here"

data = {
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..." # change to image URL
    }
  ]
}

headers = {
  "x-api-key": f"token {YOUR_GENERATED_SECRET}",
  "content-type": "application/json",
}

response = requests.post("https://api.scenex.jina.ai/v1/describe", headers=headers, json=data)
print(response.json())

(Позже мы добавим больше фрагментов кода для cURL и JavaScript)

tagAPI в действии: SceneXplain в блокноте

Поскольку мы хотим увидеть это в действии, мы будем использовать код вживую в блокноте. Это позволит вам увидеть, что происходит в реальном времени с реальными данными, и позволит вам изучить и поэкспериментировать с кодом Python самостоятельно.

Google Colaboratory

Блокнот выходит за рамки простого фрагмента Python выше. Он также загружает пример набора данных и экспортирует результаты в CSV файл.

tagЗа пределами блокнота: Использование API в реальной жизни

Конечно, вы не ограничены Python при использовании API SceneXplain. Любой язык, имеющий HTTP библиотеку, должен работать нормально.

Вот тот же фрагмент кода, что и выше, но на этот раз на JavaScript:

const body = {
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..."
    }
  ]
};

const YOUR_GENERATED_SECRET = 'your_generated_secret_here';

fetch('https://api.scenex.jina.ai/v1/describe', {
  headers: {
    'x-api-key': `token ${YOUR_GENERATED_SECRET}`,
    'content-type': 'application/json'
  },
  body: JSON.stringify(body),
  method: 'POST'
}).then(async (resp) => {
  if (resp.ok) {
    const data = await resp.json();
    console.log(data);
  }
});

И на этот раз как команда cURL:

curl "https://api.scenex.jina.ai/v1/describe" \
  -H "x-api-key: token $YOUR_GENERATED_SECRET" \
  -H "content-type: application/json" \
  --data '{
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..."
    }
  ]
}'

tagУлучшите доступность ваших изображений с помощью API SceneXplain

Чтобы начать работу, перейдите на страницу API SceneXplain, чтобы ознакомиться с принципами работы, сгенерировать секретный ключ, а затем либо адаптируйте наш notebook, либо создайте свой собственный код, чтобы уже сегодня начать улучшать доступность!

SceneXplain - Ведущее AI-решение для подписей к изображениям и резюме видео
Испытайте передовое компьютерное зрение с нашими первоклассными алгоритмами создания подписей к изображениям и обобщения видео. Создано для создателей контента, медиа-профессионалов, SEO-экспертов и предприятий электронной коммерции. Поддержка нескольких языков и удобная интеграция API. Повысьте свое цифровое присутствие уже сегодня.
SceneXplain
Категории:
Технический блог
rss_feed
Офисы
location_on
Саннивейл, Калифорния
710 Lakeway Dr, Ste 200, Саннивейл, Калифорния 94085, США
location_on
Берлин, Германия (штаб-квартира)
Prinzessinnenstraße 19-20, 10969 Берлин, Германия
location_on
Пекин, Китай
Уровень 5, здание 6, ул. Хайдянь Вест, д. 48, Пекин, Китай
location_on
Шэньчжэнь, Китай
402, этаж 4, здание Fu'an Technology, Шэньчжэнь, Китай
Поиск Фонда
Читатель
Вложения
Реранкер
Глубокий поиск
Классификатор
Сегментатор
API-документация
Получить API-ключ Jina
Ограничение скорости
Статус API
Компания
О нас
Связаться с отделом продаж
отдел новостей
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия
Безопасность
Условия использования
Конфиденциальность
Управление файлами cookie
email
Jina AI © 2020-2025.