Новости
Модели
Продукты
keyboard_arrow_down
Глубокий поиск
Ищите, читайте и рассуждайте, пока не найдете лучший ответ.
Читатель
Читайте URL-адреса и ищите информацию в Интернете для получения более подходящей подготовки для получения степени магистра права.
Вложения
Мультимодальные многоязычные вложения мирового класса.
Реранкер
Нейронный ретривер мирового класса для максимального повышения релевантности поиска.
Более
keyboard_arrow_down
Классификатор
Классификация изображений и текста по нулевому и небольшому количеству кадров.
Сегментатор
Разрежьте длинный текст на куски и выполните токенизацию.

API-документы
Автоматическая генерация кода для вашего второго пилота IDE или LLM
open_in_new


Компания
keyboard_arrow_down
О нас
Связаться с отделом продаж
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия использования


Авторизоваться
login
Что такое API?
API в действии: SceneXplain в блокноте
За пределами блокнота: Использование API в реальной жизни
Улучшите доступность ваших изображений с помощью API SceneXplain
Технический блог
январь 23, 2024

Делаем доступность доступной: создание Alt-текста с помощью API SceneXplain

SceneXplain — ваш помощник в обеспечении доступности контента, позволяющий легко создавать альтернативные текстовые описания изображений для помощи пользователям с нарушениями зрения и улучшения SEO
A striking, holographic diamond-shaped object with a gradient of pink and purple floats centrally against a black background
Alex C-G
Alex C-G • 4 минуты чтения

Доступность (или сокращенно "a11y") быстро становится важной частью веб-разработки и электронной коммерции. Раньше средства обеспечения доступности, такие как альтернативный текст или цветовые схемы для дальтоников, не считались приоритетными для разработчиков и компаний. Но теперь, с принятием законодательства о доступности в Европе и США, обеспечение доступности вашего сайта становится важнее, чем когда-либо.

💡
Alt text, или альтернативный текст — это краткое описание изображения, используемое на веб-сайтах и в цифровых документах. Он помогает людям, которые не могут видеть изображение, понять, о чем оно. Это включает людей, использующих программы чтения с экрана из-за нарушений зрения, и тех, у кого медленное интернет-соединение, когда изображения не загружаются. Alt text также полезен для поисковых систем, чтобы понимать и индексировать изображения.

Но как создать alt text для каждого изображения на вашем сайте? Вручную просматривать каждое изображение и писать альтернативный текст может занять вечность, особенно если у вас тысячи (или миллионы) изображений. А если новые добавляются каждый день, это становится бесконечной битвой.

Вот тут и приходит на помощь SceneXplain. Это ваш помощник в обеспечении доступности! Вы можете просто загрузить изображение и получить для него alt text, не ломая голову над формулировками.

Если у вас, скажем, несколько десятков изображений, это хороший способ дать отдых мозгу. Но вам все равно нужно делать все клики и перетаскивания самостоятельно. Ваш мозг выигрывает, но пальцы - нет. А если у вас несколько тысяч изображений? Записывайтесь к врачу прямо сейчас на прием по поводу туннельного синдрома.

Если бы только был способ автоматизировать весь процесс. Тогда и ваш мозг, и пальцы могли бы оба сосредоточиться на более интересных вещах.

Вот тут-то и приходит на помощь API SceneXplain. Вы можете написать скрипт, который просмотрит ваши тысячи изображений, отправит их пакетами в SceneXplain и сгенерирует CSV файл с результатами (или при небольшой дополнительной разработке интегрируется непосредственно в ваш рабочий процесс).

В конце концов, как говорится, в слове "счастье" не зря есть API.

💡
После дальнейших размышлений я обнаружил, что русский язык, на самом деле, так не работает.

tagЧто такое API?

Но прежде чем погрузиться в как, давайте посмотрим на что. Оксфордский словарь английского языка определяет API как:

Белый баннер из Оксфордского словаря английского языка с приветственным сообщением, благодарящим посетителей, сопровождаемый инструкциями войти или приобрести подписку для продолжения чтения. В центре баннера синяя кнопка с надписью "Посмотреть варианты подписки".
Что ж, это совсем не полезно

Однако, любимый всеми AI, GPT-4 определяет API так:

API, или Application Programming Interface (интерфейс программирования приложений) — это набор правил и протоколов для создания и взаимодействия с программными приложениями. Он определяет методы и форматы данных, которые приложения могут использовать для общения друг с другом. API используются для обеспечения интеграции различных программных систем, позволяя им эффективно обмениваться данными и функциональностью. Другими словами, API подобен официанту в ресторане. Как официант принимает ваш заказ и приносит еду из кухни, API принимает запросы от одной программы и получает информацию или выполняет действия в другой программе. Это помогает разным программам общаться друг с другом и работать вместе.

Или, если вы предпочитаете видео-объяснение:

Если кратко, вы можете написать программу на Python (или любом другом языке) для взаимодействия со SceneXplain через его API и автоматизировать весь процесс создания alt-тегов. У нас есть фрагмент кода на Python, который делает именно это.

💡
Не можете запустить код на своем компьютере? Продолжайте читать до блокнота Google Colab, который позволяет использовать его в браузере.

Вот как это использовать:

  1. Установите библиотеку requests:
pip install requests
  1. Перейдите на страницу API SceneXplain, чтобы сгенерировать секретный ключ и скопируйте его в буфер обмена.
  2. Вставьте его в код Python ниже.
  3. Скопируйте URL изображения в код там, где написано .....
  4. Запустите код!
import requests
import json

# generate token on SceneXplain's API page
YOUR_GENERATED_SECRET = "your_generated_secret_here"

data = {
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..." # change to image URL
    }
  ]
}

headers = {
  "x-api-key": f"token {YOUR_GENERATED_SECRET}",
  "content-type": "application/json",
}

response = requests.post("https://api.scenex.jina.ai/v1/describe", headers=headers, json=data)
print(response.json())

(Позже мы добавим больше фрагментов кода для cURL и JavaScript)

tagAPI в действии: SceneXplain в блокноте

Поскольку мы хотим увидеть это в действии, мы будем использовать код вживую в блокноте. Это позволит вам увидеть, что происходит в реальном времени с реальными данными, и позволит вам изучить и поэкспериментировать с кодом Python самостоятельно.

Google Colaboratory

Блокнот выходит за рамки простого фрагмента Python выше. Он также загружает пример набора данных и экспортирует результаты в CSV файл.

tagЗа пределами блокнота: Использование API в реальной жизни

Конечно, вы не ограничены Python при использовании API SceneXplain. Любой язык, имеющий HTTP библиотеку, должен работать нормально.

Вот тот же фрагмент кода, что и выше, но на этот раз на JavaScript:

const body = {
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..."
    }
  ]
};

const YOUR_GENERATED_SECRET = 'your_generated_secret_here';

fetch('https://api.scenex.jina.ai/v1/describe', {
  headers: {
    'x-api-key': `token ${YOUR_GENERATED_SECRET}`,
    'content-type': 'application/json'
  },
  body: JSON.stringify(body),
  method: 'POST'
}).then(async (resp) => {
  if (resp.ok) {
    const data = await resp.json();
    console.log(data);
  }
});

И на этот раз как команда cURL:

curl "https://api.scenex.jina.ai/v1/describe" \
  -H "x-api-key: token $YOUR_GENERATED_SECRET" \
  -H "content-type: application/json" \
  --data '{
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..."
    }
  ]
}'

tagУлучшите доступность ваших изображений с помощью API SceneXplain

Чтобы начать работу, перейдите на страницу API SceneXplain, чтобы ознакомиться с принципами работы, сгенерировать секретный ключ, а затем либо адаптируйте наш notebook, либо создайте свой собственный код, чтобы уже сегодня начать улучшать доступность!

SceneXplain - Ведущее AI-решение для подписей к изображениям и резюме видео
Испытайте передовое компьютерное зрение с нашими первоклассными алгоритмами создания подписей к изображениям и обобщения видео. Создано для создателей контента, медиа-профессионалов, SEO-экспертов и предприятий электронной коммерции. Поддержка нескольких языков и удобная интеграция API. Повысьте свое цифровое присутствие уже сегодня.
SceneXplain
Категории:
Технический блог
rss_feed
Офисы
location_on
Саннивейл, Калифорния
710 Lakeway Dr, Ste 200, Саннивейл, Калифорния 94085, США
location_on
Берлин, Германия (штаб-квартира)
Prinzessinnenstraße 19-20, 10969 Берлин, Германия
location_on
Пекин, Китай
Уровень 5, здание 6, ул. Хайдянь Вест, д. 48, Пекин, Китай
location_on
Шэньчжэнь, Китай
402, этаж 4, здание Fu'an Technology, Шэньчжэнь, Китай
Поиск Фонда
Глубокий поиск
Читатель
Вложения
Реранкер
Классификатор
Сегментатор
API-документация
Получить API-ключ Jina
Ограничение скорости
Статус API
Компания
О нас
Связаться с отделом продаж
отдел новостей
Стажерская программа
Присоединяйтесь к нам
open_in_new
Скачать логотип
open_in_new
Условия
Безопасность
Условия использования
Конфиденциальность
Управление файлами cookie
email
Jina AI © 2020-2025.