新闻
模型
产品
keyboard_arrow_down
深度搜索
搜索、读取并推理直到找到最佳答案。
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
更多的
keyboard_arrow_down
分类器
图片和文本的零样本和少样本分类。
切分器
将长文本切分成块或词元。

API 文档
为您的AI 编程助手 IDE 或大模型自动生成代码
open_in_new


公司
keyboard_arrow_down
关于我们
联系销售
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款及条件


登录
login
什么是 API?
实际应用 API:在笔记本中使用 SceneXplain
超越笔记本:在现实中使用 API
使用 SceneXplain 的 API 提升你的图像可访问性
技术文章
一月 23, 2024

让无障碍设计更加便利:使用 SceneXplain 的 API 创建替代文本

SceneXplain 是您的无障碍助手,可以轻松生成图片替代文本,帮助视障用户并提升 SEO
A striking, holographic diamond-shaped object with a gradient of pink and purple floats centrally against a black background
Alex C-G
Alex C-G • 4 分钟的读取量

无障碍(或简称"a11y")正迅速成为网站开发和电子商务的重要组成部分。过去,像 alt 文本或色盲友好的配色方案等无障碍辅助功能并不被开发人员和公司视为高优先级。但现在,随着欧洲和美国的无障碍法规出台,让你的网站具备无障碍功能比以往任何时候都更加重要。

💡
Alt 文本,即替代文本,是对网站和数字文档中图片的简短描述。它帮助无法看到图片的人理解图片内容。这包括因视觉障碍而使用屏幕阅读器的人,以及因网络连接速度慢而无法加载图片的用户。Alt 文本对搜索引擎理解和索引图片也很有帮助。

但如何为网站上的每张图片创建 alt 文本呢?手动浏览每张图片并编写 alt 文本可能需要很长时间,特别是如果你有成千上万张图片。而且如果每天都在添加新的图片,这将成为一场永无止境的战斗。

这就是 SceneXplain 的用武之地。它是你的无障碍助手!你只需上传一张图片,就能获得它的 alt 文本,无需自己绞尽脑汁思考措辞。

如果你只有几十张图片,这是个不错的方法让你的大脑休息一下。但你仍然需要自己完成所有点击和拖拽操作。你的大脑赢了,但你的手指没有。如果你有几千张图片呢?现在就预约医生检查腕管综合症吧。

如果能有一种方法可以自动完成整个过程就好了。这样你的大脑和手指就都能专注于更有趣的事情。

这就是 SceneXplain 的 API 发挥作用的地方。你可以编写一个脚本,遍历数千张图片,批量发送到 SceneXplain,并生成包含结果的 CSV 文件(或者通过更多编码,直接集成到你的工作流程中。)

毕竟,你知道他们怎么说。没有 API,就没有快乐。

💡
经过进一步思考,我发现英语确实不是这么用的。

tag什么是 API?

在我们深入了解"如何做"之前,让我们先看看"是什么"。牛津英语词典对 API 的定义是:

来自牛津英语词典的白色横幅,显示着欢迎访客的信息,并附有登录或购买订阅以继续阅读的说明。横幅中央有一个蓝色按钮,提示用户
这完全没有帮助

然而,大家最喜欢的 AI,GPT-4 对 API 的定义是:

API(应用程序编程接口)是一组用于构建和交互软件应用程序的规则和协议。它定义了应用程序可以用来相互通信的方法和数据格式。API 用于实现不同软件系统的集成,使它们能够高效地交换数据和功能。换句话说,API 就像餐厅里的服务员。就像服务员接受你的订单并从厨房带来食物一样,API 从一个软件接收请求并在另一个软件中获取信息或执行操作。这有助于不同的软件程序相互通信和协同工作。

或者,如果你更喜欢视频解释:

简而言之,你可以编写一个 Python(或任何其他语言)程序通过其 API 与 SceneXplain 对话,并自动化整个 alt 标记过程。我们有一个可以实现这一点的 Python 代码片段。

💡
无法在自己的计算机上运行代码?继续往下阅读关于 Google Colab 笔记本的部分,它可以让你在浏览器中使用代码。

以下是使用方法:

  1. 安装 requests 库:
pip install requests
  1. 前往 SceneXplain 的 API 页面生成密钥并复制到剪贴板。
  2. 将其粘贴到下面的 Python 代码中。
  3. 将图片 URL 复制到代码中标有 .... 的位置。
  4. 运行代码!
import requests
import json

# generate token on SceneXplain's API page
YOUR_GENERATED_SECRET = "your_generated_secret_here"

data = {
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..." # change to image URL
    }
  ]
}

headers = {
  "x-api-key": f"token {YOUR_GENERATED_SECRET}",
  "content-type": "application/json",
}

response = requests.post("https://api.scenex.jina.ai/v1/describe", headers=headers, json=data)
print(response.json())

(我们稍后会提供更多 cURL 和 JavaScript 的代码片段)

tag实际应用 API:在笔记本中使用 SceneXplain

由于我们想要看到实际效果,我们将在笔记本中实时使用代码。这让你可以用真实数据实时查看发生的情况,并让你自己检查和使用 Python 代码。

Google Colaboratory

这个笔记本不仅仅包含上面的简单 Python 代码片段。它还会下载示例数据集并将结果导出为 CSV 文件。

tag超越笔记本:在现实中使用 API

当然,使用 SceneXplain 的 API 时,你并不局限于 Python。任何具有 HTTP 库的语言都应该可以正常工作。

这是上面那段代码的 JavaScript 版本:

const body = {
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..."
    }
  ]
};

const YOUR_GENERATED_SECRET = 'your_generated_secret_here';

fetch('https://api.scenex.jina.ai/v1/describe', {
  headers: {
    'x-api-key': `token ${YOUR_GENERATED_SECRET}`,
    'content-type': 'application/json'
  },
  body: JSON.stringify(body),
  method: 'POST'
}).then(async (resp) => {
  if (resp.ok) {
    const data = await resp.json();
    console.log(data);
  }
});

以下是 cURL 命令版本:

curl "https://api.scenex.jina.ai/v1/describe" \
  -H "x-api-key: token $YOUR_GENERATED_SECRET" \
  -H "content-type: application/json" \
  --data '{
  "data": [
    {
      "task_id": "alt_text",
      "languages": [
        "en"
      ],
      "image": "..."
    }
  ]
}'

tag使用 SceneXplain 的 API 提升你的图像可访问性

首先,请访问 SceneXplain 的 API 页面了解它的工作原理,生成密钥,然后可以修改我们的 notebook 或创建你自己的代码,立即开始提升可访问性!

SceneXplain - 领先的图像描述和视频摘要 AI 解决方案
体验尖端的计算机视觉技术,使用我们一流的图像描述和视频摘要算法。专为内容创作者、媒体专业人士、SEO 专家和电子商务企业打造。支持多语言并提供无缝的 API 集成。立即提升你的数字形象。
SceneXplain
类别:
技术文章
rss_feed
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, CA 94085, 美国
location_on
德国柏林(总部)
Prinzessinnenstraße 19-20,10969 柏林,德国
location_on
中国北京
中国北京市海淀区西大街48号6号楼5层
location_on
中国深圳
中国深圳市赋安科技大厦4楼402
搜索底座
深度搜索
读取器
向量模型
重排器
分类器
切分器
API 文档
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Jina AI © 2020-2025.