Facebook发布了新工具AAT，盲人也可以“看到”图片内容了

Facebook 新发布了一个工具——自动选择文本（ Automatic Alternative Text ，以下简称 AAT ），通过物体识别技术识别图像内容并读出相关文本，帮助盲人和视力障碍者 “看到” 网站上的图片。这个工具由 Facebook 的无障碍小组研发，他们已经在这一项工具的研发上花费了几个月的精力。

Facebook 的 AAT 工具已经经过了上百万样本的测试，技术基于类神经网络，这种网络基于上亿的参数，也是一种机器学习模型。不过简而言之，类神经网络运用到 Facebook 的 AAT 工具上，作用类似于图像识别系统。

Matt King 是 Facebook 的首个盲人工程师，谈及 AAT 工具的时候他说：“研发 AAT 的时候我们主要考虑的是有多少信息是视觉性的，难点是，通常用户发布图片的时候会对图片做个相关评价或者说点别的，他们并不会很直白地描绘图片上到底有什么东西。对于像我这样的（盲人）来说，我很想知道图片到底是什么，关于这张图片的评论是什么？”

在 AAT 推出之前，人们使用的是一些屏幕阅读器，在 Facebook 上使用只能读出人们发布的文本，AAT 的改进是，通过物体识别技术，使用者可以听到图片可能包含的内容，比如图片中有多少个人、他们的表情和他们在室外还是室内。

AAT 工具目前可以自动分辨图片的几个大类信息：交通（车、船、摩托车等）、自然（户外、山丘、海浪、阳光、草地等等）、体育（网球、游泳、体育场等等）、食物（冰淇淋、寿司、甜品等等），在描述性判断描述方面，AAT 暂时可以识别出 “婴儿”、“眼镜”、“微笑”、“珠宝” 和 “自拍” 等等。

现在用户可以在 iOS 系统使用 AAT 功能，但语言设定暂且只有英文，Facebook 解释说这是根据用户需求暂定的。Facebook 承诺会尽快在其他平台上线 AAT 功能并扩展它的语言范围。

你也可以测试一下实际效果，根据 Facebook 发布的 AAT 工具视频介绍，这个工具对下列几张示例图片是这么描述的 “树、天空、户外”、“披萨、食物”、“两个人、微笑、太阳镜、户外、水”，不看图只听 AAT 描述的话，你的想象离实际图片有多远呢？

Latest Images

Trending Articles

Latest Images