Quantcast
Channel: 36氪
Viewing all articles
Browse latest Browse all 79804

Facebook发布了新工具AAT,盲人也可以“看到”图片内容了

$
0
0

Facebook 新发布了一个工具——自动选择文本( Automatic Alternative Text ,以下简称 AAT ),通过物体识别技术识别图像内容并读出相关文本,帮助盲人和视力障碍者 “看到” 网站上的图片。这个工具由 Facebook 的无障碍小组研发,他们已经在这一项工具的研发上花费了几个月的精力。

facebook1.png

Facebook 的 AAT 工具已经经过了上百万样本的测试,技术基于类神经网络,这种网络基于上亿的参数,也是一种机器学习模型。不过简而言之,类神经网络运用到 Facebook 的 AAT 工具上,作用类似于图像识别系统。

Matt King 是 Facebook 的首个盲人工程师,谈及 AAT 工具的时候他说:“研发 AAT 的时候我们主要考虑的是有多少信息是视觉性的,难点是,通常用户发布图片的时候会对图片做个相关评价或者说点别的,他们并不会很直白地描绘图片上到底有什么东西。对于像我这样的(盲人)来说,我很想知道图片到底是什么,关于这张图片的评论是什么?”

在 AAT 推出之前,人们使用的是一些屏幕阅读器,在 Facebook 上使用只能读出人们发布的文本,AAT 的改进是,通过物体识别技术,使用者可以听到图片可能包含的内容,比如图片中有多少个人、他们的表情和他们在室外还是室内。

AAT 工具目前可以自动分辨图片的几个大类信息:交通(车、船、摩托车等)、自然(户外、山丘、海浪、阳光、草地等等)、体育(网球、游泳、体育场等等)、食物(冰淇淋、寿司、甜品等等),在描述性判断描述方面,AAT 暂时可以识别出 “婴儿”、“眼镜”、“微笑”、“珠宝” 和 “自拍” 等等。

现在用户可以在 iOS 系统使用 AAT 功能,但语言设定暂且只有英文,Facebook 解释说这是根据用户需求暂定的。Facebook 承诺会尽快在其他平台上线 AAT 功能并扩展它的语言范围。

你也可以测试一下实际效果,根据 Facebook 发布的 AAT 工具视频介绍,这个工具对下列几张示例图片是这么描述的 “树、天空、户外”、“披萨、食物”、“两个人、微笑、太阳镜、户外、水”,不看图只听 AAT 描述的话,你的想象离实际图片有多远呢?

face0.jpg


Viewing all articles
Browse latest Browse all 79804

Latest Images

Trending Articles