QQ空间图片描述功能是干嘛的?

很多时候,我们已经习惯于用图片承载想表达的信息,无论是表情包还是风景照,都比用文字表达来的更直接更便捷。

但这个世上还有不少视障用户。他们虽然可以借助智能手机里的读屏功能听到文字,却无法享受图片带来的精彩世界,不能了解文章中配图的内容、社交平台上好友分享的照片、聊天时对方发送的表情……

最新的安卓版QQ空间应用中特意增加了“图片语音即时描述”功能,基于腾讯AI Lab(人工智能实验室)的技术,能够将图片识别成一句文字描述。

这意味着,借助科技的力量视障用户,也能“看到图片”、了解图片的内容了。

AI能够理解图像内容并学习和组织语言,以通顺并符合人类语言习惯向用户表述图片。“图像描述生成”技术由腾讯AI Lab提供,这项自主研发的强化学习算法在国际顶级大赛MS COCO的该类别挑战赛上排名第一,超越微软和Google等公司。

来看一位用户的体验评论:

刚听说QQ空间客户端推出可以描述文字配图的功能时我有些错愕,因为自己一直也没想到会有一天能有这种体验。怀着好奇试了一下,正好一个好友在晒她做的美味,虽然空间客户端的图片描述没有告诉我那是什么饭,但却说“图片——一名女士在吃饭。”

可能你不会觉得有什么,甚至认为参考性不是很大,但对我而言却仿佛打开了一扇全新的大门。

之前我对于一般熟的好友动态,只会通过文字揣摩他要表达的意思,关系好的才会评论问图片是什么?而以后这一步基本可以省掉,在也不必让好友描述配图了。

就在刚刚,我给那条分享美食的好友评论:你做的美味,看起来很好吃的样子。看到我的评论她立刻秒回,表示特别惊讶,因为她只发了图片,没有配任何文字。

图片描述功能

日前,腾讯宣布在安卓版QQ空间客户端融入腾讯AI Lab提供的"图像描述生成"技术,让视障用户也可以“看到图片”。

腾讯AI Lab图片描述生成技术一般都是基于编码器—解码器框架。这一技术的难点在于设计出能够充分理解图像内容的模型,进而将相应编码的图像内容再‘翻译’成自然语句。

QQ空间团队与信息无障碍研究会一直保持着长期稳定合作。QQ空间的图片描述功能的灵感,来源于与信息无障碍研究会的一次日常探讨,视障工程师提出的建议。

这次,QQ空间借助AI技术,为图片自动添加描述文本,能够让视障者通过读屏软件,以听觉(读屏软件)、触觉(点显器)等感官了解图片内容,在QQ空间这个社交场景实现了图片信息的多重感官的传递。

QQ空间是国内率先将人工智能应用在信息无障碍领域的社交产品。海外社交网站Facebook此前也推出了与QQ空间“图片描述”相似的功能。

国内的信息无障碍优化,大多是基于对读屏软件兼容性的优化,而这次QQ空间团队利用人工智能技术升级产品体验,让各界人士看到了科技赋予更多信息无障碍的可能性。