当前位置: 首页 > 数码发展

QQ空间支持AI图片语音实时描述:视障人士也能“看到”图片

时间:2024-02-21 02:06:42 数码发展

很多时候,我们已经习惯用图片来承载我们想要表达的信息,无论是表情包还是风景照,它最好用文字来表达更直接、更方便。

但这个世界上仍然有很多视障用户。

虽然他们可以借助智能手机的读屏功能听到文字,但却无法享受图片带来的精彩世界。

他们看不懂文章中的图片内容、社交平台上好友分享的照片、聊天时对方发来的表情……最新的Android版QQ空间应用特别添加了“图片语音”功能。

即时描述”功能。

基于腾讯AI Lab(人工智能实验室)的技术,可以将图片识别为文字描述。

这意味着在技术的帮助下,视障用户也可以“看到图片”并理解图片的内容。

人工智能可以理解图像内容,并学习和组织语言,以符合人类语言习惯的流畅一致的方式向用户描述图像。

“图像描述生成”技术由腾讯AI Lab提供。

这一自主研发的强化学习算法在国际顶级赛事MS COCO的该类别挑战赛中排名第一,超越了微软、谷歌等公司。

腾讯还专门发布了一段演示视频,从中可以看到,当你在QQ空间浏览时遇到一张图片时,APP会自动解读图片的内容和含义,比如一个人站在雾气之上——浓浓的山峦、山脚下的喷泉、或是夕阳西下。

下面的天空、水族馆里的海豚等等。

用户只需进入系统设置、辅助功能、开启TalkBack即可。

稍后将添加iOS版QQ空间。

在正式上线前,QQ空间产品团队还邀请了视障伙伴进行测试体验,并在体验过程中不断收集视障用户的反馈和建议,不断优化功能。

我们来看看一位用户的体验评论:当我第一次听说QQ空间客户端推出了可以描述文字和图片的功能时,我有点惊讶,因为我从来没有想过有一天我会有这样的体验。

我出于好奇尝试了一下,正好有朋友在炫耀她做的美味佳肴。

虽然空间客户端上的图片描述没有告诉我这是什么米,但上面写着“图片-一位女士在吃东西”。

也许你不这么认为。

什么,虽然觉得没什么参考意义,但好像给我打开了一扇全新的门。

过去,我只会用文字来试图理解我熟悉的朋友的意思。

只有关系好的时候我才会评论,问那张照片是什么。

以后这一步基本可以省略,也不用再请朋友描述附图了。

刚才我给分享美食的朋友评论:你做的饭菜很好吃,看起来很好吃。

她看到我的评论后立即回复,表示惊讶,因为她只发了图片,没有任何文字。