扔掉遥控器怎样看电视? 从三大关键词看AI 3.0时代的“闻声识人”

2017-12-21 11:49 千龙网

打印 放大 缩小

千龙网北京12月21日讯 12月20日,一场集齐五大传统彩电品牌最新、最具代表性的电视产品盛会即“AI 3.0  私享定‘智’长虹Q5K人工智能电视品鉴会”在北京长城脚下的公社举办。四大功能维度实测,真实的生活场景体验,谁的智商在线?一窥究竟!

微信图片_20171221114556

AI 3.0 私享定‘智’长虹Q5K人工智能电视品鉴活动现场

未来的AI竞争离不开消费场景,而家庭物联网势必会成为AI应用最多的场景之一。作为AI 3.0时代家庭物联网核心中智能电视终端的代表产品,长虹CHiQ人工智能电视Q5K涵盖语音识别、语义理解、模糊搜片、智能推荐等功能,远场开关机、远场语音识别、语音操控统统不在话下,同时也是国内为数不多的、支持声纹识别的人工智能电视。

微信图片_20171221114603

深度解析Q5K带来的AI3.0时代生活方式

现场,国家数字音视频及多媒体产品质量监督检验中心工程师,为现场嘉宾深度解析了几大主流品牌电视的人工智能技术,并细致体验Q5K带来的AI3.0时代生活方式。那么,从AI 1.0跨入AI 3.0时代,人工智能电视实现了哪些跨越呢?

打个比方,以目前市面上绝大多数单纯主打“语音识别”的电视来说,只能称得上是人工智能电视的雏形,属于AI 1.0时代的产物,这是第一梯队;做得到“语义分析”,能够通过理解用户语义,实现分析、推荐的功能才算得上是进阶的AI 2.0时代人工智能电视,这是第二梯队;具有远场语音、声纹识别技术的长虹CHiQ Q5K系列,能应答、能通过“人工智能+大数据+深度学习”了解用户需要什么,而且突破性地实现丢掉手机、遥控器,直接与用户进行自然交互,让人工智能电视更具人性化,这才是迈入了AI 3.0时代。

为什么要比拼远场语音能力?

人工智能最重要的职能就是解放人力,提升效率。因为有了人工智能,节省出来的人力物力可以去做更多的事,创造更大的价值。

微信图片_20171221114400

语音交互为人类带来的方便无需多言,但传统语音交互需要通过手动操作来实现,比如按住摇控器发送语音指令,在方便快捷上仍有局限性。

这时,能真正实现“解放双手”的远场语音识别的优势就体现出来了。电视内置麦克风阵列,用户可不用手接触任何设备,通过说出特定的“唤醒词”激活远场语音识别功能,即可在一定范围之内纯语音操控电视。使用更方便,过程也更快速。

经过检测发现,五款产品中,仅有长虹Q5K具有远场语音功能,其他四款产品目前都不支持远场语音识别。

1

仅仅得出这个结论,想必还不能满足大家的好奇心!人工智能电视的远场识别极限在哪里呢?测试组分别在1米、2米、3米、4米、5米的位置,使用同一个声音大小对长虹Q5K进行测试。发现在5米范围内,Q5K的语音识别都非常准确,且其适用范围超过5米。

声纹识别 “让我想看电影”有了精准推荐

借助声纹识别技术,电视会按识别到的角色(如:男性、女性、小孩),提供个性化视觉及内容服务。测试的五款电视中仍然只有长虹Q5K具有声纹识别的能力,其他四款不具备这项功能。

2

长虹Q5K支持多人声纹注册和角色分类,会通过每个人说话的声音不同而区分目前使用电视的用户是谁,并对该用户使用电视的习惯进行学习和分析,从而实现内容的精准推荐。

男性测试人员和女性测试人员分别对长虹Q5K说出“我想看电影”,Q5K会根据身份识别呈现不同的视觉效果和推荐影片。针对女性的界面是柔美的粉红色,推荐的影片以言情类为主,男性则会看到深蓝色视觉以及一些动作、科幻类为主的影片结果。如果是小朋友,则会得到一些动画片的推荐结果。

对于使用者来说,这种个性化的服务是很有需要的,但从目前电视行业整体发展来看,声纹识别方面还不够成熟,技术应用还需要一定时间的打磨。

语义理解 听懂你所想

目前市场上主流的智能电视,基本都有语音识别的功能,语音交互的难点在于语义理解。能不能理解用户的意图,是对人工智能技术的一大考验。测试组选取了几类测试项目,每个类别采用多种指令,看看电视机能不能准确执行。

微信图片_20171221114407

1、音乐、影视搜索

最基本的功能考验,对五款电视说“我想听《成都》”,除一款电视外,其他四款电视都能给出正确的回应,找到赵雷的《成都》。连续点播20首歌,包括《刚好遇见你》、《修今生》、《三角题》等等。

测试组又提出了看电影的要求,“我想看《战狼2》”、“我想看《摔跤吧!爸爸》”、“我想看《心理罪》”。这一次,长虹Q5K等电视机表现比较出色,内容资源上明显更具优。

2、本机操作

对于静音、设置、返回、音量增加/减少这些基本操作指令,五款电视基本都能通过语音操控完成。但长虹Q5K的表现更胜一筹,可以支持语音开机关机,而其它四款电视不能使用语音开机,

3、口语化指令

围绕着基本操作,测试组尝试换种说法,“太亮了”、“太暗了”,看看电视机能不能理解。长虹Q5K能够识别出用户的意图“调节亮度”。

4、逻辑能力

逻辑能力是目前人工智能电视竞争的一个热点,主要表现在对人物关系的理解上。在测试中,对五台机器说出“我想看孙俪老公的电影”、“我想看陈妍希老公的电视剧”,长虹Q5K能够准确地找到邓超的电影和陈晓的电视剧,另外三款电视有的给出了孙俪和陈妍希本人的影视剧搜索结果,有的则完全摸不着头脑。

综合以上四项,五台电视在典型使用场景下的语义理解准确率如下:

3

以语音为载体的交互方式,难免会有说话时产生口误的问题存在,有时用户可能一时口快发错了音,有时是生僻字容易说错。在用户客观指令错误或者机器本身识别错误的情况下,电视机是否具备自纠错能力,为用户找到正确的音视频内容,是本次测试想要考验的一个竞争点。

测试人员故意把《你不来我不老》混乱地说成《我不来你不好》,把《战狼2》平卷舌不分地说成《张狼2》,把《摔跤吧!爸爸》减省地说成《摔跤吧》,把《那年花开月正圆》错说成《那年花开月正转》。无论是错别字、谐音字还是减省字的情况,长虹Q5K都能自动修正,找到用户目标所指的正确内容。能做到这样的程度,数据积累绝非一朝一夕之功。

4

总结

以上是针对五大传统彩电品牌长虹等电视产品所做的实际测评体验。这次对比体验将人工智能技术在电视行业的应用情况做了一个真实的还原。整体来说,电视机在语音识别体验上相对比较成熟,识别率和准确率都能达到比较好的效果。从行业整体来说,远场语音和声纹识别技术仍需打磨。

当然,人工智能技术在电视上的突破仍需业界的共同努力,对技术落地进行进一步打磨,最终推动整个行业的成熟。

责任编辑:孔祥妮(QO0003)

猜你喜欢