首页新闻产业企业金融理财股票教育汽车文化房产时尚生活娱乐通信互联网IT明星综艺电影健康

数据堂:智能家居产品应用落地,数据是幕后功臣

2019-01-18 11:01:47    来源:第一产经网    作者:产小小    浏览次数:

作为代表未来科技发展趋势的物联网,随着产业链的不断完善,落地应用越来越多,尤其是面向消费者市场的智能家居,已成为物联网时代的风口,全球智能家居市场高达万亿。

智能家居产品最早从智能电视开始,当时的厂商尝试将语音交互功能嵌入到电视或机顶盒里。经过几年的发展,到现在,语音功能已逐渐成为电视的标配。

从2017年开始,以智能音箱为代表的家居单品开始爆发式增长,智能音箱更是百箱大战,亚马逊、Google、百度、阿里、腾讯、小米、讯飞、联想等一大批企业都参与其中,智能音箱可以与用户交流、播放音乐甚至网购。随着各类智能家居产品的增多,亚马逊、百度等人工智能巨头纷纷在搭建统一平台,以语音为入口,连接各种智能家居设备。

传统电器厂商也开始在传统电器上赋予人工智能,智能空调、智能油烟机、智能冰箱、智能台灯都在如火如荼的研制。

针对庞大的儿童消费市场,智能手表、故事机、机器人等儿童智能产品也越来越受欢迎。

可以说,智能家居产品应用已经进入跑马圈地、深入千家万户的阶段,它以超前的生活理念逐步影响着我们每一个人。

智能家居产品的技术挑战

 

智能家居产品最主要的特点是语音交互,解放用户的双手,通过最自然的语音进行交互。可以说,语音识别技术是智能家居产品的直接推动者。

在智能家居产品以前,语音识别技术主要用于手机。那么手机和智能家居产品里的语音识别技术有什么差异吗?

普通话语音识别在手机上已取得了很高的准确率,但在从手机过渡到智能家居产品的过程中,原有语音识别技术的准确率有显著下降。

首先,说话人离智能家居产品的距离比使用手机时更远,会带来远场语音问题,包括噪音、混响等。

其次,智能家居产品的用户有相当一部分比例是儿童,不像手机用户以成人为主。儿童和成人的声音有明显差异,导致儿童的语音识别率偏低。

然后,听歌看片时因为有大量英文歌曲和人名,用户说话会有中英夹杂的情况。比起纯中文来说,中英夹杂的语音识别率更低。

以上都会对智能家居产品带来语音识别上的困难。解决这些困难,背后需要更有针对性的大量语音数据来供计算机学习。

 

数据助力智能家居产品

 

数据堂研制的语音数据,可以更好的助力智能家居产品应用落地。

首先,针对远场语音,数据堂研制了1000小时的远场家居语音数据,考虑到不同智能家居产品的麦克风特点,数据堂精心设计了一套涵盖线型、环型、2麦、4麦、6麦、8麦等常用组合的麦克风阵列,说话人距离覆盖0.5m、1m、3m、5m等不同距离,录音语料上覆盖各种智能家居设备的指令、语音交互句子、常用唤醒词,可以最大程度的贴合各类智能家居产品的实际场景。

6麦环形阵列示意图

 

其次,针对儿童用户,数据堂研制了3000小时的儿童语音数据,录音语料覆盖儿童读物、语音助手类交互文本、家居控制命令,可以满足故事机、智能音箱等儿童使用的智能家居产品的场景需求。

 

然后,针对中英夹杂情况,数据堂研制了1000小时的中英混读语音数据,录音语料覆盖日常口语、智能设备交互,涉及音乐、娱乐、出行、生活、体育等十多个领域,可满足智能音箱、智能电视等有中英夹杂情形的智能家居产品的场景需求。

 

以上数据,数据堂和每位采集对象都签署了数据授权协议。

 

结语

 

智能家居行业已经进入快速发展期,语音成为智能家居产品的主要入口,智能家居场景对语音识别技术提出了更高的挑战。在各种类型智能家居产品的背后,数据是幕后功臣。

热点推荐
精选图文
网友爱看
网友热评
阅读排行
  • 第一产经网手机版二维码
  • 第一产经网微信公众号
川公网安备 51172502000113号|网站许可证号: 蜀ICP备15020138号|Copyright 第一产经网(Www.Cnncee.cN) 版权所有