智能是什么?
虽然有很多可以找到的答案,但是这几年有着逐渐统一的答案。
想知道明天天气的话,可以直接问家里的智能扬声器。如果你开车的时候想改变导航路线的话,可以直接说是新的目的地。如果觉得空调不凉,可以直接把温度降低到空调上。
智能化的标准可能很广,但语音交互已经是最基本的门槛。
在最后的2021云智技术论坛上,百度智能云团留下了一个集成平台,意思是小众语音。在语音能力逐渐成为“智能”的代名词,升级为IoT产品标准装备的大环境下,百度的智能云有什么企图?
01技术生存者偏差
和机器的“对话”似乎不是新概念。
上世纪80年代,语音识别从实验室出来,可以进行商业应用。虽然机器只能识别单词,但是识别精度也维持在了相当低的水平。但是,不能妨碍人们的经验。IBM的Via-vioce系统、微软的Whisper系统、英国剑桥大学的HTK系统等相继诞生。
2010年是语音识别的转折点,一些学者开始将深度学习技术引入语音识别领域,语音识别的正确性不断刷新记录。
2015年末,百度的语音识别精度首次达到90%,达到了和人类速记相同的会话水平。谷歌于2017年6月发布了语音识别精度达到95%。10个月后可以以百度97%的精度超过。
技术是产业繁荣的催化剂,语音识别商业化是直接的例子。
据华西证券调查报告,AIoT是大众接触消费者最普遍的途径,目前智能语音已应用于智能手机、可安装设备、智能车、智能家居等产品,2020年市场规模241.1亿元预计2023年的市场标准模型将达到570.3亿元。
语音技术的成熟和语音市场的持续繁荣暗示了语音交互用户体验?
事实也许会让人失望。心理学中有生存者偏差的概念。把目光集中在百度这样的技术派身上,语音交互已经迈入了一个新的阶段。但是,在相当比重的智能硬件产品中,闹钟率低、识别率低、无法回答问题等现象依然是常态。像百度这样的耳机播放器虽然更新了记录,但是很多主要的音频控制产品还在伪智能阶段。
02次家里给予的最合适的解答
合理说明这个市场现象并不难。
语音技术一般有两种方法可以在消费水平的商业落地。一是将语音技术的能力打包到SDK或App中,下游的客户或开发者可以直接调用,成本低,但技术能力因人而异。第二,提供固定化的解决方案,即根据客户的需求,进行固定化、深度合作,在一定程度上保障了终端的用户体验。缺点是成本高。
这大概是百度智能手机导入度的平台的原因,与上述两个合作模式不同,度家的语音意义一体化的想法在外部可以看到三重优势。
首先,度家输出软硬一体的解决方案,汇集了百度自主研发的鸿鹄芯片,在性能、兼容性、扩展性上打破了传统方案的制约。
例如,以往芯片的平均耗电量往往会变高,鸿鹄芯片将所提取的声音特征直接用云识别出高精度。保证语音识别的正确性。平均耗电也只有100mw。鸿鹄芯片支持到六路的麦克风阵列语音信号,支持Deeppeak、deepcnn语音调用和Baidu的最新的双声道调制解调器算法,从而满足设备启动后360度死角识别。同时,可以集成各种Android、linux芯片和在线board解决方案。
第二,语音的语义整合补充意思较短的板,如果仅通过语音识别理解意思不够,那么折射到用户体验中的是无需问答的尴尬。
除了在流式多级遮断注意模型、从头到尾建模等语音识别方面的算法优势外,百度智能云的另一个优势在于理解。在以往的开发模式中,开发者为了做出理解语音的命令,需要花时间理解意图、字槽、模板、特征词等。度家平台的方案是语义模型,开发者只需理解设备属性、控制动作、设备状态等,进行简单的配置,设备就可以根据用户的语音命令做出正确的反应。
最后,通过开放源框架和订单开发板的产品矩阵,帮助开发者进一步降低技术着陆时间和成本,加快语音技术的规模化应用。
例如,在硬件方面,度家和乐鑫共同开发的鸿鹄芯片集成的开发模块采用了双麦克风的设计,可以在5米范围内精确地采集到声音。同时,搭载了Deeppeak发动机,从一端到一端的建模技术和切断流道的多层集中型。汉语和英语的混合认识等能力。配合百度官方开放源框架,开发者可以在最短的时间内将智能手机的声音应用于智能房间和智能机器人等产品。
在智能语音市场快速成长、语音控制用户体验稍晚的情况下,度家语音意义一体化方案可以说是目前的最佳解决方案。
03万物都可以语音控制。
不难理解百度智能云度家的野心。
一个解释是智能语音市场的挖掘空间。有人在2019年将AI市场细分,智能语音的市场比例占22%。仅次于实现大规模商业化的机器展望。如果理解包含自然语言在内的市场占有率16%的话,等待语音语义一体化的是不输给机器视觉的蓝海市场。百度智能云有足够的用武之地。
即使是智能房市场,行业也还处于起步阶段。2020年空调的出货量为5100万台,智能声音的搭载率只有15%,小型家电市场2020年的销售额约为7000亿元,智能声音的搭载率不到1%。以达到电视市场70%的智能语音搭载率为基准,智能手机和家庭行业肯定会有机会。
如果只是从市场规模的次元眺望房子的话,也许会低估百度的战略布局。
综合各研究机构的报告,目前智能扬声器在国内的月销售量稳定在300万台左右。累计出货量已经超过了1亿台。根据国内目前的城市化水平,智能手机在城市家庭中的渗透率已经超过20%,与2012年前后智能手机的渗透度相同,显示出语音交互市场教育有着初步的基础。
在百度战略计划中,小度系列产品担任消费者教育角色,小度的多次破棚是最直接的描写。作为百度AIToB的核心通道,百度智能手机自然起到将智能语音输出到B的作用,并且加速了从B和C两个方面的智能语音的市场渗透。
可以证明的是,度家已经为TCL的高端电视提供了声音的启动和识别服务,解决了TCL现有的声音程序的远野启动效果不好、外噪音防止能力弱等疼痛重组了TCL高端电视的语音交互体验,将来TCL会有更多的家电产品配备家庭服务。对于机器人清扫、炉灶集成等作业环境复杂、难以进行语音控制的产品,度家通过端云一体的方案消除了技术着陆的瓶颈。即使是智能粉丝和咖啡制造商等低成本的小型家电,也可以通过鸿鹄芯片的赋课实现控制场景的自由说,不仅是套话。
对于家庭的最新动作,利用端云一体、开放源框架、定制硬件的综合优势,给予开发者充分的自主权,进一步降低智能语音技术的应用与开发的门槛向开发者们以非常低的成本将智能语音移植到新产品中,在不知不觉中去除生存者的偏差。
在人脑每天处理的信息中,声音信息的比例达到了20%。作为人与外界最重要的交流纽带,智能语音被规定为人与机之间相互作用的主流倾向之一。万物可以语音控制,属于智能化时代的鲜明特征。
04写在最后
正确地说,度家只是IoT领域的落子之一。据IDC发布的报告,在中国AI公有云服务市场,百度智能云市场份额连续4年位居中国第一。
2021云智技术论坛正如苏州站出现的那样,端边云全面智能化的天工AIoT平台将AI能力和物联网进行了深入融合。例如,美欣达等合作伙伴通过百度智能云的赋与实现了低碳运营。AIoT视觉智能已经深入工业质量检查、智能制造、城市管理等方面。
带着AI入场的百度智能云将物体网络底部的能量进一步释放出来。