刚刚结束的百度大脑语音能力引擎论坛向外界透露,百度语音能力引擎日均通话量已经突破百亿次。
与中国8.54亿网民规模相比,平均每个人每天要接触百度大脑的语音能力引擎12次。场景涉及输入法语音输入、智能音箱语音对话、百度地图语音导航、与各种机器人有趣互动.无论是覆盖面还是使用频率,都已经超过了99%的互联网服务。
在很多人的印象中,人工智能还是一个遥不可及的新事物。百度大脑告诉我们,人工智能并不遥远,它甚至已经成为中生活中不可或缺的一部分
01年每天100亿次通话背后
如果只看数字的话,100亿并不庞大,也奠定了百度大脑语音应用规模的第一项成果,但比数字本身更有价值的是,百度大脑如何能够实现语音能力引擎日均通话量超过100亿次的规模,这100亿次的语音“唤醒”了什么?
第一个问题的答案是开放。截至目前,百度大脑已经打通了云,终端和核心的全栈全场景语音开通能力,广泛应用于娱乐、金融、政务等行业和场景。开发者只需要一个简单的调用,就可以访问百度大脑对产品的智能语音功能。
根据百度大脑语音能力引擎论坛发布的消息,百度大脑的语音引擎新发布升级了14项主要产品内容,包括基于百度鸿鹄语音芯片的4个硬件模块和开发板。针对智能家居、智能汽车、智能物联网设备等端到端软硬件集成的远场语音交互场景解决方案、语音自训平台,升级呼叫中心语音解决方案,并发布6个线上语音合成精品音库和5个线下语音合成精品音。
简单来说,百度大脑为语音能力引擎的应用打造了生态链,生态链覆盖的场景和能力也在不断拓展。
至于第二个问题的答案,我们先来看三个具体的应用案例。
创维AIOT研究院产品经理李凯,在中谈到创维和百度大脑的合作随着鸿鹄,语音芯片等软硬件的赋能百度, 创维为产品增加了语音交互能力,涉及2500万台电视装机容量。用户只需要一个语音命令就可以找到自己喜欢的电视节目,这使得电视交互直接从遥控器进化到智能语音时代。
北京子杰宝贝科技有限公司将百度大脑的语音能力引擎带到了医疗领域。此前,60%的医护人员每天花45分钟到90分钟填写表格数据。依靠百度大脑的语音识别、自然语言处理等技术,医护人员现在可以通过语音完成表格录入。
在百度大脑智能语音技术、智能OCR识别、智能物体识别等技术的加持下,好行为智能打造了小Q智能盲人眼镜,可以智能识别障碍物、物体、硬币等物体,并通过语音向用户广播,帮助盲人独立认知世界。
诚然,人工智能应用的生态圈背后隐藏着“日均100亿次通话”,为合作伙伴带来了转型机会,为医护人员解决了工作痛点,让盲人感受到了AI的温暖。这些只是百度大脑科技赋能的冰山一角。
02AI追踪中“学霸”
除了智能语音的应用,百度大脑还持续推动语音技术的发展,如百度语音首席架构师贾磊,提出的基于复杂CNN网络的语音增强和语音识别的一体化端到端建模技术。与传统的基于数字信号处理的麦克阵列算法相比,新技术的误码率降低了30%以上,并已集成到新发布的百度鸿鹄芯片中中
作为人工智能赛道上的“大师”,百度大脑不是一个擅长发音技术的偏科学生,而是一个典型的“别人家的孩子”。
在乌镇智库出品的《全球人工智能发展报告》 中中,列出了中国拥有AI专利的前10家公司。凭借935项专利,百度无疑成为了榜单上的顶尖选手,与腾讯,阿里等同阵营选手拉开了不小的差距。
在国际权威研究机构Forrester发布的计算机视觉云公开报告《百度大脑AI视觉技术加持下,百度智能云在中国市场处于“领跑者”领域的顶端,在数据、解决方案、应用场景、管理能力等方面领先于阿里的云、英国的云in 腾讯等厂商。另一家《IDCMarketScape:2019中国AI云服务市场厂商评估》 中,凭借其在能力和市场两个维度的出色表现,百度智能云也位于领导者象限的顶端。
在4月初结束的ICME人脸106关键点检测大赛中,脑压韦、等选手夺冠;在6月的CVpR2019上,百度大脑在视频理解与分析、目标检测、图像超分辨率、智能城市车辆识别、人脸检测等领域获得10项冠军;在11月的ICCV2019上,百度脑视觉团队以57.13%的mAp值获得人脸检测冠军,超过第二名0.47%.
从时间上看,2016年百度大脑对外开放才三年。即使离不开百度长期的技术积累,在如此短的时间内全面开花无疑证明了百度大脑的“学习霸权”。这个增长率与百度的技术基因和工程师文化有关,可能还有另一个原因。
2017年,有人将人工智能赛道中中的中美的角色比作《星球大战》中的卢克和达斯瓦德。甚至对比双方的“战斗力”:美AI公司数量是中国,的1.82倍,流向美的资金份额是中国的1.54倍美AI人才库是中国的2.01倍.美在人工智能领域的强大基础依赖于谷歌、亚马逊, IBM和微软,等先行者,而中国人工智能的重担自然落在了BAT身上。
在某种程度上,“学霸”百度大脑也肩负着弥合中和美AI力量差距的义务从一系列国际大赛的表现和国际权威机构的认证来看,百度大脑也是中国AI领域当之无愧的鹅构建AI全栈技术布局,平等赋能每一位开发者,将是百度大脑现在和未来的使命。
03 百度的大脑在不断地刷新
百度, 王海峰,首席技术官在百度大脑言语能力引擎论坛上谈到进化与赋能:“AI技术的进化与产业赋能正循环、相互促进,AI在中\"的应用场景中不断进化,可以理解这是百度大脑对自身的使命,也让百度大脑不断“刷新”。
我还记得在2016年百度世界大会上,李彦宏用了很长的篇幅来描述这个“新概念”,当时他只记得“百度Brain”这个名字。恐怕很多人都不知道会有什么样的影响。然而,短短三年,百度大脑早已成为生活的一部分中百度输入法的语音输入,住酒店时的刷脸认证,农田里的遥感无人机,工厂里的智能零件分拣.在中,那些看得见、看不见的生产生活场景中,有百度的大脑。
截至目前,百度大脑已经开放了228项AI功能,开发者用户超过150万。这时候,李彦宏对百度大脑的寄托已经逐渐实现。然而,百度的大脑并没有就此停止。在完成AI能力和应用场景融合创新的第一步后,百度大脑在升级5.0时被定义为“软硬件一体化的AI量产平台”,让AI进入工业世界,与工业量产融合。
相应地,语音技术引入了风格转移的语音合成技术,仅用20句话就能产生一个人的专属语音;视觉方面形成适合不同应用场景的技术矩阵,如车辆识别、物体识别、风格转换、交通统计等;在语言和知识方面,构建了世界上最大的多元化、异构化的知识图谱.除了刷新技术能力,百度还将开放计算能力、算法和数据,依托以百度大脑为核心、飞桨为基础的百度智能云,为各行各业的智能化转型升级提供有力支撑。
市场的反映也印证了百度的正确性,以百度Brain Face公众云服务为例,公众云日均通话量超过1亿,开发者超过13万,位居行业第一。而且,百度大脑在人脸识别领域积累了1000多家合作伙伴,落地项目超过10万个,形成了丰富完整的人脸产品矩阵。
同样“刷新”的是百度大脑的人才系统。不久前,著名计算机和大数据理论专家杰弗瑞维特加入了百度研究院的咨询委员会,美, 俄勒冈大学教授窦德景,加入百度研究院,担任大数据实验室主任。从世界一流科学家组成的顶级智库,到百度,庞大的一线工程师,百度大脑正在赋能行业,推动AI进入工业化大生产时代,同时不断让AI技术做到彻底、精细、深度。
“耳目一新”是百度大脑的底色,也是不断修炼内功让AI进入现实世界的态度。
04写在最后
从2016年到2019年,人们对AI的理解不再局限于Go War,但在谈论AI时,核心算法中的瓶颈依然是很多开发者的痛点。百度大脑就像一个勇敢的人,一路扛着挑战前行,在每个关键节点为行业开辟新路。
看完这个,语音能力引擎的100亿日调用注定只是百度大脑的一个小目标,因为“让开发者平等获得AI能力”的道路没有尽头。