当今社会,鸡尾酒会已经成了人们很常见的社交活动,但这个看似简单的活动却成为了国内外声学领域专家学者的难题——鸡尾酒会问题。当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数为两人或者多人时,语音识别率就会极大的降低,这一难题被称为鸡尾酒会问题。
在多人同时说话的场景下追踪并识别某一个特定说话人的语音,在自动语音识别技术大规模推广应用中,鸡尾酒会问题是亟待解决的关键问题之一。各大声学、AI公司纷纷推出解决方案希望能解决这个难题。
大洋彼岸的学霸团队GMEMS(通用微科技)就是这样一家公司,它采取了软硬件结合的方式,提出了领先的端测语音交互解决方案,开创性地解决了在高噪声环境下,语音信号的完整摄取问题,也就是之前提到的鸡尾酒会问题。
CEO王云龙博士告诉:“之所以能解决这一问题得益于通用微强大的研发实力。”了解到,通用微在硬件、软件和算法三大方面均有极强的实力。”
在硬件方面,通用微科技可以做到集IC、MEMS设计以及封装于一体,拥有自主研发MEMS硅麦克风芯片,产品已经经过数次更新换代。目前供货的主力产品为信噪比66dB的GMEMS2.0芯片。全球领先的信噪比为70dB、动态范围达到135dB以上的GMEMS2.5芯片也即将在2019年下半年进入量产。
GMEMS更是计划推出采用颠覆式四振膜新架构的GMEMS3.0,信噪比同平台实测可以达到76dB 到 80dB。王云龙表示:“GMEMS3.0将超越楼氏、歌尔声学、意法半导体等大公司的同类产品,达到行业领先的水平。”
在软件方面,通用微科技拥有语音处理、自适应波束形成、声纹识别三大核心技术,通过自适应机器学习声谱分析能有效分离用户声音源、干扰、背景噪声、回声,且无需调试因动态噪声、回声、非稳态信号源带来的问题。软件的声学设计容错率和信号非稳态容忍度都很高。通过声纹库的训练,软件能有效识别用户的声音,能有效的解决鸡尾酒会问题和鲁棒性问题。
此外,在算法方面,通用微采用全球领先的深度学习算法可以轻松解决端测的语音交互功能,将实现包括微型传感阵列、唤醒功能、降噪、消除回声、语音增强等功能。同时算法还有唤醒率高、所需唤醒词数据量小、唤醒准确率高的优势,相比于市面上的同类算法更优秀。
通用微拥有强大的技术实力源于背后强大的技术团队。CEO王云龙博士介绍,目前公司有150多人,核心研发团队位于美国。公司研发大约有近40人。公司首席科学家李细林来自清华、CTO吴广华来自伯克利加州大学、VP卢延祯来自英国谢菲尔德大学。加上自己,公司四位核心创办人均是博士,从而保证了公司技术的持续领先。
深耕行业,打造语音交互全产业链除了核心人员的“学霸”背景外,GMEMS能取得领先地位,与创始人王云龙的经历也密不可分。王云龙博士告诉,他是一名连续创业者。早在2003年国内各产业都相对落后的时候,王云龙博士就开始在基于MEMS的声学微型传感器方面进行研发,所研发的产品最终被各大品牌笔记本电脑(如联想、戴尔等)和手机(如小米、联想、魅族、索尼等)使用,王云龙博士并没有因为自己的成绩而止步不前,他重新以一个创业者的身份继续在这个行业摸索,积累了大量的经验。
作为行业资深者的他,没有选择和大多数声学前端器件厂商一样,只从事产业链的某一环节的生产。王云龙带领的通用微从算法切入,涉足芯片、传感器、麦克风阵列等环节,采用全产业链生产的商业模式,提供了一整套智能语音入口的声学硬件解决方案。
被问到采用这样的模式会不会加大研发难度的问题,王云龙笑着说,之所以选择这样的商业模式,主要还因为半导体行业上游公司被国外垄断,往往议价权较弱,越往产业上游公司能分到的利润就越少。在声学前端器件产业上游,从晶圆厂商及芯片厂商,到MEMS麦克风厂商及IC厂商,再到麦克风阵列厂商,所能获得的收入及利润往往是递增的。
除此之外因为MEMS麦克风整体市场较小,仅有10亿美元左右,作为关键环节的MEMS麦克风,现阶段即使每年有几十亿颗的销量,利润也不是很可观。向MEMS麦克风传感器的下游环节切入,很可能是通用微的必选之路。这种发展路径在音频器件领域也已被许多大公司证明。
王云龙博士也提到,声音降噪及MEMS麦克风行业是一个比较难的行业,第一他不像其他行业那样容易产生利润,即使产生利润也相对较少。第二技术难度巨大,有非常多的“坑”。
“我就是在这些大坑中摸爬滚打过来的,就是在不断的填坑。”王云龙博士笑着说道。
虽然行业很难,但是王博士凭借着自身多年的经验与坚持,通用微还是取得了不错的成绩。日前通用微科技帮助位于美国的世界最大的家电芯片供应商推出全球第一个基于微控制器(MCU)的语音控制解决方案。据了解,该解决方案在2019年2月25日前已经通过了亚马逊的Alexa语音服务(AVS)认证, 使原始设备制造商(OEM)能够快速、轻松、廉价地为其产品添加语音交互功能,为终端客户便捷使用Alexa丰富的语音体验。
根据通用微科技与该家电芯片厂商签订的战略合作协议,通用微科技为该解决方案独家提供了整个声学前端,包括噪声抑制、回声消除、波束形成和打断唤醒等声学前端功能。另外,根据客户的需求,通用微科技也可以提供通过AVS认证的Alexa唤醒词或定制其他的唤醒词。
图:采用通用微语音交互解决方案的亚马逊的Alexa
5G来临,抢占智能家居入口在自身取的巨大成功的同时,作为连续创业者的王云龙博士也有些经验想分享给后来的创业者。王云龙博士说道:“我十分赞同农村包围城市这项决策,运用到企业上也是这样。初创公司和品牌合作的时候,先不要总想着和大品牌合作,可以先从小企业合作起,这样可以让产品有个落地验证的过程。硅麦也是如此,比如和华为、OPPO这些公司合作,不是说性价比最高他们就买了,而是说如果你的东西出了质量问题能不能妥善处理减少损失。比如你买了一个智能冰箱,智能冰箱语音交互只是一部分的功能,即使语音交互坏了冰箱本身的功能还在,所以产品的安全性十分重要,要先保证产品的质量。”
随着目前科技的飞速发展,5G的到来也近在眼前,智能家居是5G落地的一个重要场景,据前瞻产业研究院数据显示,2016年,我国智能家居市场规模达605.7亿元,同比增长率50.15%。预计未来几年内智能家居将迎来爆发,到2018年,智能家居市场规模将达1396亿元。在2020年前,中国有望成为亚洲最大的智能家居市场。如此大的市场对各个行业的重要性不言而喻。
语音输入作为智能家居的重要入口也一直被智能音箱行业内各个玩家所争夺,例如百度的小度、阿里的天猫精灵、小米的小爱同学等等。对此在美国生活多年的王云龙博士却认为中国和美国国情不同。“中国人的生活情况与居住习惯和美国不同。”王云龙说,中国人很少有美国人非工作时间之外的生活文化,中国版的Echo很可能不是智能音箱,而更可能是耳机。据了解,目前通用微已和一些著名品牌耳机厂商建立合作,为他们提供完整的声音解决方案。王云龙希望在即将到来的5G时代,国内的端侧语音交互技术能取得进一步的成功。
AI如何持续渗透平安城市?安防企业为何纷纷“进军”商业?智慧交通除了“大脑”还该关注什么?如何抓准家庭社区安全零散的市场?
2019年5月23/24日,将举办GIIS2019中国智慧城市峰会,本次峰会将延续前两次会的主题,邀请知名专家学者、行业龙头企业、标杆初创企业、知名投资人等,聚焦技术在智慧城市领域(平安城市、智能商业、智慧交通、家庭社区安全)的应用现状及未来发展。
活动链接:
https://zhineng.aiisen.com/post/ad/id/795
版权声明
本文来源,经授权发布,版权归原作者所有。转载或内容合作请点击转载说明,违规转载法律必究。