由我爱音频网主办的「2021(春季)亚洲蓝牙耳机展」于2021年3月25日成功举办,此次展会汇聚近百家产业链优质供应商、服务商,以及上千家采购商。
16位行业大咖汇聚本次大会进行演讲分享,共同探讨音频领域的发展状况和未来的发展方向,并且发布了他们的最新研究成果或产品。我爱音频网将陆续为大家整理分享嘉宾们的演讲内容。
演讲嘉宾:
杭州芯声智能科技有限公司
董事长
姜黎
演讲主题:
《AI + 声音,让生活更美好》
杭州芯声智能科技有限公司于2018年在杭州成立,公司团队来自于世界500强企业,或者音频领域知名公司。公司秉承“AI+声音,让生活更美好”的理念,在“AI+声音+芯片”的技术方向上努力耕耘,在可穿戴(耳机,手机,手表),车载(智能语音,降噪),IoT(智能家居)上做产品落地。
此次展会带来演讲分享的是芯声智能董事长姜黎先生,日本东京工业大学工学博士,曾在日本富士通研究所、富士通半导体任职,而后加入上市公司国科微电子任CTO/副总经理及公司董事;曾先后担任国家863项目、国家03重大科技专项课题负责人;参与了直播卫星、AVS/AVS+、NGB、SVAC2.0等国家/行业标准编撰;连续获得“中国芯”“中国半导体行业创新产品与技术” “科技创新市长奖” “湖南省科技进步奖”等创新大奖10余项。
姜黎先生同大家分享了芯声智能在神经网络通话降噪算法、双麦通话降噪算法、唤醒词和多命令词算法等领域的最新研究成果,公司可以根据客户需求提供芯片解决方案或者算法解决方案,目前已经完成恒玄平台算法Porting,带降噪功能和极低功耗的语音唤醒芯片XS2001已量产且备货充分,为客户提供了多种选择。
视频链接:https://v.qq.com/x/page/n3237rpk9lv.html
以下是芯声智能董事长姜黎先生关于《AI + 声音,让生活更美好》演讲PPT的详细内容:
姜黎先生此次演讲的主题是“AI + 声音,让生活更美好"。
首先进行了公司介绍。
杭州芯声智能科技有限公司 于2018年在杭州成立,公司团队来自于世界500强企业,或者音频领域知名公司。公司秉承“AI+声音,让生活更美好”的理念,在“AI+声音+芯片”的技术方向上努力耕耘,在可穿戴(耳机,手机,手表),车载(智能语音,降噪),IoT(智能家居)上做产品落地。
芯声智能产品主要在于音频领域,包括AI+智能语音、AI + 降噪、AI + 主动降噪、AI + 音效处理等。
芯声智能同时也开发了芯片产品用于对AI+智能语音、AI + 降噪、AI + 主动降噪、AI + 音效处理的支持。
在TWS耳机领域,XS200X芯片系列支持多种降噪方案,提供了业界最具竞争力的高性能解决方案。
芯声智能音频实验室。
芯声智能可提供的方案有算法解决方案,包括包括算法Porting,算法调优,目前支持恒玄平台等,具有更好的性价比;芯片解决方案具有更多种类算法,更高性能,更低功耗的特点。
耳机降噪及智能语音算法介绍。
神经网络通话降噪算法。
相较于传统算法神经网络通话降噪算法对于非平稳噪声效果好,计算量可优化。但同时面临包括声音还原性及起伏声、降噪深度及掉字和噪声泛化的问题。
在声音还原性问题上,由于链路复杂性,多次降噪叠加,编解码,采样率降低等问题,声音信号脆弱就容易变形,芯声智能对于采用双目标函数平衡声音还原性和降噪深度;另一方面对于神经网络忽大忽小的起伏声问题,芯声智能采用动态SNR技术,降低了起伏声,增加了高噪声下的可懂性。
关于降噪深度精度产生的噪声无法去除、掉字的问题,主要在于神经网络神经网络如何更好地区分人声和噪声、人声特征和噪声特征的准确度以及频谱精细度上,芯声智能可提供降噪深度和算法复杂度的平衡解决方案,可以根据需求取舍。
神经网络降噪算法还拥有很好的去混响特性,无需单独的去混响模块,神经网络能结合降噪功能和去混响功能在一个网络完成。
神经网络算法降噪场景及泛化方面,如何使一种算法适应不同场景下的降噪需求,强化共性特征,去除个性化特征,芯声智能拥有较多较多技术积累,通过降噪场景分析及相关数据样本分析、强化语音特征的网络结构、SNR组合训练等多方面技术手段提升泛化性能。
神经网络降噪与传统降噪算法性能对比。
双麦通话降噪算法。
双麦通话降噪主要在于方向性收音,收集朝向嘴部的声音,抑制其他方向声音,角度越窄,降噪效果会更好。而在实际耳机设计和佩戴使用,角度太窄对于声音的还原性没有保证。
目前的双麦降噪已经到了自适应双麦降噪,通过自适应算法,提升相关噪声场和混响情况下的降噪性能。
另一方面双麦降噪在声学设计上对于拾音性能(SNR),MIC对称性(频谱、相位)等方面都有着很高的要求,从而保证自适应降噪的优异性。
芯声算法与竞品算法地铁实测对比,高噪声情况下表现更优,还原性和竞品相当。
芯声智能特有的双麦神经网络降噪效果演示。
唤醒词和多命令词算法。
芯声智能与天猫精灵合作的车载语音支架项目,支持打断唤醒,通过了阿里云声学测试。
在耳机方面,芯声智能拥有完整的的语音唤醒词,并且支持客户私人订制。多命令词拥有接听电话、不接电话、播放音乐、继续播放、上下曲切换、加减音量等现成方案,并且也支持客户定制。
耳机降噪及智能语音解决方案。
算法解决方案。
算法解决方案:包括算法Porting,算法调优,更好性价比,拥有单麦神经网络降噪算法、双麦降噪算法、双麦神经网络降噪算法等方案可供选择。目前已经完成恒玄平台算法Porting,占用极低的MIPS算力和SRAM系统空间。其他平台算法的Porting,可以根据用户需求安排。
芯片解决方案。
芯声智能推出了XS2001芯片,为搭载更多算法提供支持。
芯声智能已经与多家芯片、软件平台商完成联调,耳机平台有中科蓝讯、络达、恒玄、泰凌微等芯片原厂。
芯片解决方案:单麦神经网络降噪算法、双麦降噪算法、双麦神经网络降噪算法、唤醒词、多命令词等,可以多种算法叠加使用;对蓝牙芯片的资源消耗极低等;具有更多种类算法,更高性能,更低功耗的特点。
芯声智能典型案例,包括耳机、智能头盔、车载支架、平板、对讲机等众多产品。
以上就是芯声智能董事长姜黎先生演讲的全部内容了,我爱音频网会为大家陆续整理分享其他嘉宾的演讲内容,敬请关注。