导航菜单

【首发】获数千万元Pre-A轮融资,声加科技要解决复杂场景下的“语音交互”

声学与技术是一家专注于通信声学核心技术的初创公司。致力于为复杂场景下的人机交流和互动提供更清晰、更舒适、更自由的使用体验,最终实现人机完全融合的愿景。

随着智能手机和平板电脑的快速发展,中国智能终端行业已经形成了高度成熟的供应链。在家用电器的声控应用开始攀升,智能扬声器被视为家庭端的流量入口后,真正的无线TWS耳机因其集通话、健身跟踪、语音助手等功能于一体,逐渐成为当前市场上最强的热点。并受益于与手机协同使用的场景,有望成为“物联网”的互动入口。据权威报道,TWS耳机不仅保持了高增长的市场规模,而且由于华为、小米、OPPO等手机制造商的参与,国内市场更加多元化和创新。

盛嘉科技CEO邱凤海表示,经过两个阶段的技术探索和市场启动,以真实无线耳机为代表的智能语音产品给人们带来了更好的互动体验,改变了用户的习惯。智能语音产品主要包括前端语音处理、语音识别、语音合成和自然语言处理。其中,声学前端处理作为该过程的第一步相当于扮演人类“耳朵”的角色。

(声学与技术的核心技术和应用场景)

2018年初,声学与技术以中国科学院声学研究所的人才和科研资源为基础,凭借团队十多年的技术积累,在语音交互的近、中、远三个领域进行了技术研发和市场实践。产品形式包括在复杂场景的“末端”提供领先的语音处理解决方案和技术,以及从芯片、模块、PCBA到工业设计的一站式产品解决方案。

其中,在近场语音交互场景中,声学与技术成功开发了SVE人工智能单麦克风、双麦克风通话降噪方案、FBmic双麦克风通话降噪方案、双麦克风骨传导(VPU)降噪方案、人工智能双麦克风通话降噪方案、耳机多麦克风阵列通话降噪方案、小资源关键词唤醒(KWS)有限语音命令方案等。基于其语音信号模型。

在以智能音箱为代表的远场语音交互场景中,必须面对回声、混响和动态范围的挑战。声学加技术可以实现360度全方位唤醒、回声消除、混响抑制、声源定位、定向拾取、噪声抑制、精确识别和唤醒、动态范围控制等。能够满足复杂场景中5米距离的语音交互需求。其远场拾音器解决方案还可以广泛应用于智能可穿戴产品、笔记本电脑、计算机、智能汽车、智能玩具、机器人等产品。

目前登陆的应用包括OPPO免费ENCO真无线耳机、华为免费赠品TWS普莱森特耳机、荣耀飞荚青年TWS耳机、小米航空系列TWS耳机、小米户外蓝牙扬声器、万模EM001耳机、万模EM004耳机、东京鱼座TWS耳机等。授权终端的总数接近400万。2020年,计划开发功耗更低的2MC麦克风阵列芯片和模块,并将市场扩展到工业、医疗、教育和其他领域。

在过去的几十年里,国内音频消费市场的需求长期两极分化:一个极端是极度狂热,另一个极端是只要声音响亮易懂。然而,2014年11月,亚马逊的回声智能扬声器诞生了。声学和人工智能的结合使得许多高性能声学算法需要分别在终端和云中实现和优化。对高指标的需求使得声学几乎从“隐性学习”变成了“显性学习”。后来,它也引发了包括智能扬声器和真正的无线智能耳机在内的音频产品的流行,声学的应用也如火如荼。尽管各国声称语音识别的正确率高达95%以上,但这些数据都是基于实验的

——