导航菜单

专注机器听觉,“大象声科”获小米和高通创投数千万元融资专注机器听觉

新种子7月10日消息:大象声音获得了小米和高通风险投资公司共同投资的数千万元首轮前期战略融资,智进资本担任财务顾问。这一轮融资将用于增强通信、智能家居、智能汽车、可穿戴设备、安全和其他行业的客户能力。

“象声部”是一家机器听觉人工智能公司,涉及算法、硬件和软件三个方面,为语音增强和语音交互提供解决方案。目前,它已经推出了世界上第一个芯片级单通道人工智能语音增强方案来分离人的声音和噪声,该方案已经在手机行业商业化。

语音互动比汽车、耳机和家庭场景中的视觉互动自然得多。小米首席建筑师崔宝秋曾经说过,“智能语音是新一代人机交互门户的必备条件。人工智能扬声器需要机器学习算法,以使用户能够使用语音控制智能设备。”

大象之声希望成为机器人的“智能耳朵”。它为语音交互和语音增强提供了解决方案。前者侧重于处理内容,而后者侧重于分离人声和噪音。

在传统方法下,过滤噪声只能依靠滤波等手段,效果还有改进的余地。然而,在人工智能时代,机器可以区分什么是人类声音的有意义的内容,什么是应该通过模式分析过滤的噪声。因此,语音增强可以提升到一个新的水平。

至于象音,小米首席建筑师崔宝秋表示:基于多年对计算听觉场景分析的研究和积累,象音技术团队创造性地采用深度学习技术来解决听觉领域著名的“鸡尾酒会问题”,拥有世界领先的核心算法。

高通全球副总裁兼高通风险投资总经理金申表示:大象声音拥有业界领先的语音增强和智能语音交互解决方案,这必将使更多终端设备受益于人工智能技术,加速终端智能生态的发展。

大象声音部门创始人兼首席执行官苗张健表示:大象声音部门自成立以来,就设定了为机器人构建智能耳朵的目标。大象声学一直是机器听觉理论研究的前沿。联合创始人王德亮教授和张学良教授在这一领域积累了20多年的技术。特别是,王教授不仅是机器听觉领域重要理论计算听觉场景分析(CASA)的创始人之一,也是世界上第一位将深度学习应用于语音增强的学术带头人。象声将依托其行业领先的技术优势,整合小米和高通风险投资的战略资源,在通信、智能硬件和安全保护领域,共同为拥有高质量客户的数万户家庭带来高质量、便捷的人工智能服务。

根据新巴德数据库,大象之声在2018年1月由天使之轮资助。语音交互领域的人工智能公司还包括专注于车载领域的斯皮策(轮D),专注于声纹识别的必然赢家(轮B),以及专注于语义和对话技术的图灵机器人(轮B)。

youtube.com