声智科技常乐:语音是下一个搜索流量的入口

changlesoundAI-1024x775

最近,中国的互联网科技巨头们都不约而同地玩起了智能音箱,价格战也愈演愈烈。百度不久前刚刚推出了一款价格亲民的智能音箱小度,以89元的尝鲜价吸引了不少消费者的眼球。与此同时,阿里的智能音箱天猫精灵(售价89元),以及京东的叮咚(售价79元),无不以低价为嘘头,当然这也让智能硬件进入了普通家庭的视野,走上了“大众化”之路。

对于专注于语音交互的声智科技(SoundAI)联合创始人常乐来说,这并不是什么坏事,可以说这正是市场壮大起来的一个好迹象。她认为,如今智能音箱引发的价格战是完全可以理解的,因为现在许多科技公司都意识到一点:语音交互是搜索流量的下一入口。这自然使其成为一块必争之地。

据市场调研机构Canalys数据显示,2018年中国智能音箱出货量预计达440万台,这一数字与同期美国市场3840万台的出货量相比是相形见绌的。据行业预测,中国智能语音产业规模可达到101亿元。随着智能音箱的价格变得更加亲民,这一市场差距有望迅速缩小。而对于声智科技来说,作为百度、阿里、小米等多家知名企业的声控技术提供商,无疑将成为这一热门领域的众多受益者之一。

声智科技创办于2016年,其创始团队成员多来自中科院声学所。这家公司切入语音交互市场的角度与其他公司不同。他们并没有开发自己的语音交互产品,而是专注于向智能音箱或其它声控设备制造商提供麦克风阵列芯片、模组等核心部件及声学解决方案。声智科技在去年10月份的A轮融资中获得了来自百度、洪泰基金、峰瑞资本、港股上市公司蓝港互动的近亿元投资。

请继续阅读下面的访谈问答实录(略有修改编辑)。记得关注“中金投X”公众号,进入公众号界面后点击“人物专访”一栏,可了解更多精英领袖意见。

问:如今中国的许多科技公司,包括BAT(百度、阿里、腾讯)在内,还有人工智能创企,以及像喜马拉雅FM这样的内容提供商,都纷纷推出了自己的智能音箱产品。您认为谁才会成为最终的赢家?

答:大家对智能音箱都有不同的定位。无论是BAT,还是小米科技,这些巨头都有各自的优势。比如,小米本身就是一家硬件公司,同时又有天生的销售渠道,而BAT可以为用户提供巨额的补贴。

但对于这些科技巨头们来说,智能音箱并不关乎一款产品。可以说,它代表了下一个风口,或是下一个搜索流量的入口。在个人计算机时代,企业争夺的是互联网流量。移动互联网时代呢,大家抢着做手机APP。那到了人工智能时代,语音交互产品将成为竞争的一个关注点。比如,这些语音交互设备可以成为在线搜索及电商的流量入口。

问:从冰箱、洗衣机到空调,许多传统的家电都增添了语音识别功能。您认为这些都是必要的吗?

答:传统家电加语音交互的功能是一个必然的趋势,但并不是所有的产品都有必要加。智能音箱的定位是一个小管家或小助手。人们越来越希望它智能,甚至希望它有灵魂。但窗帘、电饭煲这类产品不像管家的角色,人类去跟它们沟通、交互就有些奇怪了。

问:那么,哪些设备最有可能充当语音识别平台?

答:不同的环境设置可能需要不同的主声控设备。比如,智能音箱可以作为卧室的主要设备,而电视机可作为客厅的一个主设备,也许冰箱可作为厨房的一个语音交互设备。

问:您认为语音交互的下一趋势会是什么?

答:声控智能电视机与机顶盒会成为下一个关注点。它代表了从遥控到声控的一个转变。大家对丢掉遥控器都是感兴趣的。而且,由于电视机是带屏的,交互性更好,可以接更多服务,比如语音购物。点外卖想象力特别大。事实上,用户在大屏幕上浏览菜单会比在音箱上听菜单要轻松得多。

问:除了智能家居以外,您还期待语音交互技术应用于哪些行业?

答:联网汽车。这应该是语音交互技术能完美应用的场景之一。因为对于司机来说,双手和双眼都被束缚了。不过语音交互在汽车中的应用还存在一定难度。车一旦行驶起来,会有胎噪,开窗有风噪,而且本身车行驶到一定速度,噪声就很大。但随着技术的进步,语音识别应用于驾驶领域已成为可能。过去汽车内的语音交互只有单个麦克风,所以识别的效果很差。现在我们开发的车载麦克风阵列(由一定数目的声学传感器组成的系统)可以适应更复杂的场景,还能很好地定位声音方向,识别效果会更好。

问:声智科技的竞争优势是什么?

答:我们的核心技术包括智能传感,如声学传感阵列,还有语音处理(回声抵消、噪声抑制、声源定位、混响消除等)。我们拥有先进的远场(距离声源3-5米)语音交互技术,在中国市场中已占到80%的份额。同时我们也是中国智能音箱市场上最大的技术提供商。因此,我们拥有大量的数据来支持机器学习。