2016-10-11 16:51
来源:湖北热线
多么美好的未来。但它离实现还有多远?创业家&i黑马人工智能系列,本篇将带你认识,智能生活的语音交互新入口。
在物联网和人工智能时代,产品的智能化已经成为趋势。从电子产品、家电到家居用品,智能的概念在前两年大行其道。智能家居和可穿戴的风口从2014年开始井喷,但这种势头在2015年下半年,却开始放缓。
于是,我们能对比到,现在大多数人的智能家居和硬件产品,还离我们想象中的“智能”非常遥远。
只在硬件上加上一个WiFi、传感器和APP,这并不是我们期待的“智能化”的未来。
最像“智能”的产品,或许是亚马逊的Echo。它整合了Alexa语音识别技术,让消费者用声音上网、检索信息、控制家居生活,已经拥有300万台的销量,让谷歌都为之眼馋。它体现的价值,也集中在搜索、伺服式语音识别和人工智能之上。
一个新的交互形态,在智能家居和硬件之上正亟需提高。当我们使用上述的智能化场景时,无论是可穿戴设备,还是家居、家电,如果仍然靠PC或智能手机的界面来操作,这可能是很难想象的。
不依托于这些手动装置,就能实现对它们的操控,无疑是这些设备最吸引人的便捷性所在。语音交互,也成为智能化过程中日益普遍的一项功能。
“交互的形态正在改变。”云知声CEO黄伟说。“移动互联网和PC互联网时代最大的区别是,我们现在是基于多点触控的应用,用手机上网,用移动设备上网,而不是仅仅用PC,通过键盘。
而到了IoT时代,我们又不再只是通过手机,我们可以通过更多的设备联网,而它可能不再有触摸屏。”
从家居到家电,从物流到驾驶,从医疗到娱乐,一个智能的趋势正席卷而来。从Siri、小冰,到Echo,到搜狗的语音输入,再到度秘。也许人工智能的发展进程我们还不能预判,但商业和生活的智能化,却已经是一个不可逆转的过程。而其中,语音交互,或许会是一个新的智能时代的新入口。
创业家&i黑马在云知声的体验间里,体验了乐视超级电视X55和华帝抽油烟机,如何在家庭场景噪声下唤醒和操控。通过语音的控制,窗帘可以自动开启,灯光可以调节。创业4年,累计融资过亿美元之后,云知声,也许在物联网和人工智能兴起的浪潮中,也将面对一个更大的发展时机。
*云知声CEO黄伟(受访者供图)
物联网智能硬件要和服务打通
2008年,科大讯飞(002230,股吧)上市,一度垄断国内语音识别市场的半壁江山。深度学习的发展,给了语音识别新的驱动力,但在2012年,云知声初成立之时,在这片江湖中,玩家还是寥寥无几。如何实现弯道超车?当时云知声,决心从开发者平台做起。
在当年,许多公司的创业方向都还是语音助手APP。“但我并不认为这个方向能够成功,尤其说它根本不适合一个创业公司去做,做这个会比较难。”黄伟说。
黄伟的判断来源于自己多年来的从业经验。作为语音识别的领军人物之一,他先后就职于摩托罗拉和盛大创新院,曾成立盛大创新院语音分院,在2012年,黄伟离开盛大。“我自己做过很多年的技术,我非常清楚,语音其实是技术,并不是产品。
它是用来解决人跟设备的交互问题的,但交互本身不是目的,人们是要通过一种最便捷的方式来获得后面的服务。就像手机的多点触控,你离不开屏幕,但你觉得只有这块屏幕好玩吗?当然不是,吸引你的,是它背后的各种互联网服务。”Echo之所以成功,不仅是它的语音交互,还是由于,它可以和亚马逊电商打通,可以直接提供服务。
但是,对于创业公司而言,它也往往只限于提供这种交互方式本身,是很难具备连接交互后面服务的能力的。“当时选择做平台,是因为这样至少我们是有技术价值的。”黄伟总结。2012年9月,云知声语音平台发布,当时的精确度只有85%。
但是,语音平台也为云知声源源不断积累了语音数据。2013年初,准确度提高到了91%;而到了2013年底,云知声的语音数据已经积累到3000小时,精确度提高到95%,平台上开发者超过8000家。
从那时起,数据+算法就成为云知声“双门驱动”的引擎。从一开始,云知声就和深度学习结合在一起。当时的深度学习还主要是停留在学术界,很多人对此了解并不多,而深度学习,也需要超过以往不同数量级的数据支撑。但在2011年,在一个语音识别的国际会议上,黄伟遇到了微软首席研究员俞栋,对方告诉黄伟,这是“确确实实进展非常快、能够取得非常大的成就”的。
这坚定了云知声做深度学习的决心。当时公司刚刚拿了天使轮,钱还不多,就在淘宝上买显卡、买机器,在9月平台发布后,10月份就投入了对深度学习算法的学习。2013年1月,云知声深度学习系统对外开放。搜狗云助手、乐视电视,都成为这个系统的首批服务对象。
而2012年和搜狗的合作,则是让云知声一战成名。
“当时国内大的公司,百度、搜狗,都想发布自己的语音助手产品,想抢2012年底前这个时间点。搜狗自己没有语音能力,就去找合作。”黄伟说。语音识别当年的圈子本来就不大,云知声就进入了搜狗的视线。“他们肯定也评估了很多家,但我记得很清楚, 我们跟搜狗从第一次见面到最后达成合作协议,一周时间。”黄伟言及于此,颇有些得意。
从2012年中到2013年底,云知声没有做过多的商业化的尝试。在这段时间内,云知声通过算法和平台的搭建,逐渐打通了自己数据驱动的路。而到了2014年,黄伟觉得,公司到了一个新的阶段,是时候开始仔细思考公司的定位问题了。
黄伟把当时市场上的主流公司做了分类。科大讯飞和BAT作为先发者,占据了市场和资源的优势,但是,它们都是从PC互联网时代迁移过来的,那么,新的时代转折,是否可以给云知声提供机会?“在IoT领域,它们也没有积累,或者说足够的壁垒,那么我们就在IoT切入。”
这个新的机会就像黄伟在开始所说的,IoT时代改变了交互的形态。同时,这些新的设备和人是有距离的,那么,在交互时就必须加入新的能力,而芯片就是解决它的方法。因此,2014年,云知声提出了“云端芯”,要把自己的能力从云端扩展到终端、再到芯片端。