首页 > 代码库 > 转:催熟智能音箱,争夺一个人工智能之梦
转:催熟智能音箱,争夺一个人工智能之梦
原文:http://36kr.com/p/5079975.html
深圳的硬件方案商吴桥今年很“牛气”:接到的合作电话络绎不绝,他拒绝掉的人也数不胜数。
感谢智能音箱。吴桥估摸说,自己平均每个月会接到20至30家公司的电话,来自互联网公司或硬件厂商,想跟他在智能音箱设计方案上合作。但他任总经理的海克莱特,在芯片方案商扎堆的深圳属于中等规模,同一时期内能承接的订单在3至4家左右。这意味着绝大多数打电话过来的人,会失望而归。
仅在深圳市南山区方圆一公里的范围内,就聚集了上百家智能音箱方案商,他们从供应链内的各类公司拿到语音模组、芯片,然后迅速拼出一个解决方案。喜马拉雅FM硬件事业部总经理李海波对36氪说,自己迄今已经在市面上看到上百个新生的智能音箱品牌。
从小米、京东这样有硬件生产销售优势的公司,到科大讯飞这样的算法技术公司,到联想、海尔这样的传统硬件制造商、传统音箱厂商……几乎行业内稍有名气者都在做智能音箱。据36氪所知,接下来两个月,包括出门问问、猎豹在内的几家公司都会发布智能音箱新品。
BAT也都在行动。几天前,阿里巴巴宣布将与喜马拉雅FM合作开发智能音箱。腾讯也在推进智能音箱项目。百度起步最早,做了开放平台,试图把和小鱼在家合作推出的视频通话机器人推举成标杆性产品。
一切始于亚马逊Echo音箱两年前在美国的走热。2014年底,亚马逊发布的这款产品,第一代Echo的设计很简单,主要是个音乐播放器。亚马逊之后又往Echo上叠加了叫Uber、订购Pizza、查询天气甚至银行账户等功能,把它拓展成智能家居的控制枢纽。
此后,这成了所有硅谷巨头都在争抢的焦点。上个月,微软、Google先后在开发者大会放出新款智能音箱。同月,亚马逊又推出了带屏幕的“变种音箱”Echo show。到了上周,苹果也出场了,在WWDC大会上发布了音箱Homepod——中国公司们当然也不甘错失风口。
焦燥感正笼罩着这个行业。两家传统大硬件公司今年1月意识到智能音箱是个风口,三四个月后就召开了盛大的发布会,推出了产品。然而一名从业者告诉36氪,发布会上演示的仅仅是个手板,尚不能发声,“目的就是先立一个产品在那,代表自己也做了。但硬件是有自己的逻辑的,从手板到DV板再到最终成品的打磨,通常至少需要八九个月。”
原本,由于PC销量下滑,吴桥原本做平板方案商的同行们生意惨淡,有些公司为了拿订单,不惜先为客户垫付几百万。吴桥眼看着很多同行撑不下去了。但感谢智能音箱,深圳硬件产业的幸存者今年纷纷转到了这个新风口上,现在的吴桥们,又成了被“求着”的人。至少,吴桥觉得,可以赚一笔快钱。
但深圳南山做出来的大部分Demo,是销往海外的。在中国国内,智能音箱这个产品有些尴尬:至今,在中国也没有诞生出一个类似亚马逊“Echo”的爆款。
目前,中国销量最大的智能音箱,是京东和科大讯飞的合资公司灵隆科技所做的“叮咚音箱”。官方对外宣布的销量是累计100万台,据此计算,是Echo的1/10。这个规模差强人意——因为音箱不能只是音箱,它“必须”是个入口,这一切才有意义。
所以,催熟出一个爆款,成了所有人的目标。
摸索、摇摆、起步
魏强和七八个同事,俯身围着Echo站成了一个圈,挨个喊关键词试图唤醒它。然而多数时候Echo无动于衷,除了简单的新闻、天气预报和Amazon会员能试听的几首歌,搭载在音箱上的海外服务几乎全都无法启用。
那是2014年年底,魏强还在京东智能产品中心当总监。
当年11月上市的第一代Echo,已经通过朋友代购或淘宝等渠道,悄然流入中国互联网公司的产品部门。
Echo最早展示了智能音箱的可能性:不仅是智能家居,也是购物和服务的中枢。这让京东感到兴奋。
两三年前,无论是小米为首的手机厂商、海尔这样的家电公司,还是京东这样的渠道,都在言必称智能家居、智能硬件。就像当时所有试图成为中心入口的公司一样,京东曾做过一个“京东微联”app,来操控各种硬件。但用户并不活跃。
“比如你要开灯,直接按下开关就行;但如果通过App控制,你首先要掏出手机,打开APP,再按下开关。”新办法反而比老办法麻烦得多。魏强反思,直到智能音箱这种更自然的交互形态出现,入口这事才算看到眉目了。
很快,把亚马逊做为自己参照系的京东,年底就与科大讯飞开始合作,到了2015年正式注册了合资公司灵隆科技,京东占股45%,科大讯飞占股55%。这是中国探索智能音箱最早的公司之一。魏强后来担任了这家公司的CEO。
同年8月,第一款叮咚正式发售,售价798元。三块功能拼起了它最初的形态:基本的音乐播放器、能简单聊天的助手,以及用语音操控京东微联中400款家居的能力。相当于给京东微联加了张嘴和喇叭。
刘强东对这个项目非常重视。首发时京东商城拨给魏强一个月的3C类战略单品首页位置,还有各种免费资源、秒杀、优惠券。
同样在Echo出现那年,创业公司Rokid,也决定做款入口性质的智能语音机器人。创始人Misa之前是阿里巴巴M工作室领头人,负责深度学习、视觉和自然语言处理研发。现在,36氪跟智能音箱从业者打交道时发现,大家一般都会拿先行者Rokid的产品作为研究样板。
Rokid设计第一代产品时,希望吸引到虽然小众但是高端的用户,力求突出“黑科技”的感觉:实现语音、视觉多种交互模式,同时希望能有类似视频通话、给小孩子看绘本故事等功能。
最终,去年初代产品ALIEN面市时,带有麦克风音箱、投影仪和来自苹果供应商的面板。尽管已经按成本定价,但售价依然高达5280元。
更重要的是,这家公司发现,周全的交互设计,或许反而限制了用户对语音的使用率。
亚马逊Echo最初曾经因为只支持语音交互,饱受诟病。比如,当你想用智能音箱订外卖,通过阅读屏幕文字选定菜品或许只需要花费你几十秒,要等语音把餐厅的整张菜单报完,却需要几分钟。
但事后反观,恰恰因为Echo的这种设计,“迫使”用户大量使用语音来操作音箱,一来为亚马逊积累了大量交互数据,二来也让用户形成使用语音的习惯。
从如今国内的产品来看,用户使用语音的习惯堪忧。“目前(语音交互)也只有电视上能看到明确的消费场景,每天有固定量级的用户通过语音搜电影,进行消费。而且每年的量级达到千万,远超过音箱。”一位行业内人士对36氪说,目前电视端语音的使用比例在20%。
每天,魏强都要看叮咚音箱的活跃度。因为足够活跃才能吸收更多数据,提升语音识别的精准度。而准确率和用户体验,才是让一个全新品类成为爆款的基础。他告诉36氪,目前叮咚语音交互的日活为25%,周活40%,月活70%。
一个共识是,Echo的兴起,其实跟大家最开始对echo的低预期有关。亚马逊最初并没有大推Echo,所以早期用户对Echo的语音识别准确率,以及有用程度期待不高,加上价钱也不贵,结果用了后反而有惊喜,口碑很好。而且,实际上新鲜感过后,把echo扔在一旁的用户也大有人在。
一名业内人士对36氪说,几个月前自己在一场展会上看了一百多款智能音箱,其中语音识别准确度最高的,十句里也只能听懂三四句指令,更不乏全部辨识失败的产品。
一家内容提供商对36氪说,即使是语音识别准确率最好的叮咚音箱,目前点播准确率也只有40-50%。
“高频功能不好用,低频功能不咋用,”上述人士觉得这是现国内智能音箱产品的关键问题:厂商们虽然都在急迫地接入各种内容,却没把音箱内容的体验做好。“比如你要点首歌听,还要在音箱选二级目录,下面再选虾米音乐还是咕咪,再选歌。非常麻烦。”
迄今为止,Echo的销量已经过千万量级。但它的成功,在中国复制起来却挺困难。
“美国人觉得听音乐是生活中的必需品。”喜马拉雅的李海波评价。第一代Echo上市后,首先圈占的就是传统音箱四分之一的市场。让它的销量继续攀升的,是更多诸如听歌、阅读Kindle电子书等内容和服务的接入。苹果Homepod发布时,强调的也是自己的音乐播放能力,只是提了一下能用siri。
小米作为“战略新品”的音箱,主打的就是自己的音乐、音频内容有多么丰富,并没有强调“智能”。“没有内容的电视只是一块显示屏,没有内容的音箱只是扬声器。”小米对36氪评价说。即便如此,相对于美国,中国人对音箱的使用需求天然不足。
在中国,魏强听到过来自京东采销同事的质疑:“他们觉得一款音箱要卖几百万是不可能的。”
出门问问的李志飞觉得,现在整个中国的智能音像市场一年能有100万台的出货量,就挺不错了。今年八九月份,出门问问也即将推出一款智能音箱,他认为对于一家硬件商,如果第一年能卖出10万台,就算成功。
就在上个月,亚马逊新发布的Echo Show,改变了此前的音箱形态,带有一块内置触摸屏。这意味着更全面和完整的交互方式,但更关键的是Echo选择在用户适应了语音交互后,再做这道“加法”的时机。
而且,亚马逊在过去一年已经逐步将 Echo 背后的语音助手 Alexa 做成了一个开放生态,截至去年下半年,Echo整合的第三方服务已经达到950项。
叮咚音箱已经出了6个系列产品。其中一款的主打功能是儿童陪伴。小孩可以跟音箱提要求,给自己读本故事书,或者跟机器人学英语。这反而是能被用得比较频繁的功能和场景。
小鱼在家和百度,在合作开发针对儿童教育场景的音箱。更多小巧便携的音箱,也出现在今年的新品市场上。喜马拉雅即将在下周召开一个发布会,据称,口号是“想听啥都有”,应该是要推出一款音箱,主打的几个场景,一个是陪伴小孩,一个是陪伴老人,“给来段沙家浜”。
吴桥在深圳观察到,很多客户们已经开始在细分场景上添加功能。“有的开始带屏幕、有待放客厅、有的专门为浴室设计,包括房厨房的也有。”
积极的信号是,魏强观察到,智能音箱的销量正以每年超过100%的速度增长,远高于他预估的50%。
赶在苹果Homepod发布的同一周,Rokid发布了自己的第二代产品PEBBLE。相对于初代,拿掉了屏幕和前投影,体积接近先前的二分之一。售价1399元,也有别于初代的高端定价档位。过一阵,这家公司会再发布第三款音箱产品。“快速迭代,就是为了对今年的市场竞争环境提前做些准备。”Rokid感受到了行业竞争的紧迫感。
升级之战:成为intel或者苹果?
相比此前的“入口之争”,如果说智能音箱这波浪潮有什么变化,那就是做出一个产品的门槛明显变高了:从AI语音算法技术、到硬件方案、到内容公司、销售渠道,少了哪个环节,都无法形成完整的体验。
这意味着,行业里需要强有力的整合者。
整合内容,是第一道门槛。
一位方案商对36氪透露,通常咕咪、虾米这类音频内容商会设置一道合作标准:销量10万台;入门费通常40-50万,最低也得30多万;每一台音箱还需要单独交费;如果超过内容商限定的播放次数,厂商也要再补钱。
强势角色之一,是AI技术平台。“变成了智能音箱,背后有算法、有内容、有生态,我们就会开始比传统音箱占优势了。”出门问问李志飞说。
正因如此,吴桥对36氪说,“这不是小的方案商或硬件公司能整合的,现在都是由BAT、讯飞这类平台型公司来谈的了。”
上百家无处获取内容和服务的智能音箱,足以让一批有整合能力的平台赚上一笔。科大讯飞目前的商业策略,是将自己的算法技术、语音模块、合作方案商的设计Demo、后端内容提供商这整条链路,打通做成一个完成的产品,卖给需要的公司。
就像套麦当劳快餐,小公司趋之若鹜。
不过,技术供应商虽然能赚上一笔,也有自己的尴尬。“在硬件方案后面的生态场景、用户体验都还不是很成形的情况下,一个品牌厂商什么都不管,在深圳找一个供应商,把平台的系统放在里面就卖了,是做不好的。”李志飞说。
也有些从业者对36氪表示,科大讯飞虽然牌子硬,但要获取它的一整套方案,需要付出不小金额的代价。这又让一批愿意免费开放的平台,获得了生存余地,甚至是先机。
百度这样的大公司,又进一步拨快了竞争的计时器。
李彦宏在去年9月的一次会议上宣布,百度对开发者和企业开放“百度大脑开放平台”和“百度深度学习平台”。简单来说,百度会输出语音能力、图像能力、自然语言处理能力和用户画像方面的技术和开发工具。更关键的是它采取的模式——免费。
“一旦to B市场上出现一家巨头免费,其他人就没得玩了。”36氪采访的多位创业者,很快意识到这点。对于没有挂靠上任何平台的小公司,这个讯号尤其危险。
更重要的是,免费平台之争会让这场战争加速。就像滚雪球,用户规模越大的平台,获取数据的速度会越来越快。相应的,经由不同数据量级训练的语音品质,音箱语音识别准确率的差距,也会迅速拉大。
一些此前单纯向企业出售算法生存的小公司,已经被迫尝试自己做面向消费者的硬件产品。然而,这些公司接下来还得面对供应链、销售渠道、内容整合的问题。
“很多公司都在跟风音箱,有算法就想自己出硬件产品,从麦克风阵列、处理芯片、降噪算法、声学结构到内容和服务整合全部自己做。结果他们找的方案商就从各处拿语音模块、芯片,只能拼凑出一个粗糙的产品。”一名业内人士说。
更长远来看,就像硅谷一样,这个市场巨头会更有胜算。
BAT这三家生态巨头中,百度的高层频繁出席每一次小鱼在家的发布会,力求把它推成行业标杆,携“百度大脑”的平台能力占据行业制高点。
阿里和腾讯,沉淀了中国最大量级的用户数据,自身生态已经占据了互联网服务和内容行业的顶端。只欠一款音箱,把一切串联起来。
京东攥着与大量品牌商的合作关系,京东微联已经整合了1000个SKU。魏强的设想是,以后所有通过叮咚音箱接入智能家居场景的设备,都统一用京东的账号,最终可以通过电商或其他路径在京东生态变现。
小米的生态链上已经有一连串的高销量产品,它自己的网站和小米之家销售渠道都颇通畅。小米对36氪称,已经推出了人工智能开放平台“水滴计划”。
不过一个平台要立足,需要前端连接上大量爆款产品,而不是一堆僵尸硬件。Amazon后来能够驾驭一个智能音箱入口平台,也是因为自己先做出了Echo这个爆款。所以BAT都在以自营或合作的方式,制造音箱。
一名业内人士判断,两年内,如今上百家从业者会被洗牌至两位数,包括少数几家有强大生态的平台,和能实力作出爆款产品的硬件公司。
今年叮咚音箱的首要任务就是“上量”。
京东商城目前是国内智能硬件品类最大的线上销售渠道之一。618大促期间,京东电商给了叮咚音箱一系列最好的位置,打出大幅价格促销。“现在他们见到我们都头疼,一去就是要资源的。”
本月的上海CES Asia上,灵隆发布了一款仅售399元的小巧音箱叮咚TOP,这款产品的玄机在于,将其连接到家中已有的传统音箱,就可以把后者直接变成智能音箱。这就跟不用换电视、直接买个电视盒子一个策略。
这些都像是Echo趟过的路。此前的几代Echo,亚马逊不断做促销,价格从不到180美金,下探到50美金,甚至产品有的不到39美金。对于美国用户,尝试成本很低。“吃顿饭的成本就能买一台echo尝鲜,门槛很低。”徐超说。
好在,现在的成本已经大幅降低。两年前调试一套方案至少需要半年时间,如今已经缩减至两个月。芯片成本也降低至十年前的五分之一。为智能化多掏20块钱的“体验”成本,已经进入用户可接受的区间内。
Echo还开发出买硬件送软件的销售策略,将硬件销售与亚马逊会员绑定,购买一台设备可以送付费音乐。
根据公开资料,在去年2016年底11月和12月的美国年底促销季中,Echo的销量占到全年的45%。这意味着性价比和促销策略,在Echo销量的增长中起了不小作用。当然,亚马逊通过智能音箱的盈利之路很清晰:Echo可以促进销售。
至少目前,智能音箱在中国的需求还没那么强烈,使用习惯尚待培育。在看上去很美好的商业蓝图实现之前,每家公司都在牟足力气催熟音箱,从看起来尚可,到在消费者中真正引爆之间,还有一段不短的路。
转:催熟智能音箱,争夺一个人工智能之梦