trial-label

AI访谈|云知声合伙人陈吉胜详解语音交互在IoT、医疗领域商业落地及前景

来源: 时浩
字数 6,104
阅读需 16分钟
人工智能只有能扛得住学习期,付出足够的学费,才能有爆发式增长。

访谈背景

移动互联网人口红利期正在结束,展望未来十年,人工智能将是数字经济发展的核心推动力。见智团队近期密集拜访在AI垂直应用领域走在前列的知名科技公司,为您带来AI商业应用及资本价值的最新解读。

见智团队访谈的第一站是刚刚完成6亿元C+轮融资的云知声。云知声不仅在人工智能及AI芯片领域技术领先,也在家居、医疗、车载等多个场景构建了先发优势。见智团队与云知声创新事业部总经理陈吉胜先生就人工智能语音交互领域商业应用进行了深入交流。

访谈要点

陈吉胜先生幽默的表示,如果一家互联网公司的CEO是博士,那要好好担心一下这公司能否做起来;同样的,如果一家AI公司的CEO不是博士,那也要问问这家公司到底是不是在做人工智能。移动互联网的底层技术是标准化的,前端本质上是营销型业态,营销路径正确,会很快呈现指数化增长曲线;而人工智能则需要带着技术“上山下乡”,深入到行业里提升效率,和行业交织的过程则是缓慢的。从长远来看,交织越深,壁垒越高,收入越难碰到天花板,这就是目前阶段AI公司估值很高但资本仍在加速涌入的原因。

陈吉胜先生强调,一家人工智能公司的成功,必须要有算力、算法和大数据三项要素的支撑,否则公司无法长远的走下去。在商业应用层面,技术对于客户来说很重要但什么也不是,人工智能公司要保证客户可以直接拿到成品或者半成品,直接帮助用户降低市场成本。

在智能硬件语音应用方面,陈吉胜先生认为手机不会是语音的主战场,IoT战场才是。IoT的特征是总量庞大但呈碎片化,这意味着必须有高效的手段来连接这些市场,否则为一个个单独的项目成立项目组,会发现虽然收入总量大,但大概率仍会入不敷出。云知声通过芯片的开源吸收一大批围绕芯片的方案商,方案商做哪些产品,云知声便踏入了哪些产业,这意味着芯片的性能可以不断迭代提升。所以虽然云知声的人数很少,但是支撑的方向要比其他厂商要多。

陈吉胜先生介绍了云知声在医疗领域的进展。医疗板块云知声是以工具型软件为切入点,医院会提供相应的数据,这就会让设备越用越熟练。当进入医院后,云知声会把技术能力带进来,在帮助医院提升效率的同时通过数据挖掘提升设备本身。尽管时间要求很长,但一旦进入行业后,云知声会生根并同行业一起成长。

在谈到云知声和平安好医生的合作时,陈吉胜先生认为,医院最大的问题是排队五小时,看病五分钟。云知声希望能通过与平安好医生共同成立合资公司的深入合作,有效的解决这一问题,在真正的医生介入以前,把医疗需求事先预诊,以极大提升问诊效率。

*本文为华尔街见闻旗下见智研究所原创调研作品,如果您希望持续获得AI领域的调研进展,可通过微信添加“hellojianzhi”,加入我们的研究圈子*

访谈实录

1.我们观察到移动互联网项目在一级市场的融资变得困难起来,资本在加速涌入人工智能,您是如何看这个趋势的?

这个问题要分为几个维度来看,首先,维度是人工智能为什么这么火?到底什么样的公司才叫人工智能公司?从云之声来讲,我们认为人工智能公司要有三要素:算力、算法和大数据。在此之上,才能有各样的应用,如果没有算力、算法和大数据的支撑,公司无法长远的走下去。

第二个,人工智能和移动互联网差别很大。互联网很大层面是在已有技术和品牌模式上进行创新,但人工智能恰恰相反,它是做生产做供应,如果生产效率提不上去,那么聚拢再多的信息意义也不大。所以人工智能更关注怎么把行业的效率提升上去。从某种意义上讲,人工智能不如互联网那么“性感”,它是一个非常缓慢的改变。想把业务做得好,必须要对各环节做深入的调研,把大家的需求迅速聚拢在一起。因此,人工智能和移动互联网差别很大。

第三,人工智能到底往哪走?现在人工智能公司很多,包括云知声在内的大部分公司都在亏钱,营业额也不大,但公司估值普遍比较高,PS也有点夸张,这个事情国内外都一样。即使是一些机器人的公司,从产品实际效果来看,实话实说也很一般。那么为什么这些公司还会有这么高的估值溢价呢?

从产品端来讲,最先看到产品的往往是C端人群,但产品往往和实际预期差别非常大。尽管计算机的声音识别、图像识别已经超过了人类,但文本处理方面远远不如人类,这就会导致机器无法理解人类的语言。而且术业有专攻,这台机器在出厂的时候可能训练的内容偏向音乐和股票,如果你开始对它谈论政治,机器只有傻眼的份。纵然是一些大公司出品,摆在人家面前的产品也不过如此,但为什么那么多资本还在不断涌入这个行业?

实际上,语音的最大用处不在C端,而在于B端的提升效率。效率的提升并不代表可以赚很多钱,而是可以降低公司运营成本。所以,人工智能目前在ToB方向有很大价值,只是这个价值还不是特别明显,而且很多C端用户并不知道这点。此外,提升效率要和行业有很深的交织,这个过程时间非常长,显得不那么性感。

比如,语音解决了金融行业的问题,但并不意味着它同样可以解决养猪行业的问题,然而投资界已经被移动化联网指数型增长曲线钓的胃口太高了。其实人工智能就像早些年的IT行业,克林顿早前提出了信息高速公路,我们现在叫人工智能公路,大家必须干这个事。智能化会解决人口老龄化问题,因为机器可以低成本无限制的扩张,只要不断地导入数据就可以更新迭代。

现阶段人工智能依然很骨感,但是它的前景很性感。从骨感到性感,需要不断地把血和肉添加进去,这就需要人工智能公司和各个行业共同合作,不过这块现在确实是存在一定难度。但反过来看,如果人工智能公司和实体企业不断进行交织,相关收入是没有天花板的,所以这就是为什么人工智能公司都被认为非常有前景,但是却又只是现在这个样子。

2.云知声的语音技术优势是什么?

首先,云知声的技术是非常全面的。我们拥有自身的超算平台,计算能力在国内比较高,目前已经开始对外输出技术,平安集团的超算平台,包括在厦门市的超算平台都由云知声提供技术支持。当计算能力有了平台,就可以不断收集数据迭代引擎,这会让云知声以极低成本不断更新数据。这就是云知声技术优势第一点。

第二点,云知声在场景化下的算法掌握在国内是首屈一指的。举个例子,云知声当时与另外一家大型公司一对一PK竞争格力智能空调,最终格力选择了云知声,因为格力要求模组误唤醒率低,这意味着公司要对引擎要做到深刻理解,同时对方要求功耗要有一定的限制。这部分我们远好于另一家公司。

工程化能力同样重要。就国内市场来说,往往要求产品价格越低越好,性能越高越好。因此,今年五月云知声推出了新款芯片。云知声最早出货的是模组,这个模组已经做得成本比其他公司低、而且性能更好,但仍不符合市场要求,就像我比朋友跑得快,但是大家都不及格,这没有任何意义。目前新出产的芯片售价只有模组的1/3,这意味着公司的模组可以应用在在高端的空调设备上,而芯片可以卖在2000-3000的空调上,出货数量有望向上猛涨。

实际上,技术对于客户来说很重要但什么也不是。云知声的服务保证客户可以直接拿到成品或者半成品,直接帮助用户降低市场成本。而且,提供解决方案并不会是云知声最终极的商务形态,我们希望通过百万级的出货量和语音平台拥有做运营的基础。

3.云知声在智能开放平台和BAT的AI开放平台有什么显著不同吗?

云知声的定位非常清晰,我们的品牌号召力远远不够,也没有办法做到一站式体验,我们的平台更多的是互利共赢的半开放式平台。我们为客户提供一整套的技术流程,虽然有的客户有自己的内容和服务,但是同BAT合作时,他们缺乏谈判空间。而云知声不同,大家可以认为我们是合伙人性质的平台。另外我们不是平台公司,也不会很轻松的对接客户,双方都有一定投入的前提下,这也保证了回报的效力。

4.智能语音如何连接云端芯的布局?语音交互系统方面,物联网是怎样促进人工智能产业化进程的?

早在12年创立公司时,我们就从云平台的数据中发现了一个问题,即手机上识别语音活跃度远不如非手机的智能硬件。这种情况下,我们认为在智能硬件的方向上,手机不会是语音的主战场,IoT战场才是。IoT市场有一些特点,它总量庞大但呈碎片化,这意味着必须有高效的手段来连接这些市场,否则为一个个单独的项目成立项目组,会发现虽然收入总量大,但大概率仍会入不敷出。

因此云端芯战略应运而生。在这个战略中,首选需要搭建云平台为智能设备提供服务,而后需要进入每一个终端。最开始我们采用模组尽可能把不同的终端标准化,但是模组价格还是比较贵,因而随着战略的发展,我们开发了芯片。拥有芯片并不意味着人人都会用,但通过芯片的开源可以吸收一大批围绕芯片的方案商。方案商做哪些产品,云知声便踏入了哪些产业,这意味着芯片的性能可以不断迭代提升。所以虽然云知声的人数很少,但是支撑的方向要比其他厂商要多。如果说人工智能厂商自身都不能提高效率,那如何让其他公司信服?

5.公司已打造了一套类似于亚马逊Echo的中控系统Pandora,但是仅靠一个中控离特定场景的万物互联还有一段距离。因此,公司将在Pandora的基础上在作出哪些动作实现互联?

单一系统要想实现万物互联肯定是不够的,如DuerOs,目前的推广并不算特别顺利,其主要原因是系统传导到终端用户手中的是设备,要把终端和云端相结合,然而现在的技术差距相当大而且难以跨越。我们有类似于DuerOS的Pandora系统,与此同时我们还有整套开源的芯片,我们认为任何云端的东西想要落地,真真正正扎入行业,这根针要么是项目团队,要么就是芯片。我们在这一块我们有自己的系统,也有相应的芯片,还有技术团队,这相当于合作方的培训师,这是我们认为落地的关键。另外我们会做一些标杆类的产品,我们会用芯片做一个音箱类的产品给大家,还会做一个带屏幕的设备,叫潘多拉1,这款产品已经做出来了,只是我们认为目前还没有同百度等在市场上竞争的资本,所以选择进入酒店行业。

6.公司一直强调商业化落地是重中之重,目前云知声正在开发的智能系列产品都有什么?我们的市场认可度怎么样?

云知声分为两部分,一部分是IoT事业部,另一个是创新事业部。IoT事业部最先在做的是智能家居,这一部分已经拥有了属于自己的芯片。今年八月公司会把芯片上所有交互的代码开源,这意味着我们集聚一大批方案商,如果成功的话在智能硬件市场上云知声会有相当大的份额。

与此同时我们还在做儿童故事陪伴机,从硬件、软件到平台的出货量也相当大。虽然这部分市场看起来并不高端,但市场出货份额Top3(扫地机、音箱、儿童陪伴机器人)之一就有儿童陪伴机器人。其实,目前AI的语音识别技术已经超过了人类,但自然语言理解还不够成熟。与其强行打入成年人市场,不如先接入儿童市场,自16下半年开始,云知声便在这个领域布局。

IoT的另一个部分是医疗,医疗板块云知声是以工具型软件为切入点,目前在做病例录入。可以发现,当用其他软件做医疗录入时,很多专有名词是错误的。而云知声不同,医院会提供相应的数据,这就会让设备越用越熟练。当进入医院后,我们会把技术能力带进来,在帮助医院提升效率的同时通过数据挖掘提升设备本身。尽管时间要求很长,但一旦进入行业后,云知声会生根并同行业一起成长。

病例录入方面,云知声目前有400余家三甲医院处于测试阶段,真正落地的公司有100家;病例质控项目今年开始实施,目前有4家合作医院;控费和急诊部分则是同申康合作。医院最大的问题是排队五小时,看病五分钟,急诊这块主要是解决这部分问题。

创新事业部主要是找到市场足够大的行业,如车载。车载是公司在芯片领域的重要布局,与家居不同,车载出货量稳定,一旦进入行业就意味着拥有一块自留地。云知声主要集中在后端市场,这部分我们持开放态度,谁来都可以做。而在前端市场,定位很重要,我们认为中国未来会浓缩成几家大型汽车厂商,因此我们需要提前去卡位布局,提供车载级AI系统。云知声通过提供芯片,可以降低成本、提高效率,这也是合作商认可的地方。下月,云知声会宣布和国内某顶级车厂成立合资公司。

7.公司为什么与平安好医生合作,进军医疗领域?智能医疗的应用场景主要有什么?

两年前公司第一次与平安好医生合作进行语音录入,随着合作的深入,平安好医生希望和云知声进行医疗硬件合作开发。由于过程中双方互相要达到一定的信任,最终我们决定建立合资公司澔医智能——这也是双方的互相补充,平安好医生有硬件、内容和渠道,我们有技术、经验和芯片。合资公司由平安好医生控股,平安7成,云知声3成。

在平安好医生的app上,云知声的语音、声纹的识别都在广泛使用。对于自然语言处理,由于数据属于核心机密,云知声只负责提供相应的咨询。我们正在开发智能硬件产品,具体暂时不方便对外披露。

在智能医疗方面,我个人认为可以分为ToB和ToC两类。ToB比如说智能药柜和其他一些投放的硬件,这些产品需要用户去查询,去直接下单,这部分需要与用户交互的语音作为支撑。ToC端我们希望进入到家庭,给终端用户使用,在让用户查询的同时还可以做一些其他的简单操作。平安好医生希望在排队五小时,沟通五分钟的看病模式中,这五分钟最好可以变成私人医生问诊,它可以是APP,也可以是智能硬件,这一点也是我们对澔医智能的要求。

8.由于C端和B端的不同,智能医生要想达到在家庭中的应用,我们的技术侧重点是不是也要有一些不同?应该注重哪些方面?

首先,市场对于家庭医生要有正确的期望。现阶段来说,智能音箱尚且不能满足所有用户的需求,在更为深奥的医疗领域,我们要有期望的把控。第二,平安好医生希望在真正的医生介入以前,把问题事先预诊,最好可以得出诊断建议。作为拥有2亿用户的平安好医生,公司对他们能否做到信心很足。举例来说,声纹上线不到两周就有30万用户数据,云知声成立这么久,也没有这么多数据。回归到本质,就是提升效率,最好是通过机器人在预分诊阶段解决病人简单问题,这也是目前平安好医生最大的价值点。

9.我们何时能从简单的语音录入达到比较高端的如预分诊、诊断建议等阶段?

病例质检方面主要由云知声来做,病例质控南京的试验起步早,明年三月份应该可以达到,上海十院项目第一期应该在今年年底完成。NLU技术入门比较容易,但由于缺数据,而且业务能力和技术相结合处于尴尬的位置,自然语言处理的成功需要选好行业并坚定投入下去,云知声在医疗方面的投入相当大,而且入场更早,有更多的数据,随着时间的推移行业壁垒会越来越高。

10.预诊的本质和音箱关联并不大,它是一套系统,这是否意味着如果将系统授权给其他生产商,他们同样可以使用这项功能?

这是好医生需要考虑的问题。因为他有这一套系统,只需要授权给愿意使用的人,大家都连接到它的云平台,对于他们是最开心的事。授权方面的问题就像是医疗领域的DuerOs,这完全取决于好医生。交互产生的数据目前都在好医生平台。

11. C端用户往往没有B端用户了解产品性能。我们有没有什么办法打开市场,培养用户认可度?

对于云知声而言,目前还达不到这个要求。平安好医生方面,是从B端到C端还是直接进入C端市场,他们还在作抉择。不过对于直接进入C端市场而言,我认为对平安好医生是一个挑战。

12.智能医疗在家庭中的收入模式是什么样的?

具体收入模式并不确定,不过从个人角度来说,我认为平安好医生希望在手机之外造就另一块屏幕和设备以占据用户时间和注意力从而扩展手机APP的收入来源。此外,由于载体并非手机,在社区、医院等可能会有一些特殊的需求,这些方面好医生可以做相应的运营。当然,O2O可能也是他们会选择的方式。

13.目前的语音市场仍处于发展阶段,还未形成规模化、产业化,公司与医疗相关的智能语音产品何时能实现大规模落地生产?

医疗和其他行业有所不同,首先需要牌照。实话实说互联网问诊这个问题不是哪家公司都可以做的,这部分主要由平安好医生负责。云知声负责确保这套系统能正常运作,目前在智能硬件和相应的APP都已经上线。不过公司希望在成本、性能、用户体验均达到最佳状态后再进入终端用户平台,这一块我们还没有完成。第一是因为希望继续优化产品,二是好医生也希望找到最有价值的方向,虽然进入家庭终端是一个方向,是不是有更便捷的方向还在讨论当中。

14.我们对于医药板块的收益有没有什么预期?

公司去年营收不到一亿,其中半数以上是智能家居,三成左右是医疗,公司内部计算过,如果成功进入医疗行业并与行业共同成长,我们期望三年内收入可以达到一个亿。这个并不是太难,第一是政府有保障,第二是用户有需求,只要能扛得住行业的学习期,有足够的学费,以后会有爆发式的增长。公司目前正和申康合作,如果这个系统研发成功,覆盖申康下属30家医院是毫无疑问的。以申康为标杆,做进一步推广,做大的话我们的病例录入软件等可以直接提供服务,一年下来八位数的收入很轻松。云知声相当看好医疗行业,而且是坚定的看好。

阅读全文
参与评论
收藏
qrcode
写评论

icon-emoji表情
图片