融资数百万,他把语音交互技术“下嫁”玩具厂商,20项专利打造能分辨声音的机器人!

张李团队的语音交互系统应用在玩具上,玩具便可以唱歌,会聊天,还能分辨不同人的声音。


【创客记】NO.116

文 | 创客公社 施润

 

一双普通拖鞋、一条浅色中裤、一件简单白T恤,“童伴机器人”项目联合创始人张李显然没有接待媒体的“经验”,是个典型的理工男。

 

做语音交互的项目为什么叫“童伴机器人”?

 

‘童伴’表示我们针对儿童娱乐、教育市场,‘机器人’是因为我们主要以智能机器人为切入点,来实现产品的落地。”

 

语音市场隔几年就会热一次,每次都像风口来了,但即使到现在,语音技术在用户的实际应用中还不是很常见。

 

本着“把语音技术融入人们生活里”的想法,张李团队找到了一条与众不同的路线:与娱乐机器人、玩具厂商合作,把智能高端的语音带到用户的生活里。

 

2015年11月,童伴机器人项目获得数百万人民币的天使轮融资。天使投资来自一家做动画、IP玩具、做硬件(芯片、存储)的产业资本。

 

张李透露,该项目Pre-A轮融资已在进行中,预计将在一个月内完成。

没火起来的语音技术


据了解,目前国内的语音技术厂商基本分为三类:第一类科大讯飞、捷通华声等有相关科研机构背景的语音技术企业;第二类是互联网厂商,包括百度、腾讯、搜狗等,通过自主建设团队或者收购,掌握智能语音技术,推广语音服务;第三类是创业企业,如云知声、思必驰等,它们专注于某些行业领域,比如汽车、家电,来推广自己的语音技术和产品。

 

此外,国外的谷歌、微软、IBM、收购了Nuance的苹果虽然凭借强大的技术积累几乎垄断了市场,但无论是siri、还是小娜都经常会因为识别不准确而受到用户吐槽,语音技术还没有实现真正的智能化。

 

张李认为,用户对语音技术的使用率不高,除去技术方面的原因,“就是因为这个东西听起来太高大上了”,很多此类科技公司在开发产品的过程中依据的是一些累赘的需求,抓不到用户的痛点,有些痒点都算不上的;甚至有些科技公司就是2VC的模式,技术做得很牛,但更多的是自嗨,没找到商业化的道路。

 

但张李也相信,语音技术会是未来的热门,市场前景也很广阔。然而,现在有实力的语音技术企业都致力于将技术做到最牛,虽然垄断了市场,但目前的语音还是一个很小的市场,要真正把市场做起来,必须要考虑将“阳春白雪”的语音技术做到用户的生活场景里去,让更多人体会到科技的便利、有趣。

 

瞄准娱乐、教育市场


“我们一直在思考如何把语音技术做得很有趣,很普及。”张李说,“后来一款叫菲比精灵的玩具引起了我们的注意。”

 

菲比精灵(Furby),是拥有变形金刚、培乐多等知名娱乐玩具品牌的美国孩之宝公司的旗下力作。菲比会说话,能根据你的抚摸、话语做出相应的反应,甚至当你长时间不理它,它还会变得“脾气暴躁、易怒”。

 

“菲比在全球热销,主要因为它有了与人互动的能力,成了一个智能、‘有情绪’、‘会思考’的宠物。而这些功能的实现,最关键的技术就是语音交互技术,这正是我们擅长的。最重要的是,国内几乎没有同类产品。”



畅销全球的菲比精灵系列玩具


其实创业之前,张一直在语音技术领域耕耘超过8年时间,最早做过语音评测、语音分析,后来又做了声控智能家居产品、智能车载后视镜……这些工作经历让张完成了大量语音识别、语义理解方面的技术积累。


团队其他小伙伴在语音交互、人工智能等方面的技术积累,给了张很大的信心,“我们在语音技术这方面不亚于国内任何一家公司,但在公司业务范围,体量上不如一些大企业”。

 

“跟大家交流了创业想法后,他们都很支持我!”于是,张李和小伙伴们将目标定在了娱乐、教育市场,以智能机器人和玩具为切入点正式开始了创业。


2013年底,张李和几个联合创始人先出来,把关键技术自主研发、自主知识产权;2014年注册成立“奇梦者网络科技公司”,14个兄弟的团队也组建完成。“大家都是抱着把语音技术做得更有趣、更便利的心态,一起出来创业的”。

 

张李和小伙伴们搬了新办公室庆祝(右起第四为张李)


奇梦者也成为国内最早一批将语音交互技术与玩具结合起来的科技公司。

 

帮助玩具厂商,让产品“活”起来


张李表示,语音交互技术给传统的机器人、玩具带来了很多革新。


一、改变了原来的遥控器单调、复杂的操作模式。二、增加了互动功能。原来这些玩具产品出厂了之后它能做的动作就固定了,没有变化的空间。我们可以使机器人能够与你聊天、帮你进行数学计算,在联网的情况下,可以帮你查询天气,地理知识、人物百科、唐诗……

 

采访中,张李给记者演示了一个语音交互的DEMO。这套由“奇梦者”自主开发的语音交互系统能实现语音识别、语义理解、声音输出反馈,联网状态下还能实现在线知识库的搜索与匹配。


对应在硬件层面,就是集成了声音接收设备、声音处理器、输出扬声器、网络信号处理器等。功能上类似于大家熟知的苹果siri,微软小娜等。

 

此外,张李团队正在开发自主知识产权的麦克风阵列,已处于最后的调试阶段。麦克风阵列的主要作用有两方面:


一、麦克风阵列搭配语音增强的算法,可以提升语音交互有效识别范围。原来基本上1米以内都不太能听清,通过麦克风阵列,可以将范围拓展到5到8米。


 

环形麦克风阵列


二、让机器从复杂的声音中分辨出你的指令。当机器正在说话的同时,如果你发出指令,此时机器会接受到来自你和机器的声音,就无法识别出你的指令,麦克风阵列通过人声分离的技术,使得机器发声、或者是周围有环境嘈杂音的时候,机器还能听到你的话,识别出来。


未来,“奇梦者”还将研发软硬件一体化的解决方案,“让他们拿去就能用”。从而覆盖更多不具备相应硬件基础的玩具厂商;并持续丰富知识库,让机器人“无所不知、无所不晓”。

 

目前“奇梦者”拥有超过20项语音交互方面的专利,已合作的玩具厂商达到20家,年底预计达到40家,现金流良好。收费模式方面是2B的“技术开发匹配服务费+产品销售分成”。

 

语音交互技术作为未来智能硬件的一个入口,前景不言而喻。但总体的普及情况还不理想,智能硬件的成本降下来之前,把前端的语音交互技术“下嫁”到传统玩具行业是一次尝试,也是一种铺垫。“因为系统再厉害,没有足够的硬件水平作支撑,是无法应用的。”


 

文 | 创客公社  施润

请尊重原创,转载请向微信后台回复“转载”,获取授权规范

寻求报道,请添加微信:"Tiya0510"或点击“阅读原文在线登记



推荐阅读:(点击下方蓝字)

创客记:云帐房 /外勤365 / MyDocumate / 兰渡文化 / 米漫传媒 / 云创存储  / 牛顿眼


江苏高校创业图谱:南京大学 / 东南大学 / 苏州大学 / 南京航天航空大学 / 南京工业大学&南京邮电大学 


大赛活动报名:第二届“i创杯”互联网创新创业大赛 / 南京创业沙拉