当前位置: 速途网 > 互联网 > 智能硬件

像钢铁侠一样隔空操物,这家中国公司做到了


作者: 萧阳 发布: 张鹏鹏  2015年08月19日7:55  来源: 速途网 我要评论(0)

     本文来源:极地特工 微信公众号

  导语:每个创业团队都有独特的气息,而锋时团队,他们有历程,并且非常扎实和落地。

像科幻电影中一样隔空操物,这家中国公司做到了

《钢铁侠2》 小罗伯·特唐尼手指操控虚拟程序

  在《钢铁侠2》中,小罗伯特唐尼一个手势就能把电脑屏幕开启,把悬挂在空中的虚拟程序弹开,还能玩玩游戏,把程序揉成球投到虚拟框中。

  这一画面,涉及到两个专业术语,体感识别和人机交互。在商业应用层面,我们目前还无法达到电影中那么自在炫酷的地步。但在国内科技圈,通过体感识别完成的人机交互有了突破性的进展,而且普及应用也有日可待。

  锋时科技北京团队在朝阳区的一座民楼里。办公空间不大,但格局比较开阔,日照明媚。他们是利用机器视觉技术做手势识别的创业团队,公司成立有4年,经纬中国和真格基金先后领投了天使轮和Pre-A轮。

  从研发到公司创立这五年,锋时团队只做了一款手势识别的产品,别的倒是其次,最难以想象的是他们这心态是怎么练就的。

  “锋时F4”诞生 源于一点儿改变生活的科技情怀

  2010年,中科大博士毕业的刘津甦(su)与刘哲、党建勋、张硕三人聚在一起,商量着要干点事儿。他们打算应用机器视觉技术做体感交互,这是科技应用的一个发展趋势。于是四个80后凑出了五十万,在2011年7月成立锋时科技小组,“锋时F4”也就诞生了。

  四人中,刘津甦是项目的最初设想和实践者。

  2006年 至2008年,刘津甦在中科大读博以及卡内基梅隆大学做访问学者期间,分别获得过机器人世界杯足球赛仿真3D组冠军和仿真SPL组冠军。而机器视觉技术在这两项赛事中起着重要作用。

  通过比赛,刘津甦感到机器视觉在未来机械自动化和人机交互领域有着广阔发展空间。内心受到震撼后刘津甦生出一个想法,他要来做这件事——将机器视觉技术应用到人们的日常生活。

  “让机器视觉技术真正地为人们生活服务”,也就成了锋时科技创立的初心。

  如果不是一个科技创业者,或者科技背景出身,这句话会被轻易认为是上下嘴皮子动一动的事情。只有在经受诱惑时,才能知道一点理想成分存在的重要性。他们说,技术没做到底,事儿没做漂亮,会不甘心。

  团队从四人,发展到现在30人,“京深”两地分居,闷头一干就是五年,真不知道时间都去哪儿了?

  5年迭六代 有历程有故事

  从研发到创立公司的五年摸索中,锋时团队将手势识别作为机器视觉应用的突破口。

  手势识别是人机交互的一种,人通过隔空手势,操控系统。这项技术的核心在于通过双摄像头的融合捕捉手部的空间三维信息,完成指令输入和传输,最终目的是系统通过手势动作了解到使用者的操作意图。

像科幻电影中一样隔空操物,这家中国公司做到了

2010年12月第一代预研机

  早在锋时科技成立前,2010年12月,刘津甦根据设想首先做出了第一代预研机。它是一个用木板和黑胶盒子构成的概念品,虽然比较粗糙,可却验证了机器视觉应用的可行性。

  与后面的成品机相比,这个大块头的价值在于——它开启了一个开始,像莱特兄弟的飞机,像图灵计算机。

像科幻电影中一样隔空操物,这家中国公司做到了

2011年12第二代 微动工程机

  2011年12月,团队成立五个月后他们做出了第二代微动工程机。虽然比第一代的大块头小了很多,却依然粗糙,连接三个摄像头的那两组铁片是从儿童玩具上拆下来的。为了采集图像信息,当时这个工程机配置了三个摄像头,每个摄像头外有24个红外灯,功耗很大,需要220V电压支持。采集来的图片需要传输到PC端,做算法处理,不仅繁琐而且运算压力也比较大。但是,“好歹有了一个模子,能拿出去说事儿了,”CEO刘哲说 。

  于是他们将第二代工程机带到联想研究院。联想研究院建议他们,首先把功耗降下来,然后把图片处理集成在产品内部完成,摆脱对PC端运算的依赖。更重要的是,提示他们多一些“意向性的操作”。这不仅为他们提供了改进思路,也让他们了解到终端制造商特别是消费电子商对人机交互技术的需求。

像科幻电影中一样隔空操物,这家中国公司做到了

2012年7月 第三代 微动工程机

  于是他们继续改进。2012年7月,第三代微动工程机诞生。微动工程机在结构上明显发生了很大变化,机型也规整很多。

像科幻电影中一样隔空操物,这家中国公司做到了

2013年12月第四代 产品样机

  2013年12月,锋时真正意义上的产品样机终于诞生,这是锋时团队推出的第四代机子。与之前相比,样机有了美感可言。他们将电压降为5V,图像处理是在小盒子中完成算法,传输速度为500M/s。

  刘哲说,“其他体感团队,都是基于PC或主机平台进行图像信息处理,我们抛开了重量级架构,验证了未来移动端的产品形态在技术上的可能性。”有了样机后,他们拿到了经纬中国领投的600万元天使轮融资。

  2012年,还发生了一个插曲。有位“行业大哥”也看上了这个项目,想花500万收购。五百万人民币是最初投入的十倍,比如投了10万,两年时间变成一百万。当时成立锋时小组时,四个创始人有的刚毕业,有的刚辞了职结了婚,还有的正在国外读书。500万相当于他们获得十倍回报的第一桶金。

  考虑到项目易手后的开发前景,对方是否能让项目继续深入地开发下去,四位创始人存在疑虑。“这对我们的确有一定诱惑”,联合创始人张硕回忆,“但当时团队内部并没有出现两难选择,甚至没用心思去认真思考过。只是大家工作累了,偶尔拿这件事调侃一下。”

  最后,他们当然没卖。

  “感觉这件事儿要这么干,不那么漂亮。”刘哲闷头笑着反思说。

像科幻电影中一样隔空操物,这家中国公司做到了

2014年第五代 vidoo

  拿到融资后,2014年,团队继续改进产品。解决了供应链和生产工艺方面的打磨问题,样本显现了产品化。2014年底,第五代也是锋时科技的第一款正式产品vidoo面市,官方定价399元。当时,vidoo也参与了点名时间的众筹,最后众筹金额是62万元。

  62万可能对于别的团队不算什么,但五年坚持,一年迭代一款样机,历经三次核心算法升级,“产品”得以改进,这对于锋时团队却是一个鼓舞。

  这时,锋时科技也完成了Pre-A轮融资,由经纬中国和真格基金投资。

像科幻电影中一样隔空操物,这家中国公司做到了

2015年12月第六代 第二代Vidoo

  转眼到了2015年。第二代Vidoo预计会在今年9月份面市。第二代Vidoo在外观上将更有美感,并增加手部骨架识别和轨迹输入等新技术点,重新设计的镜头将提供120度视角范围。

  “用手在空中划字,和在纸上写字很不一样。因为空中写字手的轨迹是不间断的,所以让系统能识别出你的手势,这个算法是比较难的”,刘哲强调。

  可是解决这个问题又十分必要,所以他们设计了空中轨迹识别算法。目前,这套算法能识别 10个阿拉伯数字,26个英文字母和五角星、三角形等简单图形。

  体感交互的技术难点,市场规模及锋时的未来发展

  关于手势识别的应用,谷歌,微软,以及不久前被Oculus收购的以色列公司Pebbles也在做,包括在联想2015年Techworld大会上,也有这方面的体感展示。当时那套系统操作比较简单,只需要掌心面向屏幕,玩家通过上下左右移动手掌,指引游戏中的小人到达指定位置。但是,初次体验的“小白”用户需要适应好一阵儿。

像科幻电影中一样隔空操物,这家中国公司做到了

CEO刘哲(右)和联合创始人张硕(左)

  “虽然也有大公司在做体感交互,但是他们往往只将这项技术作为一个产品的附带功能或者组成部分,往往技术满足了产品需求后,便止步不前了,因而达不到真正技术层面的‘做得好’。”

  如何理解这种“好”?

  “在体感技术上尤指精度和延迟”,刘哲说,他们用两三年把手势识别的精度误差控制在0.01毫米内,延迟时间在10毫秒内。

  另一方面,在电脑屏幕试玩时,操作虽然灵敏,可对于小白用户,使用习惯将是第一道门槛。用户要在现实的三维场景与屏幕中的二维画面交互,会造成,手,脑和眼的不协调。这将增加用户的额外使用负担。

  为了克服这方面的使用困难,锋时团队又设计出了UI界面的解决方案。屏幕中的二维图标不变,在屏幕界面设计出三维骨骼手势。手在vidoo上方做出抓取动作,屏幕上就会呈现手的姿态,将目标图标抓取到文件回收站等等。这项技术,免去了用户思考和辨识手的操作而耗费精力的麻烦。

  日常生活能使用体感交互的场景很多。受体感交互技术发展水平和成本的制约,锋时团队先以VR和游戏为突破口,电视、智能家居、汽车甚至医疗都是应用场景。他们已经在同电视厂商和汽车前装厂商进行交流合作。

  但是,vidoo只是锋时的一种有形产品。手势识别的核心技术在于机器视觉的应用算法。就目前的科技和生活演化的发展趋势来看,体感交互将是未来的普遍应用技术。所以,锋时不久后的目标是,再将有形的产品做小,做成手势识别的传感装置,集成到设备主板,这样一来,他们又成了体感交互的解决方案商。

  体感交互市场规模有多大?

  ——“想象空间很大”,刘哲说。

分类:  智能硬件   用户:  张鹏鹏    关键词锋时科技 vidoo 体感交互

相关文章

速途网探营丨腾讯游戏研发总部成都分公司