xPerception解读继Pokemon Go后,VR/AR进阶攻略

  一个热潮可以有多火?让平日不关注的人耳闻其名,让公司股价最高期翻一倍?全世界“上瘾”的《Pokemon Go》都做到了!这款任天堂携手谷歌通过AR(增强现实)和LBS(基于位置服务)所打造的游戏,以一种猝不及防的方式引爆游戏区、科技圈。

  《Pokemon Go》火了,也带热了AR技术。与熟悉的依赖头戴显示设备的AR产品不同,《Pokemon

  Go》并没有采用虚拟物体识别等先进AR技术,更多借用了AR的噱头,即被视为“轻AR”应用来与真正AR应用区别开来,其他如热门的AR早教小熊尼奥也

  是同类产品。但即使采用的是初级的AR技术,《Pokemon

  Go》的空前火爆,也向业界证明了这样的轻AR作为未来计算平台杀手级应用所拥有的巨大潜力。

  AR版的“捉妖”记

  “Pikachu?”随着手机一声提示,通过摄像头,一只宠物小精灵皮卡丘正在当前办公桌上跳动。玩家打开《Pokemon Go》游戏和定位功能后,手机会通过摄像头实时拍摄画面,皮卡丘、杰尼龟等小精灵就藏在这些现实环境中,用户只要拿着手机走动便可以抓住这些小精灵。

  虚拟世界与现实环境的互动,应用了AR技术,正是《Pokemon Go》引发科技圈大讨论的最重要原因。不过在业界人士看来,《Pokemon Go》所应用的AR技术,与凭借“鲸鱼在篮球场上精彩一跃”震惊业界的Magic Leap公司的AR技术还有一定差距。

  (Magic Leap公司震撼网络的鲸鱼在篮球场腾跃画面)

  在Magic Leap前核心工程师、xPerception创始人包英泽看来,《Pokemon

  Go》所应用的AR技术,主要是通过手机里的陀螺仪,实现虚拟与现实画面的简单叠加。这样的简单叠加,使得皮卡丘可能会出现在水里,或卡在一个实体大衣柜

  中,用户尝试拿手机接近时却无法捉住。另外,由于《Pokemon

  Go》是基于GPS进行定位,GPS技术本身对运动跟踪并非精准,在小距离范围内会出现误差,也不能进行室内定位。

  “尽管《Pokemon Go》采用的AR技术比较简单,但这也恰恰说明技术本身并不是限制AR、VR应用发展的必要瓶颈。”他表示。

  轻AR爆发后的技术发展

  《Pokemon Go》的AR技术并不完美,但现象级效应已彻底向业界证明对技术要求不高的轻AR时代已经到来。不仅是AR,Facebook CEO扎克伯格判定VR技术(虚拟现实)将比AR技术更快实现消费化。

  实际上在年初高盛发布的《VR与AR:解读下一个通用计算平台》中,明确表示VR与AR有潜力成为下一个重大通用计算平台,同时指出用户体验、技术局限、内

1.96黄金皓月容和应用的开发、价格是制约VR/AR普及的障碍。

  从技术发展角度看,从现在VR/AR较为初级的“轻技术”阶段到后续能广泛普及的成熟阶段,包英泽表示技术未来将从三方面进行演进。

  一是交互手段。

  真实世界的我们如何与虚拟世界的物体进行交互呢?目前市面上提供的娱乐化产品如Oculus、HTC

  vive都需要额外配合游戏手柄来完成,这在包英泽看来并不是最适合未来的交互方式,“未来的交互应该是自然手势交互,例如抓小精灵时不是在屏幕上滑动,

  而是用自己的手去做‘抓’这个动作就行”,他举例到,目前业界已开始这方面的尝试,技术走在前端的包括Leap

  motion、xPerception,便开始通过追踪定位系统来检测人的手部运动和手指运动。

  二是适用场景。

  对于现阶段的AR消费级应用,包括手机端和头戴式设备的AR应用,大部分需要GPS定位从而只能在户外使用。对于在室内的使用,则需要标记物,使得

  其应用基本局限在2m×2m的范围,如欧洲的Wikitude、高通的Vufovia等产品。同时基于手机上的AR应用功耗也是个大问题,常常画面卡顿、

  手机电池使用时间缩短近2/3。

  在VR侧,问题同样突出。目前业界主流头戴式VR设备如Oculus、HTC

  vive,为增强临场感,通过外置红外激光这样“由外而内(outside-in

  tracking)”的追踪方式,来确保用户真实世界中的行为与虚拟世界的行为一致。而这样的“由外而内”的方式也意味着用户需要自己组建硬件、调整配

  置,其适用范围也就只有3m×3m。不过现在GoogleTango正采用最新的“由内而外(inside-out tracking)”方式,即直接通过用户头戴式设备来进行对现实的观测与追踪,而免去对外部设备依赖,以实现更广范围的互动。

  三是使用安全性。

  现在无论是VR还是AR技术,都缺乏避障功能,这使用户面临着人身安全性威胁。当用户的双眼沉浸在虚拟世界中,而现有产品又缺乏物体、环境识别功能时,家里家具的变化、突然出现的宠物都可能引发一场猛烈的撞击,暗含巨大的安全隐患。

  其实《Pokemon Go》游戏频繁出现的事故也在一定程度上展现了安全隐患苗头:前不久美国圣迭戈恩西尼塔斯两名男子为玩游戏,从海岸悬崖跌落受伤。

  计算机视觉:给“黑科技”加上眼睛

  未来,无论是上述中Leap motion对自然手势交互的研究、Google

  Tango“由内而外”技术对场景的开拓,还是避障功能的增加,“其实主要是解决计算机视觉技术中的物体姿态识别、视角跟踪、场景重建三个功能。”包英泽

  解释到,计算机视觉技术之于机器,就如同眼睛之于人,是感知、理解世界的最重要“器官”,所以计算机视觉的发展对于VR、AR的意义便不言而喻。

  姿态识别、视角跟踪、场景重建,是计算机视觉着重解决的关键问题,涉及处理器、传感器、算法实现等技术环节,包英泽表示其中目前业界热门研究、关注的是融合了动作传感器的SLAM(即时定位与地图构建)算法。

  现在SLAM使用的传感器主要有两类,单目摄像头和双面双目摄像头。包英泽表示,单目摄像头体积小,但由于不能获得“视差”,不能准确获得物体的三

  维信息,所以在姿态识别功能上准确率较差,同时当物体运动缓慢时,难以进行位置追踪。而双目摄像头虽然相比较体积更大,则因为可以获取“视差”,同时有信

  息的冗余能较低算法的误差,“所以未来多目摄像头将成为主流的产品”。被业界视为目前体验最好的AR设备Hololens,便采用了多目摄像头。

  SLAM算法实现是业界最前沿的技术走向,但不得不说也是一个亟待突破的技术症结所在。从2008年的PTAM,到现在的orb

  slam开源软件包,尽管SLAM算法已有多年发展,但基于开源的算法实现效果在精度、鲁棒性方面都表现较差。“现在开源的位置追踪,与实际人的真实运动

  轨迹相比误差太大,一不小心监测的运动轨迹就会出现严重的漂移,甚至错误的引导人撞到墙上。”他表示,精确的轨迹跟踪,特别是将传感器和SLAM算法融合

  的实现,全世界能做到的技术团队屈指可数,Google Tango、Hololens、xPerception算其中极少数。

  未来三年,下一代独角兽从这里诞生

  世界在不停改变,十年前人们上网最主要内容是阅读文字,而未来三年人们将迎来虚拟与现实的互动,计算机视觉势必成为下一个新的技术高地。

  “我们知道计算机视觉往往需要非常复杂的算法去解决,而应用往往都是移动化的,例如基于手机的应用。在移动化的设备里面,要以低能耗的方式进行复杂

  的算法,芯片一定是必经之路。”包英泽表示,现在行业里面有大量团队在进行算法的研发,一些走的比较快的同行已经开始将成熟的算法芯片化了。

  同时,目前除了Google、英特尔、微软等巨头在马不停蹄进行技术研究、应用,包英泽预测这个领域一定为诞生更多的专业化团队,去提升计算机视觉

  系统在不同平台、不同使用环境下的表现与性能,解决重大安全问题与应用,“与这对应的技术有数百亿的市场,计算机视觉领域将诞生出很多上市企业”。

  该说法也得到了不少硅谷风投从业者认可。在硅谷,围绕图像识别、计算机视觉、深度学习等关键技术的投资热度在明显增强,并将长期进行持续且深入的投入。

  基于高盛的标准预期,到2025年,VR/AR市场规模将达到800亿美元。AR/VR作为下一个重大通用计算平台将创造一个崭新的世界,而计算机视觉技术无疑将加速这场革命。

关于作者: zhaosf

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注