合成人帮助计算机了解真实的人如何行动

2017-05-01 02:44:01

Karen Bleier / AFP / Getty Images作者:Timothy Revell我们很难理解计算机我们的行为是无法预测的,计算机视觉系统,例如无人驾驶汽车中使用的计算机视觉系统,无法轻易理解我们正在做的事情并预测我们的下一步行动现在假人正在帮助他们了解真实的人类行为这个想法是计算机生成的身体行走,跳舞和做车轮的视频和图像可以帮助他们学习寻找什么 “认识到图像中发生的事情对人类来说是很自然的让计算机做同样的事情需要付出更多的努力,“德国蒂宾根马克斯普朗克智能系统研究所的哈维尔罗梅罗说他说,这是阻碍无人驾驶汽车进步的最重要因素之一使用合成图像训练计算机可以为他们提供有关人类世界的更有意义的信息目前,最好的计算机视觉算法使用数百或数千个图像进行训练,这些图像经过精心标记以突出重要特征这就是他们如何学会区分眼睛和手臂,或桌子和椅子但是,通过这种方式可以实际标记多少数据是有限的理想情况下,视频的每个帧中的每个像素都将被标记 “但这意味着不是创造成千上万的注释,人们就必须标记数以百万计的东西,这是不可能的,”法国巴黎高等师范学院的GülVarol说因此Varol,Romero和他们的同事已经制作了数千个具有逼真的身体形状和动作的“合成人类”视频他们走路,跑步,蹲伏,跳舞它们也可以以较少的预期方式移动,但它们总是被认为是人类 - 并且因为视频是由计算机生成的,所以每个帧都会自动标记所有重要信息该团队使用3D渲染软件Blender创建了他们的合成人类,他们的工作基于现有的人体模板和从真人收集的运动数据,以保持结果的真实性然后,团队通过随机选择身体形状和衣服,并将图形设置为不同的姿势来生成动画背景,灯光和视点也随机选择他们总共制作了65,000多个剪辑和650万帧利用所有这些信息,计算机系统可以学习识别像素从一帧到下一帧的变化模式,指示人们如何移动这可以帮助无人驾驶汽车判断一个人是走近还是即将走进这条路由于动画是3D的,它们还可以教导系统识别深度 - 这可以帮助机器人学习如何平滑地将某个物体交给对象而不会在胃中意外地将它们打孔这项工作将于7月在计算机视觉和模式识别会议上公布 “使用合成图像,您可以创建更多不寻常的身体形状和动作,而且您不必标记数据,因此它非常吸引人,”德国萨尔布吕肯马克斯普朗克信息学研究所的Mykhaylo Andriluka说他指出,其他团体正在使用像侠盗猎车手这样的视频游戏中的图形来改进计算机视觉系统,因为这些可以提供相对逼真的现实世界模拟 “虚拟图像的真实性已经取得了巨大进步我们可以用它来教电脑看东西,“罗梅罗说参考:arxiv.org/abs/1701.01370有关这些主题的更多信息: