Logo
新闻中心

重大突破!家庭机器人将梦想成真

发布时间:2017-05-03 来源:金属加工

要想让机器人做家务,首先它得具有区分咖啡桌和婴儿床的能力。这看似简单,但现在大部分的机器人都做不到。

由斯坦福大学、普林斯顿大学和慕尼黑理工大学的研究人员捕捉的庞大的3D图像数据库也许能解决上述难题。

这个叫做ScanNet的数据库包含数千个生活场景,并对数以百万计的物件加以注释,如咖啡桌、沙发、台灯、电视等。过去五年里,计算机视觉技术突飞猛进,这一部分要归功于斯坦福大学另一个研究团队发布的2D图像数据库ImageNet。该数据库包含一系列带有标注的图像,比3D图像数据库更为简单。相比之下,ScanNet能提供更多的数据。

“ImageNet包含十分重要的注释数据,掀起了AI技术革命。”Matthias Neissner教授如是说道。Matthias Neissner是慕尼黑理工大学的教授,也是开发此套数据集的研究人员。

研究人员希望,ScanNet能让机器更深入地了解身边的现实世界,并投入到现实的应用中去。“最明显的例子就是,你的家庭机器人得知道身边在发生什么。”Neissner说。

Neissner当时正在斯坦福大学做客座副教授,他认为,研究人员应采用深度学习算法来使计算机更深刻地理解3D场景。该技术也曾在ImageNet数据库中有所应用。Neissner与他在斯坦福大学的学生Angela Dai、普林斯顿大学教授Thomas Funkhouser和其他一些学生共同开发出了ScanNet数据库

近期在网上发布的一篇论文中,研究人员描述了他们捕捉图像的方法。他们使用与微软Kinect相似的3D摄像机扫描了1513个场景,以此建立起数据库。此设备采用一个传统摄像机和一个红外景深传感器,在设备前方形成一个3D图像场景。然后研究人员让志愿者在iPad上的亚马逊Mechanical Turk众包平台为每个图像加注释。为提高整体精准度,一组人员还为图像上色加注,另一组人员则通过3D建模还原扫描到的场景。

布朗大学助理教授Stefanie Tellex正在从事提高家庭机器人认知水平的研究,她指出,ScanNet比之前的任何数据库都要庞大。“3D信息对于机器人对环境的认知与互动至关重要,而当前这方面的信息还匮乏得很。”

Neissner说,ScanNet背后的团队尝试过深度学习算法,发现使用该方法的机器人只需参照物件的深度信息或形状,就能准确地认出很多物件。这意味着3D数据会让机器人更深刻地认识现实世界。他还说,采用3D信息能让机器人更好地模仿动物的认知方式。

Siddhartha Srinivasa是来自卡耐基梅隆大学机器人研究所的教授。他称,新的数据库是让机器认知家庭内部环境的“良好开端”。“ImageNet之所以备受欢迎,一方面是因为它具有庞大的数据量,另一方面是因为其图像注释能够直接投入到诸多应用中去,尤其是可以应用到实验室中。”他说,除了机器人学和建筑学外,3D数据库的应用范围很窄,但相关的应用很快就会出现。

Srinivasa还说,其他团队正采用合成场景或虚拟场景来训练机器视觉系统。“虽然模拟真实生活场景是不切实际的,但就像电影中的计算机成像技术(CGI, Computer-generated Imagery)一样,模拟场景深度是完全可能的。”(本文由林美炳编译,来源:technologyreview)


关注公众号
关注公众号
返回顶部