机器看世界更像人类
导读 计算机视觉系统有时会对与常识相悖的场景进行推断。例如,如果机器人正在处理餐桌的场景,它可能会完全忽略任何人类观察者都可以看到的碗,
计算机视觉系统有时会对与常识相悖的场景进行推断。例如,如果机器人正在处理餐桌的场景,它可能会完全忽略任何人类观察者都可以看到的碗,估计盘子漂浮在桌子上方,或者误认为叉子正在穿透碗而不是靠着它。
将该计算机视觉系统转移到自动驾驶汽车上,风险会变得更高——例如,此类系统未能检测到紧急车辆和过马路的行人。
为了克服这些错误,麻省理工学院的研究人员开发了一个框架,可以帮助机器像人类一样看待世界。他们用于分析场景的新人工智能系统学习仅从几张图像中感知真实世界的对象,并根据这些学习到的对象感知场景。
研究人员使用概率编程构建了该框架,这是一种人工智能方法,使系统能够根据输入数据交叉检查检测到的对象,以查看从相机记录的图像是否可能与任何候选场景匹配。概率推理允许系统推断不匹配是否可能是由于噪声或场景解释中的错误导致的,需要通过进一步处理来纠正。
这种常识性的保护措施使系统能够检测并纠正许多困扰“深度学习”方法的错误,这些方法也已用于计算机视觉。概率编程还可以推断场景中对象之间可能的接触关系,并使用关于这些接触的常识推理来推断对象的更准确位置。
“如果你不知道接触关系,那么你可以说一个物体漂浮在桌子上方——这将是一个有效的解释。作为人类,我们很明显这在物理上是不现实的,放在桌子顶部的物体更可能是物体的姿势。因为我们的推理系统知道这种知识,所以它可以推断出更准确的姿势。这是这项工作的一个关键见解,”主要作者 Nishad Gothoskar 说,他是概率计算项目的电气工程和计算机科学 (EECS) 博士生。
免责声明:本文由用户上传,如有侵权请联系删除!