里肯脑科学中心的AndreaBenucci及其同事开发了一种创建人工神经网络的方法,可以学习更快、更准确地识别物体。这项研究最近发表在科学杂志《公共科学图书馆计算生物学》(PLOS Computative Biology)上,重点研究了我们所做的所有未被注意到的眼球运动,并表明它们在让我们稳定地识别物体方面起着至关重要的作用。例如,这些发现可以应用于机器视觉,使自动驾驶汽车更容易学会如何识别道路上的重要特征。
尽管一整天都在不断地进行头部和眼睛的运动,但世界上的物体不会变得模糊或无法辨认,即使击中我们视网膜的物理信息不断变化。可能使这种知觉稳定性成为可能的是运动指令的神经拷贝。这些拷贝在我们每次移动时都会发送到整个大脑,并被认为可以让大脑解释我们自己的移动,保持我们的感知稳定。
除了稳定的感知之外,有证据表明,眼球运动及其运动复制也可能帮助我们稳定地识别世界上的物体,但这是如何发生的仍然是个谜。Benucci开发了一种卷积神经网络(CNN)来解决这个问题。CNN的设计目的是在眼睛移动的同时优化视觉场景中对象的分类。
首先,对网络进行培训,将60000张黑白图像分为10类。虽然它在这些图像上表现得很好,但当使用模拟眼睛移动时自然改变的视觉输入的移动图像进行测试时,性能急剧下降到偶然水平。然而,只要将导致移位的眼球运动的方向和大小也包括在内,使用移位图像对网络进行训练后,分类显著提高。
特别是,将眼球运动及其运动复制添加到网络模型中,可以使系统更好地处理图像中的视觉噪声。贝努奇说:“这一进步将有助于避免机器视觉中的危险错误。”。“有了更高效、更强健的机器视觉,像素改变的可能性就更小了鈥攁lso被称为“对抗性攻击”鈥攚例如,自动驾驶汽车将停车标志标记为灯杆,或军用无人机将医院大楼误分类为敌方目标。"
将这些结果应用到现实世界的机器视觉并不像看起来那么困难。正如贝努奇所解释的那样,“模仿眼球运动及其传出副本的好处意味着‘强制’机器视觉传感器控制运动类型,同时通知负责处理相关图像的视觉网络关于自我生成的运动,这将使机器视觉更加强健,类似于人类视觉中的体验。”
这项研究的下一步将涉及与研究神经形态技术的同事合作。其想法是根据本研究中强调的原理实现实际的硅基电路,并测试它们是否能提高现实世界应用中的机器视觉能力。