王曙光,程民德
WANG Shuguang, CHENG Minde
摘要: 提出了一种基于注意机制的图像识别模型。其基本想法是:在进行复杂的场景分析或目标识别时,首先通过注视控制机制,获得视景中的关键特征区域,并将注视点按照一定的顺序对这些关键特征区域进行串行扫描。在扫描到每一个关键特征区时,将对该区域附近的局部模式进行记忆或匹配。对一个复杂目标的记忆将包括2部分,一部分是对局部模式的记忆,即组成该目标的各“部件”的模式;另一部分是对各局部模式之间的空间关系的记忆,即组成该目标的各“部件”之间的结构关系。与记忆过程对应,识别过程也包括2部分,一部分是对局部模式的匹配,另一部分是对各局部模式之间结构关系的匹配。当匹配上的局部模式足够多且其空间关系正确时,目标即得到识别。用该模型对复杂背景中的人像进行了检测。实验结果表明,模型较好地解决了不变性识别的问题,即识别结果与目标物的平移、旋转和尺度变化无关,并且具有良好的鲁棒性和速度,是一种具有认知意义并且可以实用化的模型。
中图分类号: