当前位置: 东星资源网 > 文档大全 > 感谢信 > 正文

【视觉运动追踪的加工过程】视觉追踪训练

时间:2019-02-11 来源:东星资源网 本文已影响 手机版

  摘要 视觉运动追踪是运动知觉研究的一个重要领域。通过构建视觉运动追踪的过程模型和分析每个阶段的认知加工任务,可以帮助人们认识运动物体识别的本质。视觉运动追踪包括目标获取和运动追踪两个加工过程:目标获取阶段的主要任务是将目标与背景分离,集中注意力加工追踪目标;运动追踪阶段的主要任务是启动平滑追踪眼动和追赶性眼跳,并发挥行为水平、眼动水平和神经活动水平的预测机制。目标获取同时受背景和目标的运动特征和身份特征影响;运动追踪系统发挥预测机制的基础是客体表征连续性,而客体表征连续性的建立同时依赖于目标时空属性和身份特征的编码加工。因此,视觉运动追踪是视觉系统对客体运动信息和身份语义信息整合的结果。其中。客体运动信息的加工特性已经获得了比较广泛的研究,而语义信息加工机制还有待进一步加强。
  关键词 视觉运动追踪;目标获取;运动追踪:预测机制
  分类号 B842
  当周围环境中的运动物体吸引观察者的注意,眼睛开始追随这个目标运动,便形成了视觉运动追踪。视觉运动追踪的基本前提是获取追踪目标,即在背景和目标相互分离的基础上将注意力集中于追踪目标。背景与目标的分离过程受背景运动特征和身份特征的影响,而对目标的捕获更多地依赖于目标自身运动状态的突然变化和身份的显著性。一旦视觉系统识别了目标客体,便开始运动追踪。此时,虽然头部或身体也会参与运动,但这些运动的准确性较低,只能起到补偿的作用。只有启动眼动系统(平滑追踪眼动和追赶性眼跳)才能匹配眼睛速度和目标速度,从而保证追踪目标的视网膜图像始终落在中央窝附近。但是,在真实的单目标追踪和多目标追踪任务中,目标运动轨迹会随时变化,有时还会受到其他客体的遮挡暂时从视野中消失。为了能够有效追踪,视觉系统必须通过对目标时空特征和身份特征的加工建立起客体表征连续性,以克服运动轨迹的变化和暂时的遮挡。客体表征连续性是视觉追踪系统发挥预测功能的基础,这种预测包括三个水平:一是行为水平上对空间位置或接触时间的预测;二是眼动水平上对目标经历遮挡后再出现位置的预测;三是神经活动水平上的预测,为平滑追踪眼动和追赶性眼跳提供位置和速度参照。三个水平的预测机制不仅受目标运动特征的影响,还受制于目标所属的语义类别。因此,视觉运动追踪是视觉系统对目标的运动信息和身份语义信息整合的结果。目标客体的运动信息和身份语义信息加工既相互分离又存在联系,二者的整合是一个复杂的过程,对这一过程的探讨可以帮助人们认识运动物体识别的本质,丰富认知心理学、认知神经科学以及医学的基本理论。
  1
  目标获取阶段的认知加工
  1.1场景分割
  现实生活中,感兴趣客体通常处于结构复杂的动态视觉背景中。因此,视觉系统为获取追踪目标,必须首先将目标与背景的视觉输入信号分离开来,而这一分离过程受背景的运动特征和身份信息的显著影响。以猴子(Kodaka,Miura,Suehiro,Takemura,&Kawano,2004)和正常成人(spering&Gegenfurmer,2007a)为被试的眼动研究表明,当目标在静态纹理背景上运动时,对目标眼动追踪诱发的背景网膜图像与目标网膜图像的运动产生竞争,将会降低追踪速度和加速度,延长追踪潜伏期。而如果背景和目标同时运动,追踪成绩将取决于二者的运动方向,具体表现为:背景和目标运动方向一致导致追踪潜伏期降低、追踪速度增加;反之,二者运动方向相反导致追踪潜伏期增加、眼睛速度降低(Ferrera&Lisberger,1995;Masson,Proteau,&Mestre,1995;Clair,Huff,&Seiffet,2010)。同时,背景的运动速度也是影响目标追踪的一个重要因素。在背景和目标运动方向一致条件下,背景速度的突然变化将诱发变化方向上眼睛速度的短暂增加;而在背景和目标运动方向相反条件下,眼睛追踪速度则不受背景速度变化的影响(Kodaka et al.,2004;Spering&Gegenfurtner,2007 Miura,Kobayashi,&Kawano,2009)。Lindner和ng(2006)认为,背景速度效应的这种不对称性主要是因为眼球震颤运动(optokinefic nystagmus,OKN)抑制的不对称性。背景与目标运动方向相反,引起与追踪方向相反的慢周期的眼球震颤运动,从而抵消了追踪反应;而背景与目标运动方向一致,则引起与追踪方向相同的眼球震颤运动,从而提高了眼睛速度。此外,有研究者发现,当面对两个运动方向和速度不同的物体时,事先告知被试目标和分心物的身份,或者对于目标和分心物身份不作任何提示,两种条件下眼睛追踪轨迹以及开环阶段的追踪反应存在很大差异(Lisberger&Ferrera,1997;Spering,Gegenfurtner,&Kerzel,2006)。
  
  
  1.2目标捕获
  在同一时刻内视觉系统会面对大量客体,但人们无法以同等程度的优先性对进入视觉系统的所有客体进行加工,只有通过选择性注意筛选的客体才能成为追踪目标,获得进一步的加工。有效的线索提示能够引导观察者朝向视野中的特定位置,然后再搜索与行为目标相关的刺激(Francori&Simons。2003)。在同等线索提示条件下,对位置的选择性注意也会优先于对客体的选择性注意(soto&Blaneo,2004)。这种基于空间位置的选择性注意通常以自上而下的加工方式促进目标觉察。然而,越来越多的研究证实,目标自身的动态变化、显著性及身份特征等因素更容易引起人们的优先注意,即注意优先权(AttentionalPriority)。静态物体的突然运动会迅速吸引人们的注意(Abrams&Christ,2005a,2005b;Franconeri&Simons,2005),注意捕获发生在物体运动150ms左右(von Mflhlenen&Enns,2004),受运动频率的影响(con Mfihlenen&Sunny,2010,),但不受物体颜色变化的影响(A1-Aidroos,Guo,&Pratt,2010)。相似地,运动物体的突然停止也会捕获注意,但逐渐停止的运动刺激则很难捕获观察者的注意(Francori&Simons,2003)。Franconefi和Simons(2003)认为,突然出现的新客体或突然运动的物体对于人类而言是紧急性事件(behavioral urgentevent:},可能需要人们立刻做出行动,因此会强烈地吸引注意。设想你正集中注意力找一本书,一只猫突然从书架上窜下来,你的注意力会转向哪里?另外,当视野中多个对象存在竞争,具有显著特征的奇异刺激通常能够自动地把注意引向自己所在的空间位置,获得注意优先权。例如,Ro和Friggel(2007)采用视觉搜索范式发现,当面 孔、身体、食物、衣服、植物、工具等刺激沿一个不可视的圆环随机排列同时呈现在视野中,面孔和身体等生物性刺激更容易吸引观察者的注意,这可能是因为人类的面孔和身体运动能够提供丰富的社会信息,有助于人类的社会交往活动。上述研究结果表明,视觉系统对追踪目标的锁定是自上而下加工和自下而上加工共同作用的结果。
  2 运动追踪阶段的认知加工
  2.1眼动启动
  人类在追踪一个缓慢而平稳运动的目标时通常采用平滑追踪眼动。平滑追踪眼动是比较慢速的眼睛运动,眼睛速度通常小于50u,s,且主要由视觉反馈控制。平滑追踪眼动可以分为开环(目标呈现后的前140ms)和闭环两个阶段(Lisberger,Morris,& Tychsen,1987;Dchsen&Lisberger,1986)。在开环阶段,眼动主要由目标在视网膜上的成像信息驱动。在眼动开始的最初20ms,眼睛在目标运动方向上不断加速,并在20-100ms内逐渐趋于目标速度。到闭环阶段,人们已经形成了对目标运动特征(速度、加速度等)的表征,这时的眼动追踪可以依赖于这种眼动的反馈性补偿信息。开环阶段的眼动追踪是视觉系统对运动目标的初始反应,受目标运动的影响而不受眼动的反馈性补偿作用。但是,由于感觉加工需要耗费一定的时间,开环阶段眼动追踪的启动总存在约100ms的延迟(carl&Gellman,1987);而闭环阶段的眼动追踪同时受视觉运动信息和眼动的反馈性补偿的影响(冯成志,贾凤芹,2008),可以不受或较少的受到感觉加工延迟的影响。
  当被追踪目标的运动速度加快或者目标运动轨迹突然发生变化时,眼睛速度将明显慢于目标速度,追踪增益(眼睛速度与目标速度的比率)降低,位置误差不断积累(Laurufis,Daunys,&Zemblys,2010)。这时平滑追踪系统已经无法单独补偿不断积累的位置误差,视觉系统将启动追赶性眼跳使眼睛快速地追赶上目标。眼跳是比较快速的眼睛运动,最大速度可超过500°/s,可以在固定的目标之间转换注视(Becker,1991)。追赶性眼跳通过不同的眼跳幅度来减小眼动追踪的差异,增大其追踪增益,甚至可以使眼睛跳至目标之前(Orban de Xivry,Bennett,Lef6vre,&Barnes,2006)。视觉运动系统决定是否需要发动追赶性眼跳主要取决于眼睛和目标之间的交汇时间(eyecrossing time,TXE),这一时间主要根据位置误差和速度误差来计算。de Brouwer等人(2002)提出,“眼睛交汇时间(eye crossing time,TxE)”是平滑追踪和眼跳追踪相互切换的一个标准:TXE在40~180ms之间是所谓的平滑区域(smooth zone),平滑追踪眼动而不是追赶性眼跳被启动:TxE小于40ms或大于180ms,追赶性眼跳被启动,潜伏期大约125ms。
  大量研究已经证实,视觉追踪一个运动的目标需要结合平滑追踪眼动和追赶性眼跳,二者协同作用将视轴准确定位于目标。当目标运动速度以20°/s,40°/s和60°/s随机出现造成运动路径无法被预测,被试会根据目标速度转变之前的运动时间和速度调整追踪增益和眼动加速度。随着目标速度的增加,眼跳的时间间隔将逐渐缩短,眼跳波幅将逐渐增加。这表明当刺激由可预测转变为不可预测,追踪眼动将从目标运动速度转变之前的知觉加工中获得反馈,形成计划性眼跳(Takahashi,Tsujita,&Akiyama,1988)。尤其是在目标被暂时遮挡的情况下,平滑追踪眼动和追赶性眼跳将各自发挥一定的预测功能。目标被遮挡后。眼睛速度开始衰减,此时平滑追踪眼动的预测机制使得眼睛速度得以维持并逐渐恢复:同时眼跳系统也被启动去校正眼睛速度下降造成的位置误差(Orban de Xivry et al.,2006)。
  2.2运动预测
  2.2.1运动预测的心理基础
  视觉运动追踪过程中,目标的运动轨迹会根据情况随时发生变化,有时还会受到其它客体的遮挡暂时从视野中消失,但是人类依然可以将不断变化的客体知觉为同一目标,并准确预测目标的空间位置或碰撞时间。视觉运动追踪系统究竟如何组织使得人类具有如此复杂、高效的预测功能?根据视觉索引理论,视觉系统中存在一个索引(index)机制,只有被索引的物体才能得到进一步的认知加SE(Pylyshyn,2001)。索引的工作原理类似于指针始终指着运动对象从而保证正确地追踪。索引具有“粘性”,当索引与被追踪物体绑定之后,不会因为追踪目标的运动变化或被遮挡而丢失,它会始终“粘”在目标上。但索引只能对客体的时空特征(如位置、运动、方向等)进行编码,不对客体的表面特征(如颜色、形状等)进行编码(Pylyshyn,2004)。而客体档案理论则认为,当客体被注意到时,与之相关的客体档案随即被打开,该客体的各种信息(包括位置、特征、语义身份等)都会进入到客体档案中(Horowitz et al.,2007),客体档案根据时空特性将这些信息粘合,形成一个单一而连续的运动客体,并不断更新客体的表面特征信息。即使客体特征在运动过程中发生改变或被遮挡,视觉系统仍然能够通过客体档案将它们知觉为连续体并加以识别。也提出,视觉运动追踪包含两个基本的认知成分:身份信息分析成分(“what”信息分析)和空间信息分析成分(“where"信息分析),它们彼此相互独立,分别编码目标物的语义身份和位置信息,并将信息传递至身份一位置捆绑的情景缓冲器。身份一位置信息捆绑的情景缓冲器一旦形成,可以在一段时间内维持捆绑信息,以克服由眼跳、眨眼、遮挡等造成的视觉输入的暂时消失。由此可以看出,视觉运动追踪系统发挥预测功能不仅依赖于时空属性的编码加工,也依赖于表面特征属性的加工(HolIingworth&Franconeri,2009)。
  表面特征属性和时空属性是自然界中所有客体的两大属性维度:表面特征属性(surface featuralproperties)包括客体的颜色、形状、纹理等;时空属性(spatiotemporal properties)包括位置、运动速度、运动方向等,二者的表征是相互平行的(Keane,Mettler,Tsoi,&Kellman,2011)。在MOT(muinple0bject tracking)任务中,被试能够从8~10个完全相同的运动客体中成功追踪4―5个目标,追踪的正确率可以达到85%一95%(Pylyshyn&Annan,2006)。这表明视觉系统能够非常有效地捕获运动客体的时空特征。对时空属性加工会优先于对其他属性特征的加工,原因可能在于时空属性是建立客体连续性的关键因素(Horowitz et al.,2007; Fencsik.Klieger,&Horowitz,2007)。同时,物体的形状和颜色等表面特征属性在追踪过程中也能够被识别(Klieger,Horowitz,&Wolfe,2004,);而且,对目标形状的识别能力不受其运动方向的影响(Olivier&Labiale,2008),;但是,视觉系统对被追踪目标形状特征的加工难度要比颜色特征加工难度大(丁锦红,王东晖,林仲贤,1998)。有研究者提出,客体的表面特征属性在运动追踪的作用不仅是有助于区分目标物和分心物,还能够帮助观察者一一确定目标物和分心物各自的身份(Klieger et al.,2004)。每个客体都拥有一个完整的身份,身份的概念范畴很广泛,包含客体在形状、大小、颜色等每个属性维度上的特征。身份最重要的特点是拓扑不变性,即形状的扭曲变形或暂时遮挡不会影响个体对身份的知觉。例如,一只鸟在飞行过程中的姿态和明度等会一直变化,但我们始终将其知觉为鸟这一身份实体(zhou,K.,Luo,Zhou,T.G,,Zhuo,Y.,&Chen,2010)。对于客体身份的加工会激活相应的语义网络。Liu,Chen,Xuan和Fu(2009)提出,视觉追踪系统可以有效处理目标形状、大小、亮度等简单特征随时空属性发生的变化,同时对复杂信息如语义网络的改变保持高度警惕性;被追踪目标的特异性特征的语义网络一旦被激活,追踪成绩将大大提高。反之,如果目标和分心物的轮廓、边界等部分耦合、遮挡造成二者语义上的相关,对目标的视觉追踪成绩将会降低(Keane et al.,2011)。由此可见,视觉运动追踪的预测机制可能存在两个分离的加工系统,一个系统处理客体的运动信息,另一个系统处理客体的身份语义信息。
  2.2.2行为水平的预测机制
  (a)空间位置预测。视觉追踪过程中,个体经常要利用接收到的视觉信息判断运动物体的位置,而在实验室中被试对运动刺激最终位置的记忆将沿着刺激运动方向向前发生偏移(翟坤,张志杰,2011;Roach,McGraw,&Johnston,2011),偏移的程度受刺激各种属性特征的影响。较快的速度会引起被试对目标最终位置的判断产生较大的向前偏移(Munger&Minchew,2002);水平方向上的运动比垂直方向上的运动产生更大的偏移量(Hubbard&Bharucha,1988);而目标大小对空间定位偏差的影响只存在于垂直方向(Kozhevnikov&Hegarty,2001)。这种空间定位偏差不仅受上述运动特征的影响,还取决于刺激的身份特征。Reed和Vinson(1996)向被试呈现火箭和教堂两种刺激图片,图片形状大致相似,细节特征有所差异。刺激沿3个不同的位置序列呈现,造成向上或向下运动的印象。第3个位置被称为记忆位置,要求被试判断第4个呈现的位置与记忆位置是否相同。结果显示,被试对向上运动的火箭的空间定位偏差显著大于教堂,而在向下运动中二者差异并不显著。这表明,通过操纵客体的身份特征可以控制空间定位偏差现象的产生。但是,上述研究中的运动是通过控制每帧图像的呈现时间和图像之间的时间间隔造成的视觉印象,并非真实的运动,因此被称为“内隐运动(implicit motion)”。
  在真实的单目标追踪和多目标追踪任务中,对目标空间位置的判断会更加复杂,但是被试依然可以通过运动信息和身份信息加工做出准确判断。在多目标追踪任务中,被试可以报告多个卡通动物的空间位置,表明追踪系统能够同时加工目标的位置和身份信息(Horowitz et al.,2007)。目标和分心物同时重复呈现有助于被试准确预测运动停止时目标的位置(Pinto,Howe,Cohen,&Horowitz,2010);而目标和分心物身份相互转换后同时重复呈现则降低了最终位置判断的准确性(Ogawa,Watanabe,&Yagi,2009)。目标和分心物的相似性越高导致追踪成绩越差;反之,目标和分心物的相似性降低将会提高追踪成绩。目标速度也表现出类似的效应(Tombu&Seiffert,2011)。
  (b)接触时间预测。视觉追踪过程中,观察者准确判断视野中运动物体到达某一特定点的时间一碰撞时间或接触时间即TTC的能力是至关重要的。例如,飞行员需要根据目标的动态位置和运动轨迹确定自己的位置和速度,从而在最精确的位置击中目标;或者当运动员去接一个飞来的球时,需要预测球何时落于何地,以便准确地定位,及时做出接球动作。Gibson(1966)认为,对TTC估计的信息可以直接从物体丰富的纹理结构和不断变化的视觉光流(visual optic flow)中获得。当观察者在环境中运动或物体相对观察者运动时,都会引起来自一个光流扩张中心(focus of expansion)网膜影像的扩张,网膜影像的扩张速度与观察者和扩张中心之间的距离呈线性增长,随着目标物的接近,其网膜影像的扩张增快。运动物体视觉影像的相对扩张率为观察者提供了重要的一阶二维信息源,记为tau-margin。以成人和学龄前儿童为被试的研究结果都证实,人们可以直接利用视觉变量T估计TTC和控制计时行为(Lee,1976;Warren,Young,&Lee,1986;Warm,Edgar,&Blmr。1993)。但是,由于视觉变量和物理变量存在一对一的图式关系(Gibson,1966;刘瑞光,黄希庭,1997)。因此,影响TTC估计的因素可能既包括视觉信息也包括物理信息。刘瑞光和黄希庭(1999)以正方形图形为实验材料,采用运动遮挡范式,发现在运动物体视觉影像的扩张率保持不变的条件下,物体大小、运动速度、运动距离和加速度等因素会影响对TTC的判断。郭秀艳、贡哗、薛庆国和袁小芸(2000)也发现,运动速度加快会导致TTC估计的准确性提高。同时运动速度与挡板宽度存在交互作用,即速度快、挡板宽时碰撞时间的估计更准确,而速度慢、挡板窄时碰撞时间估计的准确性降低。此外,最近的一项研究结果显示,除了视觉信息和物理信息,运动物体的身份信息也是影响横向运动TTC估计的重要因素(黄端,张侃,2008)。因此,个体对运动追踪中TTC的预测不是单一因素决定的,而是多种因素共同作用的结果。
  2.2.3眼动水平的预测机制
  (a)研究证据。有研究者提出,视觉追踪一个运动目标不是通过修正眼睛和目标之间的位置或速度误差实现的,而是通过预测目标路径实现的(zambrano,Falotico,Manfredi,&Laschi,2010)。因此,预测性是平滑追踪眼动的根本特征。预测性追踪眼动使得被试在追踪一个有规律运动的目标时快速达到稳定的增益水平,因此当目标有规律运动一段时间后,眼动方向的改变可以先于目标 运动方向的改变而发生(Deno,Crandall,Sherman,&Keller,1995);同时也保证了被试对无规律运动目标的合理追踪,即使目标运动方向突然变化也不会影响其眼动追踪,眼动系统将分别预测原来方向上的运动停止和新方向上的运动启动,眼动方向的改变是对二者反应的累加(Boman&Hotson,1992)。尤其是当追踪目标受到相邻物体的遮挡时,眼动系统为准确估计目标再次出现的位置,必须启动其预测机制将遮挡期间眼睛与目标位置、速度之间的不匹配降到最小。BenneR,Orban de Xivry,Barnes和Lefvre(2007)考察了被试对一个加速运动目标经历遮挡后再出现位置的预测性反应。结果显示,眼动追踪系统能够准确预测加速运动目标经历遮挡后再次出现的位置和运动速度。一般而言,遮挡初期,眼动系统突然接受不到视觉反馈信号(如图像的速度和加速度),眼睛速度开始下降。如果目标被预期不再出现或者再出现需要经历很长一段时间,眼睛速度将迅速衰减至零(Mitrani&Dimitrov,1978;de Brouwer,Missal,&Lefevre,2001)。但是,如果被试预期目标会再次出现,预测机制的启动将导致眼睛速度在小幅度下降后逐渐恢复(Churchland.Chou.&Lisberger,2003),并于遮挡结束时达到原先的水平(Bennett&Barnes,2003)。Barnes和Collins(2008)认为,平滑追踪眼动同时受制于视网膜信息输入和网膜外信息输入的影响。在追踪持续可见的目标时,网膜信息和网膜外信息将协同工作,以克服视觉系统固有的延迟和维持稳定的高追踪增益。而在缺少视觉输入时,被试只能依靠网膜外信息,这时工作记忆、注意和期待等因素对维持平滑追踪眼动有重要作用。
  (b)产生机制。预测性追踪眼动的产生机制一直是视觉运动追踪研究的重要方面。Orban deXivry,Missal和Lefevre(2008)通过在正弦运动轨迹中交替插入时间不等的遮挡,发现被试在缺少网膜输入时也可以追踪目标运动大约几百毫秒。研究者认为,不可视条件下的平滑追踪眼动由一个动态表征目标运动的短时速度记忆所驱动。Churchland等(2003)进一步指出,对持续可见的目标运动追踪是由视觉信息和眼动反馈信息来引导的;对遮挡的目标运动追踪则主要由已经储存的对目标速度的心理表征来引导,而目标被遮挡前的视觉输入是建立动态表征系统和保证平滑追踪眼动预测性的基础。目标被遮挡前眼睛速度达到目标速度,表明追踪系统已经获得目标速度的心理表征,遮挡期间的眼睛速度将保持高度稳定性;反之,如果目标被遮挡前的心理表征未能建立,遮挡期间的眼睛速度将迅速下降,追踪眼动将无法维持其连续性。因此,即使对于2―6个月婴儿,在目标有规律运动一段时间后,插入挡板也不会影响其视觉追踪的连续性。但是,如果遮挡前运动已经停止或者遮挡时间过长,视觉追踪则被中止(Muller&Aslin,1978)。目标被遮挡前的视觉输入是否也包含客体的身份信息?Coppe,Orban de Xivry Missal和Lefevre(2010)考察了被试对可视和遮挡期间生物运动刺激的眼动追踪特征,发现无论生物运动刺激是正立的、倒立的还是随机的,遮挡期间的追踪速度都十分稳定。研究者认为,遮挡期间的高速度增益是因为三种目标在可视阶段的运动时间都是800ms,足以建立目标的动态表征系统。但是,如果生物运动刺激进入遮挡前未被识别,即对目标的时空表征和身份表征都未能建立,眼动追踪系统是否还可以发挥有效的预测机制,Coppe等人的研究并未述及。
  (c)理论模型。人类的视觉系统究竟如何组织可以如此高效地预测运动目标的空间位置或接触时间。Coppe等人(2010)提出,预测性平滑追踪眼动由两条通路共同执行(见图1):视觉运动通路负责将网膜输入转化为运动指令(Krauzlis&Miles,1996);短时记忆通路存储运动目标的动态表征,以维持遮挡期间的眼动追踪(Bennett &Barnes,2003)。视觉运动通路由两条平行的加工系统组成:图像加速度处理系统和图像速度处理系统,二者均接受网膜滑动信号(retinal slip signal),网膜滑动主要由目标和眼睛之间的速度差异造成。图像加速度处理系统首先将网膜滑动信号微分化(如,加速度误差),然后通过公式将其转化为运动指令;图像速度处理系统则通过线性换算(增益为α)完成这一转化过程。两条加工系统的输出经整合,与记忆通路的输出累加,再传人视觉器官一眼睛。这一过程需要经过低通过滤,时间常数为150ms。短时记忆通路包含一个积分器,积分器对运动指令进行累加,直到记忆通路的输出和当前的运动指令相匹配(BenneU&Barnes,2003)。一旦完成匹配,记忆通路的输出与记忆增益β相乘,再与视觉运动通路的输出信号进行累加。记忆增益β是对不断更新的目标位置的期待,其作用是维持目标遮挡期间的眼睛速度不为零,并于遮挡结束时恢复到其初始值(Bermett&Barnes,2003)。
  Coppe等人的模型综合了Krauzlis(1996)和Bennett(2003)等人的观点,较好地说明了预测性平滑追踪眼动的过程,这与已往的追踪模型有着本质区别。如Robinson(1986)和Krauzfis(1989)等人虽然明确地表述了追踪眼动的输入和输出参数,却没有考虑目标经历遮挡的情况,与现实情境和许多实验结果不相符。但是Copp=等人的模型也存在一些缺陷,如没有包含追赶性眼跳的预测机制。
  2.2.4神经活动水平的预测机制
  在眼睛缺少视觉反馈的情况下,大脑的预测机制为进一步的平滑追踪和眼跳提供速度和位置参照。为考察这一预测机制在控制平滑追踪眼动和追赶性眼跳中的作用,研究者通常采取两种策略:一是要求被试追踪可预测性和不可预测性的运动刺激(Burke&Barnes,2008);二是在被试视觉追踪匀速运动目标过程中插入遮挡(Becker&Fuchs,1985)。
  研究者通过比较被试视觉追踪可预测性和不可预测性运动刺激时的脑区激活模式,发现视觉追踪可预测性运动目标导致前扣带回ACC和辅眼区SEF的激活增加,而视觉追踪不可预测性目标则导致DLPFC和IPS(intraparietal sulcus)的高水平激活(schmid,Rees,Frith,&Barnes,2001)口Burke和Barnes(2007;2008)的研究结果证实了这一结论。研究者推测,与可预测性运动追踪相比,不可预测性运动追踪要求被试投入更多的注意资源和工作记忆,而DLPFC在注意监控和视觉工作记忆中发挥至关重要的作用,因此表现出更强的 神经活动水平(Nagel et al.,2006)。此外,FEF在视觉引导的不可预测性眼动追踪中的激活强度显著大于记忆驱动的可预测性的眼动追踪(Braun,Boman,&Hotson,1996;Tanaka&Lisberger,2001)。而且,如果在被试开始追踪不可预测性运动目标时对FEF施加TMS则会严重影响追踪任务(Drew&van Donkelaar,2007)。
  在一个目标匀速运动的过程中插入距离不等的挡板,被试会根据遮挡之前已经建立的心理表征继续追踪。遮挡期间的运动追踪虽然没有网膜输入,却导致了FEF、SEF、PPC(posterior parietalcodex)和DLPFC等脑区的神经活动水平增加(Lencer et al.,2004)。FEF、SEF和顶叶的激活增加同样可以在可视运动追踪条件下被观察到,但是,可视条件下的运动追踪并没有诱发DLPFC的激活。这表明与视觉空间注意转换、视觉工作记忆等认知活动紧密相关的DLPFC对维持遮挡条件下的运动追踪具有十分重要的作用。Ding,Powell和Jiang(2009)也发现,遮挡条件下的运动追踪导致DLPFC和ACC的激活增加,而在可视追踪条件下DLPFC和ACC的神经元活动却受到抑制。研究者同时控制了“可利用的视觉线索(从无追踪线索到完整的追踪线索)”这一变量,发现随着视觉线索的可利用性逐渐增加,DLPFC和ACC的激活强度逐渐降低。此外,对于遮挡条件下以记忆为引导的运动追踪,FEF的神经活动随着追踪速度的降低而增加。
  Lenccr和Trillenberg(2008)在综合分析上述实验证据的基础上尝试建立可能的神经模型(见图2)。他们认为,视网膜图像信号经由早期视觉皮层投射到MT和MST区。MT和MST是负责运动知觉的关键脑区,在视觉运动追踪中的主要作用是整合网膜外系统输入的视觉运动信号,然后再将输出信息传递给FEF。FEF不仅参与眼动的启动和维持,还能预测运动轨迹的变化。而SEF和ACC主要参与瞬间运动计划、时间计算和路径预测;IPS和DLPFC则与注意反应选择和监控关系密切,尤其在不可预测性运动追踪中发挥更为重要的作用。
  3 问题与展望
  视觉运动追踪包括目标获取和运动追踪两个过程。目标获取阶段的主要任务是将目标与背景分离,集中注意力加工追踪目标;运动追踪阶段的主要任务是启动平滑追踪眼动和追赶性眼跳,并发挥行为水平、眼动水平和神经活动水平上的预测机制。两个过程都需要编码目标客体的运动信息和身份语义信息。视觉运动追踪过程中客体运动信息的加工特性已经获得了比较广泛的研究,而语义信息加工机制的研究还有待进一步加强。
  首先,视觉运动追踪的基本前提是获得追踪目标,为此视觉系统必须从复杂的环境背景中分离出运动目标。已有研究表明,背景刺激的运动方向、速度等特征会影响视觉运动追踪成绩(Spering&Gegenfurtner,2007a;2007b;2008)。但这些研究并没有考虑背景的语义类别在视觉运动追踪中的作用机制。未来研究应采取有效的实验范式,如时间遮挡范式和多目标追踪范式,从眼动水平和神经机制层面综合考察背景身份语义类别在视觉运动追踪中的地位作用。
  其次,目标所属的语义类别是否是视觉运动追踪中预测机制的一个信息源,目前只有少量行为层面的研究对此问题进行了初步考察(Reed&Vinson,1996;黄端,张侃,2008),不同语义类别客体对视觉运动追踪过程中眼动预测和神经预测机制的影响目前并不清楚。因此。研究者有必要结合眼动分析和脑成像等方法系统探讨目标语义信息与视觉追踪预测机制的关系,尤其是目标语义信息的激活程度和预测机制的内在关联性。在对运动客体进行语义分类时,需要综合比较各种分类标准。目前的研究大多根据“是否具有运动属性”将客体分为运动相关和运动无关两类,但是运动相关物体既包括生物体也包括非生物体,两类物体的视觉追踪特性可能存在重要差别。
  最后,关于目标语义信息和运动信息在视觉追踪过程中的整合机制,研究者可以从视觉运动信息的等级加工过程人手。已有研究表明,视觉系统以等级方式处理运动信息:局部运动加工对空间方向和局部速度进行检测和分析;整体运动加工则按照一定的规则对已经检测到的局部运动信号进行整合。当视觉系统追踪不同语义类别运动客体时,其等级加工方式可能因为目标语义类别的不同存在差异,生物性运动客体的等级加工方式还可能存在一些特殊机制,这些特征反映在眼动追踪水平和神经机制层面,需要研究者采取适当的研究范式进行考察。

标签:追踪 视觉 过程 加工