视觉计算理论
出处:按学科分类—哲学、宗教 上海教育出版社《心理学大辞典下卷》第1147页(768字)
视觉信息处理理论。
美国人工智能专家马尔1977年提出。该理论认为,视觉是一个多级的、自下而上的分析过程,在这个过程中产生一系列关于客体的不同表征,这些表征对有关的视觉环境提供越来越详细的信息。在客体视知觉过程中,产生三级不同水平的表征。
(1)初始素描。它对视觉输入中有关光线明暗度的变化提供一个二维的描述,包括边界、线条等几何光学特性的分析。这种表征是以观察者为中心的,即对视觉输入只是从观察者的角度来加以描述。
初始素描又可以分为粗略和详细两种水平。前者包含视觉场景中光线明暗度变化的信息;后者则是利用光线明暗变化的信息认同客体的数量和轮廓形状而形成的一种表征。
(2)2.5维素描。它利用阴影、轮廓、纹理、运动和双眼视差等提供的信息,构成一个关于视觉客体表面的深度和方位的描述。像初始素描一样,它也是以观察者为中心的,由于观察角度的不同,一个客体的表征可能会发生很大的变异。(3)三维模型表征。
它不依赖观察者的视见方式,从三个维度上描述了客体的形状及其相对位置,表现了实际物体的三维空间,人的视觉就是对三维表征的物体进行再认。马尔等人对一个三维模型表征提出了三条理想的标准:即可达性(指表征能建构起来的容易程度);作用域(表征适用一给定范畴内所有客体的程度)和唯一性(对一个客体的各种不同的观察,均产生同一标准的表征);稳定性(表征包含和体现同类各客体之间相似性的程度)和灵敏性(体现不同类客体之间主要差异的程度)。马尔主要从事人工智能的研究,力图用计算机模拟人的视觉过程,使机器实现人的立体视觉功能,他的视觉计算理论立足于计算机科学,并系统地概括了当时心理学、神经科学等方面的重要成就,其重要特征就在于使视觉信息处理的研究变得十分严密,把视觉研究从描述的水平提高到数理科学的研究水准。