视觉注意模型
科技广场2010.5
某种能够引起观察者注意的特殊属性,因此可通过建立视觉isualAttentionModel)来提取图像中显著注意力模型(V
度较高的区域作为显著区。
1.1视觉注意力模型
Itti[4]模型和Stentiford模型是目前较为著名的注意力模型。Itti是南加州大学的Itti等人提出的一种自底向上的、基于图像底层特征的图像显著模型,结合颜色(col-or)、方向(oritentaion)、亮度(intensity)各维上的关注融合得到显著区域;Stentiford注意力模型[5]图,通过分析、是由伦敦大学的Stentiford提出的,他用注意力图(VisualAttentionMap,VAMap)表示图像的显著性,通过在区域中以某点为中心,一定半径范围内的其他像素进行相同像素匹A值为与之匹配的像素个数,值越小的区域认配,像素点的V为其显著程度越高,最后抑制图像中具有相同模式的区域得到VA图。
1.2显著区域提取
在Itti模型中,图像中对象的大小被限制在全图的5%以下,得到的显著区域较小且产生的显著图与人眼实际观察到的显著区不相符;而Stentiford模型中,由于所用的VA区较大,当区域与周围相比显著性不够强时,结果会不理想。本文采用文献[6]、[7]中Marques等人提出的方法,结合Itti和Stentiford模型进行显著区域提取。其基本思想是,对一幅图像,分别用Itti和Stentiford模型处理得到A图,并对它们进行二值化等处理以得到注意点显著区和V
和注意区,再将注意点和注视区相结合得到掩模图,最后把掩模图与原始图相与,即可得到图像的显著区域。Marques提出的方法能有效地提取图像中的多个显著区域,如图二所示。
1.3显著区域特征描述
纹理、形状等特征进传统的CBIR通常采用图像的颜色、
行检索,具有一定的局限性。颜色直方图丢失了颜色的空间信息,具有相同颜色统计信息但分布不同的图像通常被认为是相同图像;纹理只针对于某些具有丰富纹理的图像有较好反射等条件的影响较大,适用范围有限且不的效果,受光照、易提取;形状特征符合人类视觉的认知,但形状特征的获得常常依赖于较为精准的图像分割技术,并且目前对形状的描文中采用述缺乏一个完整的数学模型。为了克服以上缺点,一种具有优秀仿射不变性特征的Sift描述子来表达显著区域特征。
1.3.1显著区域Sift特征点提取及匹配
Sift是DavidLowe于2004年提出的一种局部特征描对旋转、尺度缩放、亮度变化具有不变性,且述算子向量[8],
独特性好,即使少数的几个物体也可以产生大量的Sift特征向量。
Sift特征点的提取分为四个步骤:①检测尺度空间极值点;②精确定位极值点;③为特征点分配方向值;④生成特征描述算子。
在各级尺度空间对图像进行亚采样,得到一系列金字塔高斯卷积核是实现尺度变换的唯一变换核,定义如下:图像。
(1)
其中,σ代表了高斯正态分布的方差。一幅二维图像在不同的尺度空间表示可由图像与高斯核卷积得到:
L(x,y,σ)=G(x,y,σ)*I(x,y)
(2)
为了有效地在尺度空间检测到稳定的关键点,一般采用高斯差分尺度空间(DOGscale-space)。DOG算子如下式所示:
D(x,y)=(G(x,y,σ)-G(x,y,σ))*I(x,y)=L(x,y,σ)-L(x,y,σ)
(3)
OG空间,如果像素点为局部极值点,则它必在相邻的D
须与其周围的26个像素(上一级尺度的9个点+同尺度的8个点+下一个尺度的9个点)相比为极值点。所有这些局
(a)原图(b)掩模图
部极值点构成了Sift候选关键点的集合,通过过滤去除不稳定的特征点后得到图像中所有的关键点。利用这些关键点领域像素的梯度方向分布特征为每个关键点制定方向参数,使算子具备旋转不变性。每个检测到的关键点有三个信息:位置(location)、所处尺度(scale)、方向(orientation),三个参数分别表示位置、尺度和方向信息。
1.3.2Sift特征点匹配
(c)显著区域
图二
融合Itti和Stentiford
的显著区域提取
一幅图像中通常会生成大量的Sift特征点,且每个点特征向量维数较高(128维),考虑到检索的速度,
采用主成
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库一种基于视觉注意模型的图像检索方法(2)在线全文阅读。
相关推荐: