欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    毕业设计(论文)基于大津法的人脸分割的研究.doc

    • 资源ID:3981216       资源大小:556KB        全文页数:33页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    毕业设计(论文)基于大津法的人脸分割的研究.doc

    目 录1 绪论1.1数字图像处理的发展现状21.2数字图像处理发展概况21.3数字图像处理主要研究的内容41.4数字图像处理的基本特点51.5数字图像处理的优点51.6数字图像处理的应用61.7数字图像分割技术发展状况82 数字图像分割基础2.1 数字图像分割的基础知识92.2 人脸图像分割的方法142.3 基于阈值分割方法比较193 大津法基础知识3.1 大津法的数学基础213.2大津法的最优阈值224 基于大津法的人脸分割处理4.1 预处理234.2 处理结果254.3 结果分析255 总结与展望28参考文献29致 谢31基于大津法的人脸分割的研究1 绪论人脸处理识别技术的研究开始于六十年代末七十年代初。近年来,随着计算机高速硬件和人工智能等技术的发展以及商业和执法等方面需求的增长,利用人脸图像进行自动识别和身份验证的研究和应用得到了空前的重视,并取得了长足的进步。很多科研机构,都先后在这个领域完成了相当成熟的实验系统。在美国经历恐怖袭击之后,美国各大机场均先后投入和使用了先进的人脸识别系统,用于识别嫌疑犯。我国在十六大召开期间,中科院研制的人脸识别系统作为一种辅助身份验证手段也投入了使用。从应用角度看,自动人脸识别除了可以用于身份识别和验证之外还可用于图像库的检索,根据用户需要,从一个人脸库中查找某一特定的人,在图像信息查询领域具有广泛的应用前景,可以大大提高工作效率。另外,人脸自动识别作为一种重要的个人身份鉴别方法,可以广泛地应用于公安部门的犯人档案管理、犯人辨认查找、刑侦破案、安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互系统、证件核对、保安监视、通道控制乃至银行自动出纳机等多种场合。虽然人类可以轻松识别不同的人脸,但其中的机理迄今为止科学家们还是没有彻底搞清楚,所以对于机器来说,处理并识别人脸是一件非常复杂的事情,它涉及到数字图像处理、模式识别、人工智能、生理和心理学等多方面的课题。造成这种困难的因素是多方面的。首先,人脸是一个存在部分变形的三维固体表面,因此人脸不是刚体,存在弹性形变。这使得人脸识别问题不同于普通物体的识别问题。其次,人脸是在不同的光照、面部表情、视角、年龄、是否戴眼镜、是否有脸部毛发和化妆品等条件下摄取的。因此一个实用的人脸识别系统,它应该能够处理脸部图像的这些变化,对于同一张脸,在不同的视角,不同的描述方法下,能够找出不变的特征量或者找出能恢复到正常状态下的特征量。人脸的自动识别因此也极具挑战性。可以说,到目前为止,还没有一个完全的解决方案可以在毫无约束的情况下出色地完成人脸识别任务。国内外研究现状在人脸分割算法方面,早期人脸识别的研究主要有两大方向【1】:一是提取人脸几何特征的方法,包括人脸部件规一化的点间距离和比率以及人脸的一些特征点,如眼角、嘴角、鼻尖、下巴等部位所构成的二维拓扑结构。其一是采用改进的积分投影法提取出用欧氏距离表征的维人脸特征矢量用于模式分类。二是模板匹配的方法,主要是利用大量已知人脸图像形成人脸分割和特征提取技术研究板,计算模板和图像灰度的自相关性来实现识别功能。近年来的一个趋势是将人脸的整体识别和特征分析的方法结合起来,如一提出的基于分析和整体的方法,提出的利用可变形模型来对人脸进行解释和编码的方法等等。国内关于人脸识别的研究始于二十世纪八十年代,主要是在国际流行方法基础上作了发展性研究工作。哈尔滨工业大学高文等提出一种处理多姿态人脸识别的多候选类加权识别方法,并对彩色图像的人脸跟踪和识别也进行了大量研究。清华大学张长水等对特征脸的方法作了进一步发展,提出了采用类间散布矩阵作为产生矩阵,进一步降低了产生矩阵的维数,在保持识别率的前提下降低了运算量。上海交通大学李介谷等专门研究人脸斜视图像的集合特征提取与恢复。他们还研究了基于计算机视觉场模型的人脸识别技术。东南大学何振亚等采用对称主元分析神经网络,用去冗余和权值正交相结合的方法对人脸进行特征提取和识别。比较好的实现了大量人脸样本存储和人脸的快速识别。1.1数字图像处理的发展现状 数字图像处理(digital image processing)是用计算机对图像信息进行处理的一门技术,使利用计算机对图像进行各种处理的技术和方法。 20世纪20年代,图像处理首次得到应用。20世纪60年代中期,随电子计算机的发展得到普遍应用。60年代末,图像处理技术不断完善,逐渐成为一个新兴的学科。利用数字图像处理主要是为了修改图形,改善图像质量,或是从图像中提起有效信息,还有利用数字图像处理可以对图像进行体积压缩,便于传输和保存。数字图像处理主要研究以下内容:傅立叶变换、小波变换等各种图像变换;对图像进行编码和压缩;采用各种方法对图像进行复原和增强;对图像进行分割、描述和识别等。随着技术的发展,数字图像处理主要应用于通讯技术、宇宙探索遥感技术和生物工程等领域。 数字图像处理因易于实现非线性处理,处理程序和处理参数可变,故是一项通用性强,精度高,处理方法灵活,信息保存、传送可靠的图像处理技术。主要用于图像变换、测量、模式识别、模拟以及图像产生。广泛应用在遥感、宇宙观测、影像医学、通信、刑侦及多种工业领域。1.2数字图像处理发展概况数字图像处理(Digital Image Processing)又称为计算机图像处理【2】,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学工程、工业分割、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域。1.3数字图像处理主要研究的内容数字图像处理主要研究的内容有以下几个方面【3】:(1) 图像变换由于图像阵列很大,直接在空间域中进行处理,涉及计算量很大。因此,往往采用各种图像变换的方法,如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。 (2)图像编码压缩图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。编码是压缩技术中最重要的方法,它在图像处理技术中 是发展最早且比较成熟的技术。(3) 图像增强和复原图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立"降质模型",再采用某种滤波方法,恢复或重建原来的图像。(4) 图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。 (5)图像描述是图像识别和理解的必要前提。作为最简单的二值图像可采用其几何特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区域描述两类方法。对于特殊的纹理图像可采用二维纹理特征描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。 (6) 图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。1.4数字图像处理的基本特点(1)目前,数字图像处理的信息大多是二维信息,处理信息量很大。如一幅256×256低分辨率黑白图像,要求约64kbit的数据量;对高分辨率彩色512×512图像,则要求768kbit数据量;如果要处理30帧/秒的电视图像序列,则每秒要求500kbit22.5Mbit数据量。因此对计算机的计算速度、存储容量等要求较高。(2)数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高,这就对频带压缩技术提出了更高的要求。(3)数字图像中各个像素是不独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般说还要大些。因此,图像处理中信息压缩的潜力很大。(4)由于图像是三维景物的二维投影,一幅图象本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。(5)数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大。由于人的视觉系统很复杂,受环境条件、视觉性能、人的情绪爱好以及知识状况影响很大,作为图像质量的评价还有待进一步深入的研究。另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究。例如,什么是感知的初始基元,基元是如何组成的,局部与全局感知的关系,优先敏感的结构、属性和时间特征等,这些都是心理学和神经心理学正在着力研究的课题。1.5数字图像处理的优点(1) 再现性好。数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的再现。 (2)处理精度高。按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。对计算机而言,不论数组大小,也不论每个像素的位数多少,其处理程序几乎是一样的。换言之,从原理上讲不论图像的精度有多高,处理总是能实现的,只要在处理时改变程序中的数组参数就可以了。回想一下图像的模拟处理,为了要把处理精度提高一个数量级,就要大幅度地改进处理装置,这在经济上是极不合算的。 (3)适用面宽。图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、射线图像、超声波图像或红外图像等)。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像(彩色图像也是由灰度图像组合成的,例如RGB图像由红、绿、蓝三个灰度图像组合而成)组合而成,因而均可用计算机来处理。即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。(4)灵活性高。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。由于图像的光学处理从原理上讲只能进行线性运算,这极大地限制了光学图像处理能实现的目标。而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。1.6数字图像处理的应用图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。 (1) 航天和航空技术方面的应用数字图像处理技术在航天和航空技术方面的应用,除了上面介绍的JPL对月球、火星照片的处理之外,另一方面的应用是在飞机遥感和卫星遥感技术中。许多国家每天派出很多侦察飞机对地球上有兴趣的地区进行大量的空中摄影。对由此得来的照片进行处理分析,以前需要雇用几千人,而现在改用配备有高级计算机的图像处理系统来判读分析,既节省人力,又加快了速度,还可以从照片中提取人工所不能发现的大量有用情报。从60年代末以来,美国及一些国际组织发射了资源遥感卫星(如LANDSAT系列)和天空实验室(如SKYLAB),由于成像条件受飞行器位置、姿态、环境条件等影响,图像质量总不是很高。因此,以如此昂贵的代价进行简单直观的判读来获取图像是不合算的,而必须采用数字图像处理技术。如LANDSAT系列陆地卫星,采用多波段扫描器(MSS),在900km高空对地球每一个地区以18天为一周期进行扫描成像,其图像分辨率大致相当于地面上十几米或100米左右(如1983年发射的LANDSAT-4,分辨率为30m)。这些图像在空中先处理(数字化,编码)成数字信号存入磁带中,在卫星经过地面站上空时,再高速传送下来,然后由处理中心分析判读。这些图像无论是在成像、存储、传输过程中,还是在判读分析中,都必须采用很多数字图像处理方法。现在世界各国都在利用陆地卫星所获取的图像进行资源调查(如森林调查、海洋泥沙和渔业调查、水资源调查等),灾害分割(如病虫害分割、水火分割、环境污染分割等),资源勘察(如石油勘查、矿产量探测、大型工程地理位置勘探分析等),农业规划(如土壤营养、水份和农作物生长、产量的估算等),城市规划(如地质结构、水源及环境分析等)。我国也陆续开展了以上诸方面的一些实际应用,并获得了良好的效果。在气象预报和对太空其它星球研究方面,数字图像处理技术也发挥了相当大的作用。 (2)生物医学工程方面的应用数字图像处理在生物医学工程方面的应用十分广泛,而且很有成效。除了上面介绍的CT技术之外,还有一类是对医用显微图像的处理分析,如红细胞、白细胞分类,染色体分析,癌细胞识别等。此外,在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。 (3)通信工程方面的应用当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。具体地讲是将电话、电视和计算机以三网合一的方式在数字通信网上传输。其中以图像通信最为复杂和困难,因图像的数据量十分巨大,如传送彩色电视信号的速率达100Mbit/s以上。要将这样高速率的数据实时传送出去,必须采用编码技术来压缩信息的比特量。在一定意义上讲,编码压缩是这些技术成败的关键。除了已应用较广泛的熵编码、DPCM编码、变换编码外,目前国内外正在大力开发研究新的编码方法,如分行编码、自适应网络编码、小波变换图像压缩编码等。 (4)工业和工程方面的应用在工业和工程领域中图像处理技术有着广泛的应用,如自动装配线中分割零件的质量、并对零件进行分类,印刷电路板疵病检查,弹性力学照片的应力分析,流体力学图片的阻力和升力分析,邮政信件的自动分拣,在一些有毒、放射性环境内识别工件及物体的形状和排列状态,先进的设计和制造技术中采用工业视觉等等。其中值得一提的是研制具备视觉、听觉和触觉功能的智能机器人,将会给工农业生产带来新的激励,目前已在工业生产中的喷漆、焊接、装配中得到有效的利用。 (5)军事公安方面的应用在军事方面图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸鉴别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。 (6)文化艺术方面的应用目前这类应用有电视画面的数字编辑,动画的制作,电子图像游戏,纺织工艺品设计,服装设计与制作,发型设计,文物资料照片的复制和修复,运动员动作分析和评分等等,现在已逐渐形成一门新的艺术-计算机美术。1.7数字图像分割技术发展状况图像分割是数字图像分析中的重要环节,在整个研究中起着承前启后的作用,它既是对所有图像预处理效果的一个检验,也是后续进行图像分析与解译的基础。因此,对于图像分割的研究在过去的几十年里一直受到人们广泛的重视,也提出了数以千计的不同算法。虽然这些算法大都在不同程度上取得了一定的成功,但是图像分割问题还远远没有解决,这方面的研究仍然面临很多挑战。迄今为止,没有一个分割方法能够对任何图像都取得一致的良好效果,也不是所有算法都能在某一个图像上得到同样良好的效果。并且,由于缺乏一个统一的理论体系,也没有一个方法来指导我们如何根据图像选择合适的分割算法。更有甚者,也不存在一种被广泛接受的方法,能够对不同的分割结果给出与主观感觉一致的评价。传统的值化算法仅仅使用像素点的灰度级信息,因而要求图像中的目标和背景在灰度级上是可分的。因此,在解决一些实际的图像分割问题时,我们往往难于找到合适的算法。即使找到一些算法,每个算法也只适用于部分图像。有鉴于此,本文首先针对具体的图像分析任务,研究了对于人脸图像的分割技术,尝试了使用不同的分割算法解决图像分割。2 数字图像分割基础2.1 数字图像分割的基础知识通常,我们研究的图像有光强度(LightIntensity一LI)图像,深度图像(RangeImage-RI),核磁共振图像(Magnetic Resonance Image一MRI)和热图像(Thermal Image)等【4】。任何图像都可以被视为一个二元函数f(x,y),其中(x,y)表示空间坐标,而f(x,y)表示在(x,y)处的特征取值,该特征可以是光强度、深度、辐射强度或者温度等。对f(x,y)的空间坐标和特征取值进行量化就得到一个定义在二维网格上的离散函数f(i,j),这就是我们常见的数字图像。所有的数字图像可以被统一的表示为: (2.1)其中,MxN表示图像大小,(i,j)表示图像上任意像素的坐标,f(i,j)G=0,1,k,L-1表示(i,j)处像素的特征值水平。光强度图像是我们日常生活中最常见的一种图像,灰度光强度图像也是本文中最主要的研究对象,所以,我们通常使用f(i,j)来表示像素的灰度值。图像分割是按选定的一致性属性准则,将图像正确划分为互不交迭的区域集的过在一组相互连通的像素点上的一致性谓词,那么图像分割就是将集合X划分成一组连通子集。并且这一划分必须满足下述四个条件: (2.2) 对所有 (2.3) 对所有 (2.4) 对所有;,相邻 (2.5) 在对计算机视觉的研究中,图像分割是连接低级视觉和高级视觉的桥梁和纽带,图像分割的结果既取决于低级视觉中各种预处理的效果,又决定了高级视觉中的各种应用中最终输出的质量。因此,图像分割是大多数视觉系统中最为关键和重要的一个环节网【5】。在过去的四十多年里,图像分割的研究一直受到人们高度的重视。迄今为止,研究者们已经提出了上千种各种类型的分割算法,而且近年来每年都有上百篇相关研究成果发表。但是,现有的方法多是为特定应用设计的,有很大的针对性和局限性,对图像分割的研究还缺乏一个统一的理论体系。Fu和Mui【6】从细胞学图像处理的角度将图像分割技术分为三大类:特征闽值或聚类、边缘分割和区域提取。一个更加细致的分类里,Haralick and shapiro【7】将所有算法分为6类:测度空间导向的空间聚类、单一连接区域生长策略、混合连接区域生氏策略、中心连接区域生长策略、空间聚类策略和分裂合并策略。依据算法所使用的技术或针对的图像PalandPal也把图像分割算法分成了6类:阈值分割、像素分割、深度图像分割、彩色图像分割、边缘分割和基于模糊集的方法。但是,该分类方法中,各个类别的内容是有重叠的。为了涵盖不断涌现的新方法,有的研究者将图像分割算法分类以下6类:并行边界分割技术、串行边界分割技术、并行区域分割技术、串行区域分割技术、结合特定理论工具的分割技术和特殊图像分割技术。而在较近的一篇综述中,更有学者将图像分割简单的分割数据驱动的分割和模型驱动的分割两类【8】。2.1.1基于颜色特征的人脸分割按照人脸颜色特征,人脸分割方法可以分为基于肤色特征的人脸分割和基于灰度特征的人脸分割。肤色是人脸的重要信息,不依赖于面部细节特征。对于旋转、表情等变化都适用,具有相对的稳定性并且能与大多数背景物体相区别。因此肤色特征在人脸分割中是最常用的一种特征。肤色特征主要由肤色模型描述,肤色模型与色度空间(Chrominance Space)的选择密切相关。色度空间选择可以从两个方面进行考察:一是该色度空间中能否表示模型所描述“肤色”区域的分布;二是该色度空间能否减少“肤色”与“非肤色”区域重叠程度【9】。人脸分割常用的色度空间主要有:红、绿、蓝三基色【10】(RGB)、亮度归一化的三基色【11】(rgb)、色调、饱和度、亮度【12】(HSI)、NTSC制的亮度和色度模型【13】(YIQ)、PAL制的亮度和色度模型【14】(YUV)、CCIR601编码方式的色度模型、YCbCr【15】(在数学上与YUV等价)和国际照明委员会提出的基于色度学的彩色模型(CIEL*a*b)等。常用的肤色模型有高斯模型、混合高斯模型和直方图模型。Terrillon等考察了归一化的r-g、CIE-xy、TSL、CIE-DSH、HSV、YIQ、YES、CIE-L*u*v和CIE-L*a*b九种色度空间,比较了高斯模型和混合高斯模型在不同色度空间中的性能,发现除了少数情况外,使用混合高斯模型能较好地描述肤色区域分布。同时指出,最终限制分割性能的因素是不同色度空间中“肤色”与“非肤色”区域的重叠程度。Jones等研究了RGB空间中“肤色”与“非肤色”区域的分布,根据标定出肤色区域的近二万幅图片(包含约二十亿个像素)建立了三维直方图,在此基础上比较了直方图模型和混合高斯模型,发现前者的性能略好于后者。除上述三种肤色模型外,还有直接利用几何参数描述肤色区域分布范围模型、三维投影模型、基于神经网络的肤色模型等。此外也有同时考虑“肤色”与“非肤色”区域分布的贝叶斯概率模型。对于彩色图像,首先根据肤色模型进行肤色分割,分割出肤色区域后根据在色度上的相似性和空间上的相关性分割出可能的人脸区域,再利用区域的几何特征或灰度特征验证该区域是否是人脸,其目的是排除类似肤色的物体。区域分割与人脸验证在许多人脸分割算法中是密切结合、统一考虑的。2.1.2基于启发式模型人脸分割基于启发式模型的人脸分割首先抽取几何形状、灰度、纹理等特征,然后检验它们是否符合人脸的先验知识。Govindaraju【16】等使用变形模板(DeformableTemplate)匹配头顶轮廓线和左右两条面颊轮廓线进行人脸分割。Yang【17】等提出了基于镶嵌图的人脸分割,将人脸五官区域分别划分为4×4和8×8马赛克块,使用一组规则进行检验,并且利用边缘特征进一步验证。卢春雨【18】等对镶嵌图方法进行改进,将人脸按照人脸器官的分布划分为3×3马赛克块,在分割中自适应地调整各块大小,使用灰度和梯度统计特征的知识规则检验该区域是否为人脸,取得了较好的分割结果。由于人脸器官具有较为恒定的模式,一些方法首先分割出人脸器官或局部特征,然后根据它们的相对位置关系判断整个区域是否为人脸。2.1.3基于统计模型的人脸分割基于统计模型的人脸分割将人脸和非人脸看作模式,使用大量的“人脸”与“非人脸”样本训练、构造分类器,通过判别图像中所有可能区域属于哪类模式的方法实现人脸的分割。主要有基于特征空间、人工神经网络、概率模型和支持向量机的人脸分割。基于统计模型的人脸分割一般是通过对大量人脸样本和非人脸样本地学习得到一组模型参数,然后利用模型参数分割人脸。为了分割大小不同的人脸,通常采用由粗到细的分级策略进行处理。对每个分级图像,采用一个固定大小的窗口,通过滑动窗口抽取图像上的不同区域,进行光照校正、直方图修正等预处理后再进行判决。最后需要合并同一位置上多个不同分级分割到的人脸区域。该算法分割到的最小人脸图像由所用窗口的大小决定。为了准确的分割人脸,需要非人脸样本,但非人脸样本一般不易直接获得。自举(Bootstrap)的方法常被采用获得人脸的样本和非人脸样本,即首先收集较多的非人脸样本和足够多的人脸样本,用这些样本训练某个分类器,然后用训练好的分类器对大量的非人脸样本进行判决,判决错误的样本作为新的样本插入到训练集中。重复多次以收集到足够多的典型非人脸样本。对于人脸样本,必要时也可运用自举策略。另外,通过平面内旋转、缩放、亮度变化等方法可以直接从每个人脸图像生成多个变化的人脸图像,以得到足够多的训练人脸图像,这也叫基于图像的生成策略。采用三维人脸模型可以很容易地得到各种姿态和光照变化的训练图像。基于特征空间的方法将人脸区域图像变换到某一特征空间,根据其在特征空间中的分布规律划分“人脸”与“非人脸”两类模式。主分量分析(PrincipalComponent Analysis,PCA)是一种常用的方法。它根据图像的统计特性进行正交变换(K-L变换),消除原有分量间的相关性,变换得到对应特征值依次递减的特征向量(特征脸)。Turk等提出采用PCA方法分割人脸。当重构图像与原分割区域的信噪比大于某一阈值时,该分割区域被判决为人脸图像。这种方法被称为DFFS(Distance From Feature Space)方法。基于统计模型的人脸分割具有很大的优越性。但是统计模型的建立需要较为一致的模式,因而使用的特征一般仅限于人脸的五官区域。但是有一些“人脸”与“非人脸”样本即使是人也较难区分。这说明在此分辨率下五官区域的信息对于辨识人脸仍然是不够的。由于受图像质量、分割速度等因素的约束,提高分割窗口图像的分辨率又很困难。“非人脸”样本的多样性和不易界定性是统计方法的难题。“自举”方法是收集原分类器错分样本并添加到“非人脸”样本中迭代训练的方法,但是不加约束的“非人脸”样本空间庞大、所需迭代次数多、收敛十分困难。问题的症结在于没有考虑“人脸”及“非人脸”在图像空间中的子空间特性,如果能够有效地设计一个滤波器将绝大部分“非人脸”滤掉,就可以显著地改变目前的困境。2.1.4基于概率模型的人脸分割基于概率模型方法是计算输入图像区域属于人脸模式的后验概率,对所有可能的图像窗口进行判别。Schneiderman等【19】通过估计人脸和非人脸图像的条件概率分割人脸。将样本区域划分成多个相互覆盖的子区域(16个子区域),人脸或非人脸子区域的条件概率以及人脸图像各位置上的子区域的条件概率由直方图统计分析得到,而非人脸图像的各位置上的子区域的类条件概率采用均匀分布。为了简化计算,没有考虑子区域之间的相关性和分级之间的相关性。最后根据最大似然比分割人脸。2.1.5弹性图匹配的人脸分割 弹性图匹配方法是用拓扑图的“距离”来表示人脸相似度。Lanitis【20】提出了形状和灰度分离的模型。该模型从形状、总体灰度、局部灰度分布等方面来描述一个人脸。形状特征子空间分离与表情相关的参数,形状和灰度分离的模型用于三维姿态复原、身份识别、性别识别、表情识别以及人脸重构均取得一定的效果。 弹性匹配方法优于KL变换的方法主要是因为拓扑图的顶点采用了小波变换特征。小波变换对光照、变换、尺寸和角度具有一定的不变性。弹性图匹配能保留二维图像的空间相关性信息,而特征脸方法在将图像排成一维向量后丢失了很多空间相关性信息。如向人脸库中加入新的人脸时,由于不能保证已有特征脸的通用性,因而有可能需要重新计算特征脸;而对于弹性匹配方法,则不需要改变已有的数据,通过直接加入新的模板数据即可。但计算较复杂是弹性图匹配的一大缺点。针对这一缺陷,从两方面进行改进:一是降低计算复杂度,即对表达人脸的二维矢量场进行特征压缩和提取;二是减少冗余信息,即将所提取出来的低层次特征和高层次特征(如眼睛,鼻端的位置等)结合起来,以突出关键点的识别地位。2.1.6特征脸的人脸识别弹性图匹配保留二维图像的空间相关性信息,特征点的稳定提取要求人脸图像质量较高。特征脸识别方法是将表达人脸信息的大量图像数据降维后进行模式分类。特征脸识别方法主要有基于KL变换的特征脸识别方法。KL变换在90年代初受到了很大的重视,用于人脸识别也取得了很好的效果,其识别率从70-100%不等,这取决于人脸图像的质量。特征脸法将图像看作具有一定分布的随机向量。人脸总体结构具有相似性,通过主成分分析法可以得到人脸图像分布的主分量方向,用人脸图像的主分量来表示人脸。忽略了人脸的几何拓扑关系和人脸的局部特征,当光照、姿态等发生变化时,其识别率显著下降。从能量压缩的角度来看,KL变换是最优的。但由于KL变换的生成矩阵是训练样本的散布矩阵,KL变换的最大特征向量是训练样本的主要分布,是图像的统计而不是人脸的统计,因此它并不具有很好的人脸辨别能力。它仅仅考虑图像之间的所有差异,而无论这样的差异是由照明、发型变更或背景均被认为是人脸的差异。传统特征脸识别中特征值大的特征向量(特征脸)并不一定具有最好的分类性能,而且对KL变换而言,外在因素带来的图像差异和人脸本身带来的差异是无法区分的,特征脸在很大程度上反映了光照等差异。实验表明,随着光照、角度和人脸尺寸等因素的引入,特征脸识别的识别率急剧下降,因此特征脸识别还存在着理论的缺陷。2.1.7基于隐马尔科夫模型的人脸分割隐马尔科夫模型(Hidden Markov Model,HMM)是用于描述信号统计特性的一组统计模型。使用马尔科夫链来模拟信号统计特性的变化,而这种变化又是间接地通过观察序列来描述的,隐马尔科夫过程是一个双重的随机过程。在HMM中节点表示状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征不同状态表现出这一特征的概率不同。由于HMM是一个统计模型,因此对于同一特征序列可能会对应于许多状态序列,特征序列与状态序列之间的对应关系是非确定的。这种模型对于状态序列来说是隐含的称为隐马尔科夫模型。2.2 人脸图像分割的方法从细胞学图像处理的角度将图像分割技术分为三大类:特征阈值或聚类、边缘分割和区域提取。一个更加细致的分类里,将所有算法分为类测度空间导向的空间聚类、单一连接区域生长策略、混合连接区域生氏策略、中心连接区域生长策略、空间聚类策略和分裂合并策略。依据算法所使用的技术或针对的图像,也把图像分割算法分成了类值分割、像素分割、深度图像分割、彩色图像分割、边缘分割和基于模糊集的方法。但是,该分类方法中,各个类别的内容是有重叠的。为了涵盖不断涌现的新方法,有的研究者将图像分割算法分类以下类并行边界分割技术、串行边界分割技术、并行区域分割技术、串行区域分割技术、结合特定理论工具的分割技术和特殊图像分割技术。而在较近的一篇综述中,更有学者将图像分割简单的分割数据驱动的分割和模型驱动的分割两类。我们将图像分割算法分为基于阈值的分割技术、基于边缘的分割技术、基于区域特性的分割技术和基于统计模式分类的分割技术四类,并分别简述其研究现状。2.2.1基于阈值的分割技术 这类方法简单实用,在过去的几十年间备受重视,其分类也不一而足。根据使用的是图像的整体信息还是局部信息,可以分为上下文相关(contextual)方法和上下文无关(non一contextual)方法;根据对全图使用统一阈值还是对不同区域使用不同阈值,可以分为全局阈值方法(global thresholding)和局部阈值方法(localthresholding),也叫做自适应阈值方法(adaptive thresholding);另外,还可以分为单阈值方法(bilever thresholding)和多阈值方法(multi thresholding)【21】。阈值分割的核心问题是如何选择合适的阈值。其中,最简单和常用的方法是从图像的灰度值方图出发,先得到各个灰度级的概率分布密度,再依据某一准则选取一个或多个合适的阈值,以确定每个像素点的归属。选择的准则不同,得到的阈值化算法就不同。其中,常见的有如下几种:表1.1常见的基于直方图的阈值分割方法准则阈值化方法优点缺点分割得到的目标和背景的概率应该等于其先验概率P-分位数(p-tile)法无需任何迭代和搜索严重依赖对先验概率的

    注意事项

    本文(毕业设计(论文)基于大津法的人脸分割的研究.doc)为本站会员(仙人指路1688)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开