资料介绍
字符识别属于模式识别的范畴,通常的字符识别方法可分为2类:基于字符结构(笔画特征)的结构识别和基于字符统计特征的统计识别。结构模式识别方法的优点是可以识别复杂的模式,缺点是需要进行笔画特征的提取,在输入图像质量不佳的情况下,这一点往往难以做到。在统计模式识别方法中,特征提取方便,识别速度与识别对象无关,但需要得到字符集的稳定特征,且在字符笔画较多时要求的特征量非常大。二种识别方法各有优缺点。
人类的视觉感知系统是一个鲁棒性很强的、能抵御实际中可能遇到的各种变形和噪声干扰的文字识别系统。人们的认字过程实际上是对汉字整体形象的把握,是对汉字图像全局的处理过程[1]。因而,汉字的整体 信息在无笔顺识别中起着无法替代的重要作用。
统计模式识别借助概率论的知识,判断或决策对象的特征类别,使得决策的错误率达到最小。基于统计特征的识别方法先抽取识别对象的稳定特征,组成特征矢量,然后在字符集的特征空间中进行特征匹配。基于以上认识,在分析汽车牌照中汉字字符的特点后,采用了有别于结构分析的一种基于字符图像特征统计的模式识别方法进行汉字识别。同时针对统计方法无法区分的相似汉字,提取其微结构信息进行特殊的校正识别。
1 特征统计匹配
统计决策论其要点是提取待识别模式的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决[2]。汉字的统计模式识别是将字符点阵看作一个整体,从该整体上经过大量统计得到所用特征,用尽可能少的特征模式来描述尽可能多的信息。所采用的方法有:特征统计的方法、整体变换分析法[3]、几何矩特征、笔划密度特征、字符投影特征、外围特征、微结构特征和特征点特征等。这些方法都具有各自的优缺点,应根据具体应用进行选取。主要方法有外围面积特征匹配法和网格特征匹配法。外围面积特征反映了字符的轮廓信息。外围面积特征提取法,主要是从周围形状的心理学知识来获得汉字信息的特征,即对文字周围上下左右的形状进行量化,从而构造特征向量。网格特征实际是结构模式识别和统计模式识别相结合的产物。字符图像被均匀或非均匀地划分为若干区域,称之为“网格”。在每个网格内寻找各种特征,如目标面积比例、交叉点、笔划端点的个数、细化后的笔划长度和笔划密度等。特征统计以网格为单位,即使个别点统计有误差也不会造成大的影响,从而增强了特征的抗干扰性。因此这种方法得到日益广泛的应用。在实际的车牌汉字识别中,当相同汉字的二值图形变动较小时该方法较有效。具体应用:将尺寸为34×66象素的汉字二值图均匀分成32个正方形的小区域(不考虑外边框的1个象素),统计每个8×8的小区域内目标象素(白色)所占的面积比例,就得到了归一化的32维特征矢量。统计多幅相同汉字的32维特征矢量,取均值作为该汉字的标准网格特征模板。识别时,计算待识别汉字的32维网格特征矢量与模板矢量之间的Euclid距离,求得最小距离值,其对应的汉字即为识别结果。在具体应用中,由于外部原因常常会出现字符模糊、字符倾斜的情况,而网格特征匹配方法对字符模糊和倾斜较敏感,因此鲁棒性不是很强,不适合实际应用。
2 模板匹配
考虑到以上2种主要识别方法存在的弊端,决定选用模板匹配的 算法进行字符的识别。实际研究中发现,二值化的图形模板虽然直观,但其匹配计算过程过于简单直接,对倾斜、形变、残损、模糊的待识别字符匹配误差较大,因此鲁棒性较差。而灰度模板由于色彩、光照等因素影响,难以找到普遍适用的模板形式实现直接的匹配计算。综合以上二方面的问题,在引入统计模式识别思想的基础上,提出了基于二值图形变动分析的模糊模板匹配方案。
2.1 基于二值图形变动分析的模糊模板匹配
在含有汽车牌照的图像中,将汉字定位并提取出来以后,还要完成 规格化、二值化等操作。即使是相同的汉字,由于车牌倾斜、模糊,特别是由于每次定位不可能完全精确一致等诸多因素的影响,导致在二值图中字体的形状、大小都会不同,字体位置也会发生不同程度的偏移。将这种二值图形的不规则现象称为图形的变动。在汉字识别的分析过程中,希望对图形变动的大小进行量化处理。因此,提出了求图形整体变动量的统计方法,其优点是不需要参照标准图形,可以进行客观评价,并构造出用于匹配识别的模糊模板。
对每一个车牌的汉字字符,选取n幅质量较好的参考图。将这n幅参考图规格化为17×33的标准大小后进行二值化处理,得到标准参考图fi(x,y)。因此每个车牌汉字字符都有n幅由0、1所组成的二值图像。将这n幅二值图像对齐后叠加,再进行归一化。得到的模糊图形F(x,y)。四个汉字的模糊图形模板(不同方向的视觉效果)如图1所示。
该模糊图形上每一象素点实际上都对应着一个概率值,该概率值代表白色目标(汉字笔划)在该点出现的可能性。例如在模糊模板中若某一点值为1,表明在所有参加统计的二值图形上汉字笔划都经过该点,其为白色目标象素的可能性是100%,为黑色背景象素的可能性是0;反之亦然。进行匹配识别时,对一幅切分后的待识别汉字灰度图,将其规格化、二值化,然后计算每一象素点与模板的吻合程度,即每一象素点正确匹配的置信度con(x,y)。
人类的视觉感知系统是一个鲁棒性很强的、能抵御实际中可能遇到的各种变形和噪声干扰的文字识别系统。人们的认字过程实际上是对汉字整体形象的把握,是对汉字图像全局的处理过程[1]。因而,汉字的整体 信息在无笔顺识别中起着无法替代的重要作用。
统计模式识别借助概率论的知识,判断或决策对象的特征类别,使得决策的错误率达到最小。基于统计特征的识别方法先抽取识别对象的稳定特征,组成特征矢量,然后在字符集的特征空间中进行特征匹配。基于以上认识,在分析汽车牌照中汉字字符的特点后,采用了有别于结构分析的一种基于字符图像特征统计的模式识别方法进行汉字识别。同时针对统计方法无法区分的相似汉字,提取其微结构信息进行特殊的校正识别。
1 特征统计匹配
统计决策论其要点是提取待识别模式的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决[2]。汉字的统计模式识别是将字符点阵看作一个整体,从该整体上经过大量统计得到所用特征,用尽可能少的特征模式来描述尽可能多的信息。所采用的方法有:特征统计的方法、整体变换分析法[3]、几何矩特征、笔划密度特征、字符投影特征、外围特征、微结构特征和特征点特征等。这些方法都具有各自的优缺点,应根据具体应用进行选取。主要方法有外围面积特征匹配法和网格特征匹配法。外围面积特征反映了字符的轮廓信息。外围面积特征提取法,主要是从周围形状的心理学知识来获得汉字信息的特征,即对文字周围上下左右的形状进行量化,从而构造特征向量。网格特征实际是结构模式识别和统计模式识别相结合的产物。字符图像被均匀或非均匀地划分为若干区域,称之为“网格”。在每个网格内寻找各种特征,如目标面积比例、交叉点、笔划端点的个数、细化后的笔划长度和笔划密度等。特征统计以网格为单位,即使个别点统计有误差也不会造成大的影响,从而增强了特征的抗干扰性。因此这种方法得到日益广泛的应用。在实际的车牌汉字识别中,当相同汉字的二值图形变动较小时该方法较有效。具体应用:将尺寸为34×66象素的汉字二值图均匀分成32个正方形的小区域(不考虑外边框的1个象素),统计每个8×8的小区域内目标象素(白色)所占的面积比例,就得到了归一化的32维特征矢量。统计多幅相同汉字的32维特征矢量,取均值作为该汉字的标准网格特征模板。识别时,计算待识别汉字的32维网格特征矢量与模板矢量之间的Euclid距离,求得最小距离值,其对应的汉字即为识别结果。在具体应用中,由于外部原因常常会出现字符模糊、字符倾斜的情况,而网格特征匹配方法对字符模糊和倾斜较敏感,因此鲁棒性不是很强,不适合实际应用。
2 模板匹配
考虑到以上2种主要识别方法存在的弊端,决定选用模板匹配的 算法进行字符的识别。实际研究中发现,二值化的图形模板虽然直观,但其匹配计算过程过于简单直接,对倾斜、形变、残损、模糊的待识别字符匹配误差较大,因此鲁棒性较差。而灰度模板由于色彩、光照等因素影响,难以找到普遍适用的模板形式实现直接的匹配计算。综合以上二方面的问题,在引入统计模式识别思想的基础上,提出了基于二值图形变动分析的模糊模板匹配方案。
2.1 基于二值图形变动分析的模糊模板匹配
在含有汽车牌照的图像中,将汉字定位并提取出来以后,还要完成 规格化、二值化等操作。即使是相同的汉字,由于车牌倾斜、模糊,特别是由于每次定位不可能完全精确一致等诸多因素的影响,导致在二值图中字体的形状、大小都会不同,字体位置也会发生不同程度的偏移。将这种二值图形的不规则现象称为图形的变动。在汉字识别的分析过程中,希望对图形变动的大小进行量化处理。因此,提出了求图形整体变动量的统计方法,其优点是不需要参照标准图形,可以进行客观评价,并构造出用于匹配识别的模糊模板。
对每一个车牌的汉字字符,选取n幅质量较好的参考图。将这n幅参考图规格化为17×33的标准大小后进行二值化处理,得到标准参考图fi(x,y)。因此每个车牌汉字字符都有n幅由0、1所组成的二值图像。将这n幅二值图像对齐后叠加,再进行归一化。得到的模糊图形F(x,y)。四个汉字的模糊图形模板(不同方向的视觉效果)如图1所示。
该模糊图形上每一象素点实际上都对应着一个概率值,该概率值代表白色目标(汉字笔划)在该点出现的可能性。例如在模糊模板中若某一点值为1,表明在所有参加统计的二值图形上汉字笔划都经过该点,其为白色目标象素的可能性是100%,为黑色背景象素的可能性是0;反之亦然。进行匹配识别时,对一幅切分后的待识别汉字灰度图,将其规格化、二值化,然后计算每一象素点与模板的吻合程度,即每一象素点正确匹配的置信度con(x,y)。
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- 基于Kinect传感器的动态手势识别方法18次下载
- 基于人体骨架的行为识别方法综述2次下载
- 一种有效的异态汉字识别方法0次下载
- 基于梯度方向直方图与高斯金字塔的车牌模糊汉字识别方法0次下载
- 基于数学形态学的模糊模板匹配方法1次下载
- 基于卷积神经网络CNN的车牌字符识别方法21次下载
- 基于结构知识的字符识别方法在车牌识别中的应用4次下载
- 基于概率神经网络的手写汉字识别方法17次下载
- 基于颜色特征的真假车牌识别方法研究(SVM技术辨别)5次下载
- 基于模糊聚类的神经元识别方法_张晶0次下载
- 基于模板匹配的车牌汉字识别方法及判别函数84次下载
- 一种基于多模板匹配的字符识别方法28次下载
- 基于ANN和HMM的联机手写体汉字识别系统13次下载
- 基于并行模糊神经网络的车牌识别研究16次下载
- 基于Pseudo-Zernike不变矩的PNN车牌汉字识别26次下载
- 集成芯片管脚顺序识别方法535次阅读
- OpenCV边缘模板匹配算法原理详解320次阅读
- OpenMV如何实现旋转模板匹配呢1312次阅读
- 车牌定位方法的类型及应用特点研究4143次阅读
- 色环电感识别方法_色环电感的识别顺序3.3w次阅读
- 车牌识别是如何实现的4183次阅读
- 贴片电阻怎么识别_贴片电阻识别方法9.4w次阅读
- 新能源车车牌无法识别怎么办_新能源车牌识别不了4w次阅读
- 车牌识别停车场系统安装方法及注意事项2w次阅读
- 车牌识别哪家强_车牌识别品牌全国排名榜前十出炉4.6w次阅读
- 车牌识别技术的发展及意义_车牌识别系统原理介绍1.6w次阅读
- 车牌识别能破解么_怎么破解小区车牌识别37.8w次阅读
- 车牌识别错误_车牌识别不了解决办法3.9w次阅读
- 车牌识别系统技术指标及选购方法1169次阅读
- 车牌识别系统的识别原理及触发方式3.8w次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB |1491次下载 |免费
- 2单片机典型实例介绍
- 18.19 MB |95次下载 |1积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB |27次下载 |1积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB |18次下载 |4积分
- 5开关电源原理及各功能电路详解
- 0.38 MB |11次下载 |免费
- 6100W短波放大电路图
- 0.05 MB |4次下载 |3积分
- 7基于单片机和 SG3525的程控开关电源设计
- 0.23 MB |4次下载 |免费
- 8基于AT89C2051/4051单片机编程器的实验
- 0.11 MB |4次下载 |免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB |234313次下载 |免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB |66304次下载 |免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB |51209次下载 |免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB |51043次下载 |免费
- 5555集成电路应用800例(新编版)
- 0.00 MB |33562次下载 |免费
- 6接口电路图大全
- 未知 |30320次下载 |免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB |28588次下载 |免费
- 8开关电源设计实例指南
- 未知 |21539次下载 |免费
总榜
- 1matlab软件下载入口
- 未知 |935053次下载 |免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB |537793次下载 |免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 |420026次下载 |免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB |234313次下载 |免费
- 5Altium DXP2002下载入口
- 未知 |233046次下载 |免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 |191183次下载 |免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M |183277次下载 |免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 |138039次下载 |免费
评论
查看更多