Halcon中使用OCR时字符的分割以及字符粘连的处理方法-坚果云扫描

/u013698770/article/details/53027403

字符的分割是指在原图中将字符分割为单个的字符区域。这样，这些单个的字符才能被当作字符样本来训练分类器。因此，样本字符分割的好坏很大程度上影响mlp分类器的分类效果。

那么，怎样才能判断自己的字符分割是好的呢？标准是：字符不要有因干扰导致的洞孔。建议的字符分割步骤如下：

（1）使用小阈值来分割字符，使字符经可能的饱满。此时第一个分割出来的字符称为原始字符区域 threshold (ImageReduced, RawSegmentation, 83, 255)（2）使用填充算子，将整个字符区域填充，此时的字符称成胖字符fill_up (RawSegmentation, RegionFillUp)（3）使用开运算滤除杂波的干扰opening_circle (RegionFillUp,RemovedNoise, 2.5)（4）根据形状特征选取胖字符区域select_shape(RemovedNoise : ConnectedPatterns : ‘area’, and, 300, 3000 : )（5）胖字符区域与原始字符区域相交得到最后的字符区域intersection (ConnectedPatterns, RawSegmentation, NumberCandidates)（6）最后，调用connection算子得到每一个字符的联通区域 connection ( NumberCandidates : ConnectedNumberCandidates : : ) 123456789101112

注意，如过字符之间存在粘连导致connection难以分割，则需要调用开运算算子来消除粘连。

该特殊矩形开运算算子的特别之处在于消除粘连区域，同时保留原始字符区域opening_rectangle1 (Solid, Cut, 1, 7)

Halcon中使用OCR时字符的分割以及字符粘连的处理方法

相关推荐

热门标签

分类

功能

免费扫描软件无广告无水印

相关推荐

热门标签

分类

功能

免费扫描软件 无广告 无水印

免费扫描软件无广告无水印