免费扫描软件
无广告、无水印

揭开OCR识别的神秘面纱

OCR识别技术自上世纪六七十年代起,就已慢慢的发展起来,最近随着人工智能的推进,OCR识别技术也越来越多的被应用到现实的场景中。像出入口的车牌OCR识别、电子图书馆的文档OCR识别、自助银行的银行卡OCR识别和身份证OCR识别等等,都是以OCR识别技术为坚实基础所延伸的实际应用技术。那么,OCR识别具体是怎样工作的呢?

1、图像输入:要进行ocr识别,第一步便要采集所要识别的图像,可以是名片、身份证、护照、行驶证、驾驶证、公文、文档等等都可以,然后将图像输入到识别核心。

2、图像预处理:此过程包含二值化(将图像上的像素点灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果)、去噪、倾斜度矫正等

3、版面分析:将所要识别的文档分段、分行处理

4、字符切割:此时需要字符定位和字符切割,定位出字符串的边界,然后分别对字符串进行单个切割,单个分割出来的字符再做识别。

5、字符特征提取:提取字符特征,为后面的识别提供依据。

6、字符识别:将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。

7、版面回复:将识别结果按照原来的版面排班,输出wps或pdf格式的文档。

8、后处理校正: 根据特定的语言上下文的关系,对识别结果进行较正的算法。

OCR识别技术已不是新鲜的技术,但它称得上是zui实用的技术。而文通科技作为最具代表性的企业,已在生活的方方面面起到至关重要的作用。

未经允许不得转载:坚果云扫描 » 揭开OCR识别的神秘面纱
分享到: 更多 (0)

免费扫描软件 无广告 无水印

坚果云扫描下载坚果云扫描介绍