火车采集器帮助文档 --> OCR图像识别配置管理工具
火车采集器  帮助文档

OCR识别程序是一个通用的图片文字识别程序,可以对一些简单的字母或是数字的图片进行识别

预处理:

通过预处理可以去除一些干扰,来提高识别率。

1, 亮度/对比度

用以调节图像的亮度和颜色的对比度

2, 灰度

效果图:

相当于彩色变黑白的效果

3, 边框

通过定义边框相对于图像上下左右的距离裁剪图像

4, 去除噪点

通过设置相邻点个数,来去除孤立的点

5, 边缘扫描去色

通过设置边缘的宽度,程序将会收集在该区域内的所有颜色。然后扫描整个图像。如果像素点的颜色和之前收集的颜色差在[色差异异]的范围内,则将该点的颜色置白。

6, 二值化

可通过调节阀值来讲图像二值化,将阀值两边的颜色变成黑白两种颜色。

7, 底色

将图像的颜色调换相反的颜色

8, 删除替换颜色

通过设置颜色区间。扫描图像删除所有区间内的颜色。可以将原来的颜色替换成另一种颜色。

字符过滤

可通过设置白名单和黑名单字符集来提高识别率。

上一篇   下一篇