火车采集器 帮助文档
OCR识别程序是一个通用的图片文字识别程序,可以对一些简单的字母或是数字的图片进行识别
预处理:
通过预处理可以去除一些干扰,来提高识别率。
1, 亮度/对比度
用以调节图像的亮度和颜色的对比度
2, 灰度
效果图:
相当于彩色变黑白的效果
3, 边框
通过定义边框相对于图像上下左右的距离裁剪图像
4, 去除噪点
通过设置相邻点个数,来去除孤立的点
5, 边缘扫描去色
通过设置边缘的宽度,程序将会收集在该区域内的所有颜色。然后扫描整个图像。如果像素点的颜色和之前收集的颜色差在[色差异异]的范围内,则将该点的颜色置白。
6, 二值化
可通过调节阀值来讲图像二值化,将阀值两边的颜色变成黑白两种颜色。
7, 底色
将图像的颜色调换相反的颜色
8, 删除替换颜色
通过设置颜色区间。扫描图像删除所有区间内的颜色。可以将原来的颜色替换成另一种颜色。
字符过滤
可通过设置白名单和黑名单字符集来提高识别率。