识别图片文字,图片的分辨率至少要200dpi,最好达到300dpi,高于300dpi处理起来很慢; 字迹清晰,不要有重影; 适合图片文字较多,文字少的话不如键盘输入,因为符号的识别率低。
不同于商业Ocr软件,本软件是免费的,可以自由使用。第二个不同之处,本软件的识别对象是屏幕出现的“显示汉字”,而不是针对扫描仪扫出来的“打印汉字”。二者有什么不同呢?最重要的一点: 扫描出来的打印汉字的高度和宽度一般都在30多个像素点之上,这是我用画图软件,打开某个商业Ocr的samples\sample1.tif,然后一点一点数出来的。从文件名和目录名的中文含意可以看出,这个点数应该是一个典型值。那么,如果用商业Ocr识别屏幕上出现的小五号字,汉字的高度是12个像素点,会出现什么情况呢? 测试方法:用记事本随便写几行汉字,设置字体为小五号字。这大概是看着还算舒服的最小号的汉字字体了(高度是12个像素点),如果再小,字体就很难看了。然后,按拷屏键PrtSc,把屏幕的图像拷贝、粘贴到画图软件中,修剪尺寸后,保存为bmp的格式。然后,我找了两个国内最著名的Ocr软件进行测试,结果让人大吃一惊,识别率几乎为零。把图像放大两倍,再测试,结果仍然很不理想,大概也只有百分之二三十的样子。
140.5M / 09-05
76.4M / 03-25
55M / 06-05
237.9M / 04-13
900.9M / 03-02
96.2M / 07-06
311.2M / 07-06
335M / 07-06
200M / 07-06
413.8M / 07-06
484.7M / 09-27
165.4M / 09-05
353.9M / 06-05
131.8M / 04-13
195.6M / 03-03
45.6M / 09-08
665.2M / 07-06
2.84G / 07-06
93M / 07-06
338.3M / 07-06
1.38G / 07-26
488.3M / 07-16
109.8M / 06-03
142M / 01-08
1.2M / 11-23
548.8M / 04-13
1.6M / 04-13
1.48G / 03-18
646.6M / 03-03
133.7M / 03-03
110.5M / 09-05
33.4M / 09-05
325.8M / 08-12
60M / 04-29
254M / 04-25
659M / 04-23
1M / 12-26
253.4M / 12-08
253M / 12-08
1.19G / 11-16
369M / 09-22
181.5M / 09-22
201.2M / 09-05
488.3M / 07-16
248.9M / 12-08
248.9M / 12-08
100.6M / 03-06
148.9M / 03-06
1.12G / 07-06
1.25G / 07-06
1.76G / 09-22
1.92G / 04-17
116.2M / 04-10
201.5M / 04-13
7.31G / 07-01
94.3M / 07-06
2.48G / 07-06
7.63G / 07-06
1M / 07-06
778.1M / 07-06
561.8M / 07-11
72M / 07-06
548.7M / 07-06
1.00G / 07-06
9.13G / 07-06
126.2M / 07-06
72M / 07-06
105.1M / 07-06
132M / 07-06
132M / 07-06