机器学习/计算机视觉/文字识别
Achieve
需求 JAVA识别图片中的文字 方法一 百度 讯飞 所提供的第三方接口 优点: 识别率高 实现简单 识别效率高 缺点 有一定的额度限制 方法二 使用java所提供的Tess4J实现 优点: 无额度限制 缺点 识别率低 实现相对困难 识别效率低 优化方案 使用jTessBoxEditor自行训练
Lesson
jTessBoxEditor自行训练报错显示I/O error reading PNG header 报错原因 直接改jpg为png 解决方案 jpg图片另存为png即可
注意
直接改后缀名无法改变格式,后缀名只是人们提出来的概念,可以告诉操作系统用什么软件打开。而文件里面的内容(音频、视频)是按照一定的格式在文件里存储的,不同的文件存储的方法不一样,所以你把mkv改成MP4,但文件里的内容还是按照mkv的方法存储的实际内容,处理mp4文件的软件把它当做mp4文件的的格式去处理,就拿不到实际的内容。 tesseract zwp.test.exp0.tif zwp.test.exp0 -l chi_sim -psm 7 batch.nochop makebox报错 解决方案 将-psm 7改为–psm 7
上一篇:
IDEA上Java项目控制台中文乱码