Skip to content

tonydeng/tess4j-ocr-demo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TESS4J OCR Demo

使用Tesseract + GraphicsMagick进行简单的OCR处理

验证码识别

基本原理

CAPTCHA

  • 使用 gm 对验证码图片进行降噪
gm convert 2.jpg +profile '*' -threshold '22%' test_2.jpg
  • 对降噪之后的验证码图片进行识别
tesseract test_2.jpg  -psm 7 r
  • 查看结果
cat r.txt
ZLQE

Java实现(tess4j + im4java)

代码实现:OCR

测试方法:OCRTest

Tesseract OCR使用

参见之前写的一篇Blog,利用Tesseract图片文字识别初探,对Tesseract的安装和使用详细介绍。