pytesseract的环境搭建与基本用法

pytesseract是google维护的具有学习功能的OCR引擎,3.0以后支持中文识别。

安装:

1. 安装tesseract-ocr组件;记得同步下载简体中文与英文语言包。

2. 安装PIL,需注意Windows64位版本

3. pip install pytesseract

使用:

image = Image.open("1.jpg")  # 打开图片
image.load() # 加载一下图片,防止报错,此处可省略
image.show() # 调用show来展示图片,调试用,可省略
tessdata_dir_config = \'--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"\'
vcode = pytesseract.image_to_string(image, lang=\'chi_sim\', config=tessdata_dir_config)
print vcode

版权声明:本文为Teddy原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/Teddy/p/7238718.html