python中文ocr方案-pytesseract

Teddy 2021-09-02 原文

pytesseract的环境搭建与基本用法

pytesseract是google维护的具有学习功能的OCR引擎，3.0以后支持中文识别。

安装：

1. 安装tesseract-ocr组件；记得同步下载简体中文与英文语言包。

2. 安装PIL，需注意Windows64位版本

3. pip install pytesseract

使用:

image = Image.open("1.jpg")  # 打开图片
image.load()  # 加载一下图片，防止报错，此处可省略
image.show()  # 调用show来展示图片，调试用，可省略
tessdata_dir_config = \'--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"\'
vcode = pytesseract.image_to_string(image, lang=\'chi_sim\', config=tessdata_dir_config)
print vcode

版权声明：本文为Teddy原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/Teddy/p/7238718.html

python中文ocr方案-pytesseract的更多相关文章

随机推荐

翻译一定要知道的一些软件和工具 – 专注于爬电线杆20年
翻译一定要知道的一些软件和工具 1.最全语种行业术语表整理 http://term.iol8.com/tc/4 […]...
IIR滤波器软件实现（Matlab+C++）
使用C++来写一个IIR滤波器我们首先要在MATLAB中设计一个IIR滤波器，并生成一个头文件，这个头文件中 […]...
Serverless 时代下大规模微服务应用运维的最佳实践
简介：原来的微服务用户需要自建非常多的组件，包括 PaaS 微服务一些技术框架，运维 IaaS、K8s，还包 […]...
C Primer Plus 第四章编程练习
1.编写一个程序，提示用户输入名和姓，然后以“名，姓”的格式打印出来。 1 #include<stdio […]...
使用@AutoConfigureBefore、After、Order调整Spring Boot自动配置顺序
前言 Spring Boot是Spring家族具有划时代意义的一款产品，它发展自Spring Framewor […]...
PHP循环引用会遇到的坑
PHP循环引用会遇到的坑今天遇到这样一个问题：如果foreach循环一个数组，引用去对它的元素做一些操作， […]...
Datable转EXCEL下载的三种方式
/// <summary> /// 把DataTable内容导出伟excel并返回客户端 /// […]...
JavaScript权威指南(第6版)(中文版)–系列4（对象）
对象是JavaScript基本数据类型。 6.1创建对象。可以通过对象直接量、关键字new和Object.c […]...

展开目录

目录导航