2 Python自动化办公"案例"
自动化办公案例
目标:
1 一堆文本信息中提取出手机号码,
2 电话号码存储到 Excel 中
3 文本中提取邮箱了
4 一堆图片,让我加上公司水印
5 清理重复文件
6 文本到底有多少个中文字符
7 将网址生成二维码图片
8将图片生成 gif
9 翻译一份英文文档
10 提取视频的音频信息
#读取目标文本文件 def get_str(path): f = open(path,encoding="utf-8") data = f.read() f.close() return data import re #正则获取文本号码 def get_phone_number(str): res = re.findall(r'(13\d{9}|14[5|7]\d{8}|15\d{9}|166{\d{8}|17[3|6|7]{\d{8}|18\d{9})', str) return res #保存得到号码 def save_res(res,save_path): save_file = open(save_path, 'w') for phone in res: save_file.write(phone) save_file.write('\n') save_file.write('\n号码共计:'+str(len(res))) save_file.close() print('号码读取OK,号码共计:'+str(len(res))) # 调用代码 path=input("请输入文件路径:") save_path=input("请输入文件保存路径:") #read_str=get_str(path) res=get_phone_number(get_str(path)) save_res(res,save_path)
1 提取电话号码
import xlwt #读取目标文本文件 def get_str(path): f = open(path,encoding="utf-8") data = f.read() f.close() return data #保存为Excel文件 def save_excel(save_path,sheetname,column_name_list,read_list): workbook = xlwt.Workbook() sheet1 = workbook.add_sheet(sheetname=sheetname) for i in range(0,len(column_name_list)): sheet1.write(0,i,column_name_list[i]) i=1 for v in read_list: kval=v.split(':') for j in range(0,len(kval)): sheet1.write(i+1,j,kval[j]) i=i+1 workbook.save(save_path) print('信息保存 OK,记录条数共计:'+str(len(read_list))) # 调用代码 path=input("请输入文件路径:") save_path=input("请输入文件保存路径:") sheet_name=input("请输入sheetname:") column_name=input("请输入列名,并且使用英文逗号隔开:") column_name_list=column_name.split(',') read_str=get_str(path) read_list=read_str.split('\n') save_excel(save_path,sheet_name,column_name_list,read_list)
2 将电话号码,存储至Excel
import re #正则获取目标信息 def get_re_str(str): res = re.findall(r'^[A-Za-z0-9\u4e00-\u9fa5]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$', str) return res #读取目标文本文件 def get_str(path): f = open(path,encoding="utf-8") data = f.read() f.close() return data #保存得到的信息 def save_res(res,save_path): save_file = open(save_path, 'w') for phone in res: save_file.write(phone) save_file.write('\n') save_file.close() print('信息读取OK,信息共计:'+str(len(res))) path=input("请输入文件路径:") save_path=input("请输入文件保存路径:") #read_str=get_str(path) res=get_re_str(get_str(path)) save_res(res,save_path)
3 邮箱提取
#安装好 opencv 库 import cv2 import os path=input("请输入需要加水印的文件夹路径:") file_list = os.listdir(path) for filename in file_list: img1 = cv2.imread(path+filename,cv2.IMREAD_COLOR) cv2.putText(img1,'CSDN',(10,10) , 1, 1, (255,255,255),1) #图片,文字,位置,字体,字号,颜色,厚度 cv2.imwrite(path+filename, img1)
4 图片加上logo水印
#如何去删除重复文件呢?没错,是使用文件的 md5 值进行对照,相同文件的 #md5 值一样,只需要遍历该目录的文件 md5 值,若出现重复 md5 则删除#该文件即可 import hashlib,os def getMD5(filepath): f = open(filepath,'rb') md5obj = hashlib.md5() md5obj.update(f.read()) hash = md5obj.hexdigest() f.close() return str(hash).upper() path=input("请输入需要重复文件过滤文件夹路径:") file_list = os.listdir(path) file_md5=[] for filename in file_list: md5val=getMD5(path+filename) if md5val in file_md5: os.remove(path+filename) else: file_md5.append(md5val) print("处理完毕...")
5 MD5清理重复文件
#读取目标文本文件 def get_str(path): f = open(path) data = f.read() f.close() return data path=input("请输入文件路径:") word=re.findall('([\u4e00-\u9fa5])',get_str(path)) print("中文字符,除特殊字符外共:",len(word))
6 统计中文字符
import qrcode qr = qrcode.QRCode( version=2,#尺寸 error_correction=qrcode.constants.ERROR_CORRECT_L,#容错信息当前为 7% 容错 box_size=10,#每个格子的像素大小 border=1#边框格子宽度 )#设置二维码的大小 qr.add_data("https://www.csdn.net/")#指定 url img = qr.make_image()#生成二维码图片 img.save("F:\work\day7\csdn.png")#保存
7 生成二维码
import imageio image_list = [r'F:\work\day4\1.png', r'F:\work\day4\2.png'] gif_name = r'F:\work\day4\gif.gif' frames = [] for image_name in image_list: frames.append(imageio.imread(image_name)) #gif_name 保存路径信息、frames 图片信息、‘GIF’ 生成图片类型以及 gif #图的切换秒数 duration 参数为 2 imageio.mimsave(gif_name, frames, 'GIF', duration=2)
8 制作git图片
from translate import Translator translator = Translator(to_lang="Chinese") def get_str(path): f = open(path) data = f.read() f.close() return data path=input("请输入文件路径:") text=get_str(path) translation = translator.translate(text) print(translation)
9 翻译一份英文文档
#对视频进行操作可以使用 moviepy 库 from moviepy.editor import AudioFileClip #随后使用 AudioFileClip 获取视频信息 my_audio_clip = AudioFileClip("E:\PyVedio\py02.mp4") #视频的音频写入到文件 my_audio_clip.write_audiofile("E:\PyVedio\py02.wav")
10 视频中提取音频
- 上班第一天,老板叫我从一堆文本信息中提取出手机号码,我改如何去做?
- 上班第二天,领导叫我将第一天提取的电话号码存储到 Excel 中,我是如何快速解决的。
- 上班第三天,今天叫我去文本中提取邮箱了,给了我一天时间,但我玩了半天才开始进行信息提取。
- 上班第四天,今天同事给了我一堆图片,让我加上公司水印。
- 上班第五天,前同事的电脑中太多重复文件,领导让我清理重复文件精简信息。
- 上班第六天,领导跟我说数一下这个文本到底有多少个中文字符。
- 上班第七天,帮助公司的美工小姐姐将网址生成二维码图片。
- 上班第八天,如何将图片生成 gif?我手到擒来。
- 上班第九天,人事急匆匆的找到我让我急忙翻译一份英文文档,我立马答应下来。
- 上班第十天,提取视频的音频信息并且升职加薪!