Python 抓取图片

paulversion 2021-08-07 原文

#coding:utf-8
from bs4 import BeautifulSoup
import requests
import urllib

user_agent = \’Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36\’
headers ={\’User-Agent\’:user_agent}

def Schedule(blocknum,blocksize,totalsize):

#blocknum:已经下载的数据块
#blocksize:数据块的大小
#totalsize:远程文件的大小

per = 100.0*blocknum*blocksize/totalsize

if per > 100:

per = 100

print \’当前下载进度:%d\’ %per

r = requests.get(\’http://www.ivsky.com/tupian/ziranfengguang/\’,headers=headers)

soup = BeautifulSoup(r.text, \’html.parser\’, from_encoding=\’utf-8\’)

i=0

for img in soup.find_all(\’img\’):

if img.has_attr(\’src\’)!=None:

url = img.get(\’src\’)

urllib.urlretrieve(url,\’./images/img\’+str(i)+\’.jpg\’,Schedule)
i+=1

urlretrieve(url,filename=None,reporthook=None,data=None)

参数filename 指定了存储的本地路径(如果参数未指定,urllib会生成一个临时文件保存数据)

参数reporthook是一个回调函数。当连接上服务器以及相应的数据块传输完毕时会触发该回调函数，我们可以利用这个回调函数来显示当前的下载速度

本文链接：https://www.cnblogs.com/paulversion/p/8337272.html

Python 抓取图片的更多相关文章

Python：类

太久没写Python的程序了类的内容忘记了，这里写下回忆一下1 Python-类属性类有一个特殊的方法叫做构造函数，用作定义实例对象的属性，其必须被命名为__init__()（注意其前后下划线都是两个），括号内参数数量没有限制，但是第一位...

知识点 – python 类的私有/保护属性和方法

类的私有属性： __private_attrs：两个下划线开头，声明该属性为私有，不能在类地外部被使用或直接访 […]...

给 Python 初学者：从零入门 Django 开发网站教程

对于 Python 程序员来说，进行 Web 开发有很多现成的框架可供使用，比如Django、Flask、To […]...

Python: Check if a File or Directory Exists

https://stackabuse.com/python-check-if-a-file-or-direct […]...

Python 游戏之旅（Pygame）

Pygame是跨平台Python模块，专为电子游戏设计，包含图像、声音。建立在SDL基础上，允许实时电子游戏研 […]...

ddt源码修改：HtmlTestRunner报告依据接口名显示用例名字

背景是这样的：　　自己写了一套接口自动化的框架，其中使用unittest + ddt + excel作为数据 […]...

哪些 Python 库让你相见恨晚？【转】

原文链接：https://www.zhihu.com/question/24590883/answer/924 […]...

数据处理——数据集划分

数据集划分一般在日常工作中我们会将数据集拆分为训练集（train_set）和测试集（test_set）训练 […]...

随机推荐

云真机优测云服务平台有资讯板块啦

云真机优测云服务平台有资讯板块啦云真机优测云服务平台有资讯板块啦云真机优测云服务平台有资讯板块啦优测测试 […]...

java 连接MySQL数据库操作图解 – backyyan

java 连接MySQL数据库操作图解 2017-05-19 15:26 backyyan 阅读(394 […]...

centos安装npm和 nodejs

NPM安装 00X01：创建目录 mkdir /usr/local/node/cd /usr/local/node/00x02：下载安装包 wget https://npm.taobao.org/mirrors/node/v14.1...

使用Canvas进行验证码识别

前两天首页上有篇文章,讲用C#生成验证码.今天又看到一篇文章,讲用python识别验证码.于是我就写了这篇文章 […]...

国内外各大免费搜索引擎、导航网址提交入口

>> 搜索引擎网站收录地址大全【点此提交您的搜索引擎】百度搜索网址提交入口口：http://z […]...

数学基础系列(三)—-第一中值定理、微积分基本定理、牛莱公式、泰勒公式

一、第一中值定理如果函数f(x)在闭区间[a，b]上连续，则在积分区间[a，b]上至少存在一个点$\xi $ […]...

SQL外连接与条件 left outer join + WHERE/AND 区别

ref:https://www.cnblogs.com/cy163/archive/2008/10/16/13 […]...

Windows系统封装总结

Windows系统封装总结注:使用虚拟机或者实体机进行封装均可,实体机进行封装的成功率更高.虚拟机进行封装建 […]...

Python 抓取图片

Python 抓取图片的更多相关文章

随机推荐

热门专题

目录导航