python3简单爬虫

liqiao 2021-08-13 原文

最近在抽空学了一下python，于量就拿爬是练了下手，不得不说python的上手非常简单。在网上找了一下，大都是python2的帖子，于是随手写了个python3的。代码非常简单就不解释了，直接贴代码。

#test rdp
import urllib.request
import re

#登录用的帐户信息
data={}
data[\'fromUrl\']=\'\'
data[\'fromUrlTemp\']=\'\'
data[\'loginId\']=\'12345\'
data[\'password\']=\'12345\'
user_agent=\'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)\'
#登录地址 
#url=\'http://192.168.1.111:8080/loginCheck\'
postdata = urllib.parse.urlencode(data)  
postdata = postdata.encode(\'utf-8\')
headers = { \'User-Agent\' : user_agent } 
#登录  
res = urllib.request.urlopen(url,postdata)
#取得页面html
strResult=(res.read().decode(\'utf-8\'))
#用正则表达式取出所有A标签
p = re.compile(r\'<a href="(.*?)".*?>(.*?)</a>\')
for m in p.finditer(strResult):
    print (m.group(1))#group(1)是href里面的内容，group(2)是a标签里的文字

关于cookie、异常等处理看了一下，没有花时间去处理，毕竟只是想通过写爬虫来学习python。

想要深入的去看这个系列的文章，写得非常详细了。

[Python]网络爬虫

下面是python语法教程，真的只要几分钟就能看完。

Python3 入门教程

版权声明：本文为liqiao原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/liqiao/p/3721986.html?utm_source=tuicool

python3简单爬虫的更多相关文章

随机推荐

Java高并发秒杀系统【观后总结】
项目简介在慕课网上发现了一个JavaWeb项目，内容讲的是高并发秒杀，觉得挺有意思的，就进去学习了一番。记 […]...
网络推广免费推广产品网站 B2B网站如何推广
云集网（yunjinet.com）免费发布各类服务和产品信息，在平台上推广你的产品。帮助商家推广优质的产品和服 […]...
Flutter 即学即用系列博客总结篇
前言迟到的总结篇，其实大家看我之前发的系列博客最后一篇，发文时间是 3 月 29 日。距离现在快两个月了。 […]...
word中那些重要但是被人忽略的快捷键和长word文档的跳转
重复上一次操作: F4, 这个太重要了,比如你在做一次很复杂的操作, 下一次又要这样操作时就很有用! 如设置 […]...
URL 生成带文字二维码
<!DOCTYPE html> <html> <head> < […]...
油猴脚本-开发入门
最近火起来的12306.cn,顺带着火起来一些刷票的脚本。一个很好玩的东西油猴脚本映入眼帘! 瞬间觉得自己会 […]...
中值滤波&均值滤波
转自原文：图像处理：中值滤波&均值滤波在开始我们今天的博客之前，我们需要先了解一下什么是滤波： op […]...
WSDL-学习总结
1.什么是WSDL 　　是一种使用 XML 编写的文档。这种文档可描述某个 Web service。它可规定服 […]...

展开目录

目录导航