python爬虫-豆瓣电影的尝试

milicool 2021-09-01 原文

一、背景介绍

1. 使用工具

　　Pycharm

2. 安装的第三方库

　　requests、BeautifulSoup

　　2.1 如何安装第三方库

　　File => Settings => Project Interpreter => + 中搜索你需要的插件

　　

3. 可掌握的小知识

　　1. 根据url 获取页面html内容

　　2. 解析html内容，选出自己需要的内容

二、代码示例

　　网页的样子是这个，获取排行榜中电影的名字

 1 import requests
 2 from bs4 import BeautifulSoup
 3 
 4 def getHtml():
 5     url = \'https://movie.douban.com/chart\'
 6     # Get获取改页面的内容
 7     html = requests.get(url)
 8     # 用lxml解析器解析该页面的内容
 9     soup = BeautifulSoup(html.content, "lxml")
10     getFilmName(soup)
11     # print(soup)
12 
13 
14 def getFilmName(html):
15     for i in html.find_all(\'a\', class_="nbg"):
16         img = i.find(\'img\')
17         print(img[\'alt\'])
18 
19 
20 getHtml()

返回值：

恶人传
孟买酒店
阿丽塔：战斗天使
雷霆沙赞！
夏目友人帐
地久天长
调音师
三夫
寄生虫
地狱男爵：血皇后崛起

三、结语

　　先从简单的入手，帮助自己，也希望能帮助未入门的同学

版权声明：本文为milicool原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/milicool/p/11244597.html

python爬虫-豆瓣电影的尝试的更多相关文章

随机推荐

ELK-日志管理平台
elk日志收集工具 1、日志在工作当中的重要性 1 分析日志的意义： 2 1、分析日志 […]...
使用 Hexo 搭建静态博客
目录 Hexo 简介什么是 Hexo？ Hexo 安装 Hexo 建站 Hexo 配置 Hexo 自定义主题 […]...
ELK7.11.2版本安装部署及ElastAlert告警相关配置 – 感觉不妥
ELK7.11.2版本安装部署及ElastAlert告警相关配置文档开篇，我还是要说一遍，虽然我在文档内容中 […]...
amazeui学习笔记–css（基本样式3）–文字排版Typography
amazeui学习笔记–css（基本样式3）–文字排版Typography 一、总结 […]...
文件上传报错java.io.FileNotFoundException拒绝访问
局部代码如下： 1 File tempFile = new File("G:/tempfileDir"+"/" […]...
使用TaskScheduler 调度器实现跨线程的控件访问
1 //任务调度器 2 TaskScheduler UIscheduler = null; 3 public […]...
Winform开发中的困境及解决方案 – 伍华聪
Winform开发中的困境及解决方案在我们开发各种应用的时候，都会碰到很多不同的问题，这些问题涉及架构、模块 […]...
mac NTFS 关于错误-36，rm Input/output error
当传输文件时出现Mac错误代码36 当我向一个U盘或存储卡里传输文件时，出现了Mac Error Code36 […]...

展开目录

目录导航