第二节条形图

上节课我们讲了折线图的绘制,使用的是 plot 函数。当我们使用 plot 方法绘图时,默认绘制的是折线图。本节课我们来讲下条形图的绘制。 [Read More]

第八节使用Scrapy爬取数据

上节课我们介绍了爬虫框架 Scrapy,本节课我们通过一个实例来介绍如何使用 Scrapy 框架来爬取数据。在第 6 节我们讲到了豆瓣top250电影信息的爬取,本节课我们使用 scrapy 框架来爬取豆瓣top250电影信息。 [Read More]

第七节爬虫框架Scrapy介绍

上节课讲了豆瓣网 top250 电影信息的爬取,本节课我们来介绍一个强大的爬虫框架 Scrapy。Scrapy 是一个基于 Twisted 的异步处理框架,是纯 Python 实现的爬虫框架,其架构清晰,模块之间的耦合程度低,可扩展性极强,可以灵活完成各种需求。 [Read More]

第四节requests库的介绍

上节课我们简要介绍了 HTML 的相关知识。之前我们讲过爬虫就是要自动化地获取网站的 HTML 代码,从 HTML 代码中解析出我们想要的信息。本节课,我们就来介绍自动化获取页面的 HTML 代码所需要的第三方库 requests。 [Read More]

第五节BeautifulSoup库的介绍

上次课讲到如何使用 requests 库的 GET 方法来获取页面的 HTML 代码。本节课来讲下如何使用 Beautiful Soup 来解析 HTML 以获取我们想要的信息。 [Read More]

第三节HTML简介

在上次课中,我们讲到在访问豆瓣网的主页时,响应体的数据格式为 HTML 代码。爬虫的目的就是自动化地获取网站的 html 代码并从中解析出我们想要的信息。本节课我们就来简要介绍下 html。 [Read More]