7.2.9节点轴选择.133
实例7.10使用XPath和节点轴选择方法获取特定的节点.133
7.2.10在Chrome中自动获得XPath代码135
实例7.11利用requests库抓取京东商城导航条文本.135
7.2.11使用Chrome验证XPath137
7.3项目实战:抓取豆瓣Top250图书榜单138
实例7.12抓取豆瓣Top250图书榜单爬虫完整实现141
7.4项目实战:抓取起点中文网的小说信息142
实例7.13抓取起点中文网小说信息爬虫完整实现.144
7.5小结.146
第8章BeautifulSoup库.147
24分钟
8.1BeautifulSoup简介.147
8.2BeautifulSoup基础.147
8.2.1安装BeautifulSoup.147
8.2.2选择解析器.148
8.2.3编写第一个BeautifulSoup程序.149
实例8.1使用BeautifulSoup分析HTML代码.149
8.3节点选择器.150
8.3.1选择节点150
实例8.2使用BeautifulSoup节点选择器获取特定节点的信息151
8.3.2嵌套选择节点152
实例8.3嵌套选择HTML文档中的节点.152
8.3.3选择子节点.153
实例8.4选取子节点和子孙节点154
8.3.4选择父节点.156
实例8.5获取a节点的父节点156
8.3.5选择兄弟节点157
实例8.6获取li节点的同级节点.158
8.4方法选择器.159
目录11
8.4.1find_all方法159
实例8.7使用find_all方法搜索ul节点和li节点.160
实例8.8根据属性值定位节点161
实例8.9通过节点内容定位文本节点162
8.4.2find方法163
实例8.10搜索特定条件的节点.163
8.5CSS选择器164
8.5.1基本用法164
实例8.11使用CSS选择器查询特定的节点.164
8.5.2嵌套选择节点165
实例8.12混合使用CSS选择器和方法选择器搜索特定节点165
8.5.3获取属性值与文本.167
实例8.13使用CSS选择器选取特定的a节点167
8.5.4通过浏览器获取CSS选择器代码168
实例8.14使用CSS选择器获取京东上传导航条的链接文本168
8.6实战案例:抓取酷狗网络红歌榜170
实例8.15抓取酷狗网络红歌榜爬虫完整实现171
8.7小结.172
第9章pyquery库173
24分钟
9.1pyquery简介173
9.2pyquery基础173
9.2.1安装pyquery173
9.2.2pyquery的基本用法174
实例9.1通过3种方式为PyQuery对象传入HTML文档174
9.3CSS选择器175
实例9.2使用pyquery和CSS选择器分析和提取HTML代码中的信息175
9.4查找节点177
9.4.1查找子节点.177
实例9.3使用find方法和children方法查找子节点177
9.4.2查找父节点.178
实例9.4使用parent方法和parents方法获取父节点.178
9.4.3查找兄弟节点179
实例9.5使用siblings方法查找兄弟节点179
9.4.4获取节点信息180
实例9.6获取节点的各种信息182
9.5修改节点184
9.5.1添加和移除节点的样式(addClass和removeClass).184
实例9.7修改节点的样式185
12Python爬虫从菜鸟到高手
9.5.2修改节点属性和内容(attr、removeAttr、text和html)186
实例9.8attr方法、removeAttr方法、text方法和html方法的用法演示187
9.5.3删除节点(remove).188
实例9.9使用remove方法删除节点189
9.6伪类选择器.190
实例9.10伪类选择器用法展示.190
9.7项目实战:抓取当当图书排行榜191
实例9.11分析当当图书搜索页面194
9.8项目实战:抓取京东商城手机销售排行榜196
实例9.12分析京东商城搜索页面,并将结果保存到Excel文档中.197
9.9小结.201
第四篇数据存储
第10章文件存储.205
38分钟
10.1打开文件205
10.2操作文件的基本方法.206
10.2.1读文件和写文件.207
实例10.1使用不同模式操作文件207
10.2.2读行和写行208
实例10.2按行读写文本文件209
10.3使用FileInput对象读取文件210
实例10.3获取文件内容和相关属性210
10.4处理XML格式的数据211
10.4.1读取与搜索XML文件211
实例10.4获取XML文件的节点和属性信息211
10.4.2字典转换为XML字符串212
实例10.5将字典对象转换为格式化的XML文件213
10.4.3XML字符串转换为字典214
实例10.6将XML文件转换为字典对象214
10.5处理JSON格式的数据.215
10.5.1JSON字符串与字典互相转换216
实例10.7字典与JSON字符串互相转换.216
10.5.2将JSON字符串转换为类实例217
实例10.8将product.json文件转换为Product对象218
10.5.3将类实例转换为JSON字符串219
实例10.9将Product对象转换为JSON文件219
10.5.4类实例列表与JSON字符串互相转换219
目录13
实例10.10将Product对象列表与JSON文件互相转换219
10.6将JSON字符串转换为XML字符串220
实例10.11将products.json文件转换为XML文件220
10.7CSV文件存储.221
10.7.1写入CSV文件.221
实例10.12将数据写入CSV文件.222
10.7.2读取CSV文件.223
实例10.13读取CSV文件中的数据224
10.8小结224
第11章数据库存储225
5分钟
11.1SQLite数据库.225
11.1.1管理SQLite数据库225
11.1.2用Python操作SQLite数据库228
实例11.1读写SQLite数据库中的数据228
11.2项目实战:抓取豆瓣音乐排行榜.230
实例11.2抓取豆瓣音乐Top250排行榜爬虫完整实现.232
11.3项目实战:抓取豆瓣电影排行榜.235
实例11.3抓取豆瓣电影Top250排行榜爬虫的完整实现236
11.4小结239
第五篇爬虫高级应用
第12章抓取异步数据243
11分钟
12.1异步加载与AJAX243
12.2基本原理243
实例12.1使用jQuery发送请求,并获取数据244
12.3逆向工程246
12.4提取结果249
实例12.2使用requests访问异步请求的URL.249
12.5项目实战:支持搜索功能的图片爬虫250
实例12.3图片爬虫完整实现253
12.6项目实战:抓取京东图书评价255
实例12.4抓取京东图书评价爬虫完整实现.256
12.7小结259
第13章可见即可“爬”:Selenium260
16分钟
13.1安装Selenium.260
14Python爬虫从菜鸟到高手
13.2安装WebDriver261
13.2.1安装ChromeDriver.261
13.2.2安装EdgeWebDriver262
13.2.3安装其他浏览器的WebDriver263
13.3Selenium的基本使用方法264
实例13.1使用Selenium控制浏览器.264
13.4查找节点267
13.4.1查找单个节点267
实例13.2使用find_element查找单个节点267
13.4.2查找多个节点269
实例13.3使用find_elements查找多个节点.269
13.5节点交互270
实例13.4模拟单击浏览器中的按钮270
13.6动作链.271
实例13.5模拟鼠标移动动作,自动控制京东商城首页271
实例13.6模拟拖拽动作移动节点273
13.7执行JavaScript代码274
实例13.7动态执行JS代码滚动京东商城首页274
13.8获取节点信息.275
实例13.8使用SeleniumAPI获取京东商城首页HTML中的信息.275
13.9管理Cookies.276
实例13.9用SeleniumAPI读写Cookie.276
13.10改变节点的属性值277
实例13.10改变百度搜索按钮的位置277
实例13.11修改京东商城首页的导航条菜单278
13.11项目实战:抓取QQ空间说说的内容.279
实例13.12抓取QQ空间说说内容爬虫完整代码.279
13.12小结281
...
...
...