Python爬虫练习(requests模块)

xiaoxiao2021-02-28  21

Python爬虫练习(requests模块)

关注公众号“轻松学编程”了解更多。

一、使用正则表达式解析页面和提取数据

1、爬取动态数据(js格式)

爬取http://fund.eastmoney.com/fund.html

流程:

######a.分析页面

用浏览器打开链接,清空已加载的数据,点击下一页,可看到动态数据已被封装成js格式:

var db = {...}

######b.获取url

######c.获取响应

######d.使用正则表达式清洗数据

######e.转为二维列表

f.遍历
转载请注明原文地址: https://www.6miu.com/read-2632207.html

最新回复(0)