爬取微博数据

发表于 2020-08-21 分类于爬虫，部分实例，微博阅读次数：本文字数： 143 阅读时长 ≈ 1 分钟

这个就简单写写，不详细展开了。

微博有一个叫做“Sina Visitor System”的系统，如果不做任何处理，只能爬到这个系统的一些内容，无法获得想要的信息。

绕过系统的方法可参考这篇文章：

如果数据量比较大的话，需要使用代理，可以看下这篇文章：

我使用的是requests + beautifulsoup + openpyxl的组合，将数据存入excel表格。

这是openpyxl库的介绍：openpyxl库