MENU

Python 爬取全国新型肺炎疫情实时动态

January 29, 2020 • Read: 12480 • python阅读设置

最近写了个爬虫程序,目标网站是全国新型肺炎疫情实时动态

把里面一些重要的数据爬下来,打包成 EXE,运行结果如下所示

源码和 EXE 文件都放在 Github 上了,2019-nCoV

然后又写了个小脚本,定时每天凌晨 0 点爬取省份、城市、日期、确诊、死亡、治愈、疑似这 7 个数据,并以当前日期作为 Sheet 名,保存到 Excel,方便以后做数据分析等用途

这个程序也已开源在 github

Last Modified: February 5, 2020
Archives Tip
QR Code for this page
Tipping QR Code
Leave a Comment

6 Comments
  1. Arthur Arthur

    多谢您的 python 源码! 我觉得这些数据对疾病的数据建模和验证非常有益。 我有一个小的建议,就是是否也可以以 excel 文件的形式共享历史的统计数据,在您的 git,或这里。每日或定期更新。

    我这个建议的原因是,不是每一位读者会很早的看到您的工作。当他们想要研究或者分析数据的时候,已经错过了许多日期的数据。而这些是无法再去抓取的。

    多谢!

    1. mathor mathor

      @Arthur 确实是个好的提议,但是历史数据我目前也不知道在哪才能找到,我想起来要保存数据的时候是 1 月 30 日,1 月 30 日以前的数据我也没办法,唉

      1 月 30 日以后每天的数据我都会更新在 github 中的 2019-nCoV.xlsx 里

      谢谢建议

  2. 神秘giser 神秘 giser

    代码写得很好,但我在想怎么对其爬取的数据地区 添加空间坐标系,以用于进行地理空间的研究!!

    1. mathor mathor

      @神秘 giser 我不是研究地理空间数据的,我也不好意思给您什么意见,我就稍微提一提我的想法吧

      其实地理空间数据很难获取,丁香医生网站上的疫情数据也不过是个 "二手的" 数据,真正一手的数据应该在政府手里(如果他们统计的足够仔细,连每名患者在哪住院,在哪发病都记录下来了的话),我们现在能拿到最小的数据单位也就是 "市",但是市那么大,对其添加经纬度信息似乎又没什么用,还是需要更细的数据,可是我们普通人拿不到更细致的数据,所以,还是挺困难的其实

  3. Wayne Wayne

    项目做得还是很不错的,代码也给了我很多借鉴和学习的地方,爬取的疫情数据有一定的研究价值.

  4. 阿酱 阿酱

    下载不下来... 可以私发吗 有偿