MENU

Python爬取全国新型肺炎疫情实时动态

January 29, 2020 • Read: 1533 • python

最近写了个爬虫程序,目标网站是全国新型肺炎疫情实时动态

把里面一些重要的数据爬下来,打包成EXE,运行结果如下所示

源码和EXE文件都放在Github上了,2019-nCoV

然后又写了个小脚本,定时每天凌晨0点爬取省份、城市、日期、确诊、死亡、治愈、疑似这7个数据,并以当前日期作为Sheet名,保存到Excel,方便以后做数据分析等用途

这个程序也已开源在github

Archives Tip
QR Code for this page
Tipping QR Code
Leave a Comment

已有 4 条评论
  1. Arthur Arthur

    多谢您的python源码! 我觉得这些数据对疾病的数据建模和验证非常有益。 我有一个小的建议,就是是否也可以以excel文件的形式共享历史的统计数据,在您的git,或这里。每日或定期更新。

    我这个建议的原因是,不是每一位读者会很早的看到您的工作。当他们想要研究或者分析数据的时候,已经错过了许多日期的数据。而这些是无法再去抓取的。

    多谢!

    1. mathor mathor

      @Arthur确实是个好的提议,但是历史数据我目前也不知道在哪才能找到,我想起来要保存数据的时候是1月30日,1月30日以前的数据我也没办法,唉

      1月30日以后每天的数据我都会更新在github中的2019-nCoV.xlsx里

      谢谢建议

  2. 神秘giser 神秘giser

    代码写得很好,但我在想怎么对其爬取的数据地区 添加空间坐标系,以用于进行地理空间的研究!!

    1. mathor mathor

      @神秘giser我不是研究地理空间数据的,我也不好意思给您什么意见,我就稍微提一提我的想法吧

      其实地理空间数据很难获取,丁香医生网站上的疫情数据也不过是个"二手的"数据,真正一手的数据应该在政府手里(如果他们统计的足够仔细,连每名患者在哪住院,在哪发病都记录下来了的话),我们现在能拿到最小的数据单位也就是"市",但是市那么大,对其添加经纬度信息似乎又没什么用,还是需要更细的数据,可是我们普通人拿不到更细致的数据,所以,还是挺困难的其实