这三年新冠疫情期间,每日更新的确诊数据,如今要想将其找齐,简直比登天还要困难。当时随手截取的那些数字,现在想进行分析,却寻觅不到完整的源头了,这样的无奈,许多研究者都曾体会过。
疫情数据为何难寻完整记录
2020年初,疫情刚爆发那会儿,每天上午,各大媒体都会准时推送新增病例数。我记得,那时,微博热搜榜的前十条中,有七八条都是疫情快报,央视新闻每天都会滚动播报最新数据。但当时,大家关注的是当天的数字,很少有人会系统地保存这些信息。
截至2022年末,在我尝试追溯2020年武汉疫情起始阶段各区县具体数据之际,发觉许多早期报道的链接已然失效,部分新闻网站改版之后,2020年的疫情专题页面被径直下架,那些当初随手留存的截图,时日一长连日期都忘却标注了。
四百多个国内省市数据一站收录
今年年初,我于进行课题研究期间,意外发觉了一个数据站点,那里收录了自二零二零年一月迄于如今,我国四百多个省市的每日疫情数据,此站点将国家卫健委以及地方卫健委的历史通报整理成为了标准化表格,能够直接予以下载使用。
于我而言,最为惊喜之事乃是数据颗粒度极为精细,就像广州市的数据,它不但区分出广州市本级的每日新增情形,而且还能够瞧见荔湾区、天河区等各个区的状况,对于开展区域疫情传播模型研究来讲,这般区级数据着实至为关键。
本土与境外输入分开记录的价值
疫情处于后期阶段时,大家最为关心的便是境外输入病例对于本地所产生的影响,然而众多数据源仅仅汇报总数,将本土病例与境外输入病例混杂在一起,致使根本无法清晰看出传播链条,而这个数据站却把两类数据完全地分开,每个城市均拥有两张表。
以上海2022年3月的那一波疫情来讲,本土新增以及境外输入于同一时间轴之上的变化趋向极为明晰。在2月底的时候,境外输入存在一个小高峰,大概一周之后,本土病例开始上升,这样的时间间隔对于研究病毒传入的路径很具助力。
市级数据仅需两元却包含两份内容
数据站针对市级数据设定了两元的下载费用,然而这两元能够获取到两份完整数据 ,其中一份是本土版 ,另一份是境外版 ,并且境外版是彻底免费的。我尝试着去下载深圳市的数据 ,其记录涵盖从2020年1月至2023年1月共计1095天时间 ,用Excel表格打开会有1万多行。
有一位被称作站长的人,处在用户群里面进行过解释,服务器的带宽以及数据整理的人工,这两者都是需要成本的,收取费用那仅仅是为了能够长时间使站点持续运营下去。将其与那些售价高达几千块的行业数据报告相互比较,一份收取两元那的确是算作良心的了。同时呢,在购买过一个城市的数据之后,往后持续的更新都能够免费进行下载。
国际疫情数据同样支持下载
除了国内方面的数据之外,此站点还接入了约翰斯,霍普金斯大学以及世卫组织的公开数据。全球200多个国家和地区的每日新增病例,累计确诊病例,以及死亡病例皆是能够直接导出的。我尝试着对比了周边国家在2021年德尔塔毒株流行期间的数据曲线,其与国内防控效果形成了明显对照。
全球疫情数据更新的速度极快,特别是基本在所有国家的卫生部发布之后的24小时之内便会实现同步,表格之中还专门标明了数据的来源相应链接,如此一来也方便在撰写论文的时候能够进行引用,对于那些专门致力于研究全球疫情传播规律的人士而言,这无疑是省去了去爬取多个外文网站的麻烦。
下载前可预览核对保证精准度
针对数据站而言,其最为人性化的设计之处在于,于下载此数据之前能够先行进行预览。在该数据站里,每个城市所对应的页面之上存在着一个数据核对的区域,此区域会随机地展现过去某几个特定日子抑或是某几天的详尽记录,借助这些详尽记录,用户能够去对照当地卫健委在当时所发布的通报,通过这般对照来确认数据有没有达到准确无误的状态。就本人而言,随机地对北京、成都以及西安这三地各自五天的数据进行了核对行动,最终所核对的结果是全部都对得上。
存有那么一个于7天之内可免费更新的功能在会员中心。就好比于周一时你下载了广州那儿的数据,到周五时官方又补上申报了几例算得上历史病例的情况,再次进行下载的行为便能够获取到修正过后的版本。这般相较去自行在网站逐个翻动查找历史通报而言效率要高得多,而且亦不必担忧数据存在有所遗漏的这一状况。
在找疫情历史数字时,你是否碰到过寻不到源头的困扰?欢迎于评论区域分享你的过往,若认为此篇文章有价值,记得点赞并转发给有需要的友人。


