世界热点!最知名疫情地图即将关闭,创建它的中国留学生回顾三年历程

来源:医学界 2023-03-09 08:07:24

实时准确的数据,能够为疫情防控提供预警和预测,希望疫情数据公开能有国际化的标准。

撰文 | 张皓宇


(资料图片)

新冠疫情三年来,关注全球疫情的人,一定对这句话无比熟悉:“根据约翰斯·霍普金斯大学统计……”

3月10日起,约翰斯·霍普金斯大学新冠资源中心将停止搜集和报告新冠疫情数据,这一全球首个可视化的疫情地图,也将结束使命。

北京时间2023年3月7日19:00该疫情地图的数据(图源:约翰斯·霍普金斯大学新冠资源中心)

虽然医学和公共卫生一直是约翰斯·霍普金斯大学的强项,但这一疫情地图却出自该校的土木和系统工程系,核心创始团队为劳伦·加德纳(Lauren Gardner)教授和两位中国留美博士生董恩盛、杜鸿儒。

近日,董恩盛、杜鸿儒与“医学界”进行了独家对话,讲述了疫情地图从创建到完成使命的历程。

上线最早、更新最频:从一个想法到持续共创

2020年1月,董恩盛和许多关注国内情况的留学生一样,早早便注意到了不同寻常的疫情新闻。“我大概在1月10日左右对国内疫情有所耳闻,1月20日左右,美国发现首例新冠肺炎病例,当时美国和中国的媒体关注度差异非常大,国内已经有非常多的讨论,而美国这边仅仅当作‘边角料’的小新闻,几乎没人关注,我就想,能不能为疫情做一些力所能及的事情。”

董恩盛有着丰富的多学科研究背景,本科、硕士毕业后在美工作过数年,学习或从事过的领域涵盖地球物理、地理信息系统、统计学、网络科学、公共卫生等。他曾对美国麻疹病毒风险做过研究,这让他对地方公共卫生数据的缺失情况深感困扰。“收集数据的过程非常痛苦,因为美国很多郡县公布的数据不精确。”

纷至沓来的国内新冠疫情消息,勾起了董恩盛对“非典”的记忆。他坦言这让他“低估”了疫情,但反倒促成了疫情地图的诞生。“我想,与其等疫情数据公布后研究,不如我自己手动记录,精确度可能更高一些。我估计这次也会局限在几个国家、持续半年左右,如果知道疫情会蔓延全球、持续这么久,当时的我,可能就不做这个项目了。”

董恩盛(受访者供图)

1月20日,钟南山院士在央视采访中确认新冠肺炎“人传人”,大洋彼岸,董恩盛已粗略统计了一版静态的疫情数据地图。带着初步的想法,第二天,他和导师加德纳教授照例喝咖啡、聊研究计划,导师提起新冠,两人一拍即合,决定设计地图——此时的目的,依然重在为学术研究做数据收集。

在上一个项目中,董恩盛就设计过美国麻疹风险地图。1月21日谈话后当晚,他忙碌了八九个小时,直到凌晨三四点钟,完成了初版疫情地图的建设。1月22日,加德纳教授在推特上公开了这一地图,迅速引发大量关注。

董恩盛回忆,1月31日,系统服务器遭遇了第一次因访问量激增而造成的宕机,“一天之内宕掉了两回”。2月1日,杜鸿儒加入团队,建议并负责将数据收集由手动转向自动化,并持续做自动更新代码的编写。

随着疫情在全球的迅速蔓延,世卫组织、哈佛大学与牛津大学合作、美国疾控中心以及部分媒体都有类似针对全球或本国的数据统计平台。在董恩盛看来,一方面这些平台为他们提供了重要参考,一方面,约翰斯·霍普金斯大学的这一疫情地图在持续性、更新频率、精细化和可靠性上,都有着足够的优势。

“我们是上线最早、持续最长的全球疫情记录地图,许多平台持续一段时间后可能就不做了,像牛津大学Our World in Data后来也从我们这里抓取数据。”董恩盛介绍,“而且我们的数据最快每半个小时更新一次,更新频率非常高,数据来源也比较可靠,很多政府部门到后来会直接跟我们联系,沟通需要调整的公布数值或格式。

杜鸿儒向“医学界”表示,“要做到实时更新,最大难点是数据源实在太多,要根据不同数据源设计不同的收集系统,又显然不太现实,因此需要开发一套适用于全世界不同数据源的收集系统,这在前期花了很大精力。”

疫情地图上线前两个月的手动收集阶段,团队每天要工作大约10个小时,这期间升级系统最忙碌的一周,每人每天要奋战15到20小时。2020年3月下旬,疫情地图终于转换为全自动化收集,团队也逐渐扩大到40人左右。

来自不同国家的学生加入团队后,对提升疫情地图的精细化程度也有很大帮助。董恩盛表示:“像欧洲的许多国家,我们原来只能追踪到国家级的数据,有了更多的志愿者后,他们懂当地的语言,又有相应技术,可以把州省一级的数据完善进系统里。”

审核数据的准确性更是艰巨的任务。杜鸿儒指出,最常见的异常就是一些国家或地区突然出现了负的新增疫情数据,或负的新增死亡病例。团队会设法联系该数据的权威发布机构,了解异常情况的原因,确保公布到地图上的数据无误;如果联系后还是没能解决疑问,会详细标明异常数据的具体时间和地点,并提醒用户谨慎使用这些数据。

三年来,约翰斯·霍普金斯大学疫情地图的数据分类不断完善。董恩盛强调,公开透明是疫情地图成功运转的重要基础。“我们把所有原始数据都完整公布在网站上,你可以追踪到数据的修改记录,包括网站留言、邮件等,我们也会及时回复。”

从推动研究到改变世界

正如项目初衷,疫情地图是开展一系列研究的基础。根据疫情数据,团队首先可以对疫情变化的影响因素展开深入论证。“很多人会觉得,减少聚集有助于防范病毒扩散,我们用数学建模的方式进行了验证。”董恩盛表示,“减少流动、维持社交距离,确实会有效控制住疫情的发展。”

项目团队一直与美国疾控中心密切合作,与全美的权威实验室保持沟通,结合强大的数据积累对疫情进行短期和长期的预测。杜鸿儒承担了这方面较多的工作:“在过去三年里,我负责运用深度学习的模型,基于一些人口流动、社会调查情况以及各变种病株的基因组数据,对美国各州的疫情进行预测,一般在每周一预测之后四周的疫情发展情况。”该项研究的系统成果,会在近期发表。

杜鸿儒(受访者供图)

疫情地图在2021年就已达到了两千多亿人次的访问量。项目团队收到了大量来自普通人的建议、反馈和感谢,深切感受到这些密密麻麻的数据,在持续唤起民众对个人、家庭防护的警醒作用。

“我记得《华尔街日报》对这一地图的评价是,全球传染病疫情第一次实现公共数据可视化,全世界的人可以像观看一场足球比赛一样,实时关注数值的变动,这是前所未有的事情。”董恩盛对一些用户的来信记忆犹新,“有人和自己95岁的母亲天天关注疫情地图,写信表示我们真的提供了非常多有用的信息;一所小学的老师反馈,有的学生每天来学校第一件事就是浏览疫情地图,小朋友们在关心疫情中,也把注重防护的理念带回了家。”

让团队深感欣慰的,还有一些护士的来函,表示因为疫情地图了解了自己医院所在郡县和周边地区的情况,根据数据及预测信息,对未来可能的病人增加有了一定的心理预期,给工作带来了重要帮助。

随着这份地图影响力的不断增强,全球越来越多的政府机构、主流媒体习惯性地引用其中数据。在这一过程中,疫情地图从单向度地收集全球各地数据,逐渐发展到推动一些政府部门优化数据公布的方式。

董恩盛指出:“有些地方没有规范化的统计和公布方式,会根据我们的疫情地图变得更规范化;而全球有的国家卫生部门最初公布数据时,只是发一张图片,很零星,还不方便自动化获取,当了解到我们的数据可视化形式时,也逐渐用这种数据地图的方式来呈现。印象中,东南亚、西亚、非洲的部分国家,都经历了这样的完善过程。”

这一项目让团队取得了业界的广泛认可。2022年9月,项目创始人劳伦·加德纳教授因新冠疫情可视化“仪表盘”(the Cvoid-19 Dashboard)获得了拉斯克医学奖公共卫生服务奖。这是被认为仅次于诺奖的医学界奖项,颁奖词称项目“为实时传播权威公共卫生数据确立了新标准”。

告别、回首与展望

3月10日,疫情地图将正式停止“工作”。实际上,现在部分数据更新服务已经无法继续。

董恩盛解释道:“下线的原因基于人力、资金等多方面,但最直接的是,很多地方的数据报告频率大为降低,而且居家检测的结果无法及时反馈。像美国很多地方,现在一周或两周才公开一次,而且只汇报州级的数据,郡县级的数据不再汇报。这种情况下,我们认为即便收集到数据,研究意义也不是特别大。目前来看,全球疫情也趋于平缓,也是一个适宜的结束时机。”

疫情地图项目的成功,得益于多方的支持,其中也包括约翰斯·霍普金斯大学。董恩盛常常提起的一段记忆,是2020年4月左右,美国疫情逐渐爆发,约翰斯·霍普金斯大学停课并全校封闭,“但学校专门为我们组留了一个Command center,相当于实验室,让我们有足够的条件进行维护和研究。”

疫情地图项目启动后,加德纳教授和董恩盛、杜鸿儒等可以参加公共卫生院系的讨论,听取专家的建议;技术层面,得到了应用物理中心的支持;数据的核实与收集,学校会协调与合作过的各级政府进行沟通,逐渐拓展权威数据的来源。

“三年项目的最大收获,可能是改变了对读博的想象。”董恩盛对此颇为感慨,“原先觉得读博是一门心思去读书,有了这次经历后,我发现其实学校能给我非常多的机会去拓展多维度的兴趣,有机会接触不同领域的学者,甚至还有机会主持项目,比如现在我要定期主持团队会议、分配任务,给了我看待世界不一样的视角。”

如今,董恩盛、杜鸿儒都早已在新的科研项目上出发。董恩盛现在着手对疫苗接种意愿展开研究,关注哪些人群愿意和不愿意接种疫苗,尤其在美国这样种族、文化比较多元的环境中,民众会受哪些因素的影响。杜鸿儒则专注于通过大数据来理解外部因素如何影响人类行为,并将人类行为反馈结合到传染病模型中,希望能对今后的传染病疫情做出更准确的预测。

杜鸿儒对未来的公共卫生系统建设有许多期待,强调了公共卫生数据标准化的重要性:“实时准确的数据,能够为疫情防控提供预警和预测。希望疫情数据公开能有国际化的标准,不仅能大为方便疫情数据的收集整理,更能提升研判疫情形势的效率,帮助政府和公众做出相应的防控措施。”

参考文献:

[1] 央视新闻:《日点击超10亿 两名中国博士生“操盘”全球最流行新冠肺炎疫情图》

http://api.cportal.cctv.com/api/newsInsert/ywnr.html?id=ArtihO8oXp6l6PbJBMI0iXvz200406&preview=1&version=724.

[2]西南大学地理科学学院:《生涯人物谈|董恩盛:疫情背后的地科人》

http://geography.swu.edu.cn/info/1059/1840.htm

关键词:
x 广告
x 广告

Copyright @  2015-2022 99新科技版权所有  备案号: 沪ICP备2022005074号-4   联系邮箱:58 55 97 3@qq.com