绘制全球疫情实时地图的中国留学生
美国约翰·霍普金斯大学最新的冠状肺炎流行追踪地图平均每天有10亿次全球点击。核心团队是两名年轻的中国人和他们年轻的女导师。董恩生,30岁;25岁的杜洪如是去年秋天进入约翰·霍普金斯大学的一年级博士生。
作为中国学生,董恩生和杜洪如比大多数美国科学家更早对新皇冠流行病产生担忧和担忧。正是这种专业敏感性和对流行病信息的敏感性的结合,使他们更早地认识到制作世界流行病地图的重要性和价值。
美国东部时间5月7日,美国约翰·霍普金斯大学的流行病追踪地图显示,全球已确认超过375万新的冠状病毒感染,死亡人数超过26万。美国有超过122万确诊病例和73,000例死亡。
地图的背景是黑色的,流行病是红色的。这些数字简单而抽象,每隔一刻钟更新一次,不断变得越来越大,让人困惑。它们很重,刺痛眼睛。
这种新的冠状病毒已经导致超过260,000人死亡,其中大部分是沉默和孤独的。病人在临终病房看不到任何亲属,死后也没有葬礼。报纸不会报道他的生平。死亡人数太多就像一个黑洞,会让死者失去他们的名字和面孔。
然而,这些数字仍然很重要。这不仅对*和公共卫生机构的决策者很重要,对风险评估和流行病趋势预测模型、社会人口分析和其他领域的研究人员也很重要,对所有受流行病影响的人也很重要。
流行病地图仍在丰富和完善之中,全球平均每日点击量为10亿次,最高每日点击量为45亿次。它是*、研究人员和主流媒体引用最多的流行病数据来源。这种流行病地图也促使美国各州和世界上许多国家的*或非*组织制作类似的流行病地图,并提高数据的准确性,从而增强公众的知情权。
在地图后面
然而,许多人直到最近才知道,这份全球疫情追踪地图的核心团队是两位年轻的中国人和他们年轻的导师。
董恩生,30岁;杜洪如,25岁。他们都是去年秋天进入约翰·霍普金斯大学的一年级博士生。这两个人的名字都很儒雅。
他们的导师叫劳伦·加德纳,是一名副教授,年仅35岁,研究建筑。去年在约翰·霍普金斯大学任教之前,她是澳大利亚悉尼新南威尔士大学(UNSW)土木工程高级讲师。目前,她只带了两名来自中国的学生。
他们的部门叫做土木与系统工程系,听起来好像与流行病学和病毒学没有任何关系。但是什么都没有突然发生。
董恩生说,这是世界上第一次实时更新世界疫情地图,这一想法的正式产生是在1月21日上午,当时他和他的导师在图书馆喝咖啡——这是师生见面和交流的一种常规方式。两者都有相同的想法,“一拍即合”
在与导师会面之前,他已经开始收集数据并做准备,“从一开始,这纯粹是为了学术研究的目的。”
那天晚上,董恩生花了七八个小时输入数据和制作追踪地图,直到凌晨三四点。经过审查、修改和其他程序后,导师于22日首次在社交媒体推特上发布了第一版疫情世界地图,刚好赶上武汉于北京时间1月23日宣布“城市关闭”的时间。
董恩生说,起初几乎没有现成的模板可以应用。他不断输入数据和坐标。当数据一个接一个地出现在世界地图上时,他逐渐意识到这是第一次在全球范围内实时更新疫情地图。
和你的导师喝杯咖啡,开7-8小时的夜车,开始一项世界倡议。有那么简单吗?
在美国总统选举中,当政客们支持一名候选人时,有一句传统的谚语称赞该候选人“一生都在为此做准备”。董恩生和杜洪如都很年轻,但从他们的学习和工作经验来看,这句话确实可以应用。
董恩生说,他本科毕业于重庆西南大学地理系,2012年去美国留学。获得硕士学位后,他曾在美国的信息技术和卫生部门、软件公司、电力公司、电信公司和其他地方*实习。
他接受过正式的地理和统计学学术培训,目前的研究领域包括网络科学、移动建模、机器学习、空间分析和可视化以及传染病跨学科研究。在新的皇冠流行病爆发之前,他曾参与预测美国和太平洋岛屿国家和地区的麻疹风险以及斯里兰卡的登革热疫情。
杜洪如也有跨学科背景。他是天津大学化学工程学院2017届毕业生。他曾就读于爱丁堡大学化学材料科学专业和威斯康星大学麦迪逊分校工业工程和运营研究专业。
他擅长数学模型和路径优化,主要研究方向包括疫情大数据处理、通过网络优化和数学建模研究和预测全球疫情发展。他于2月1日加入了流行病地图团队,并编写了自动数据更新的代码。
他说,人们可能会认为病毒的传播是一种网络。州和县都是网络节点,每个节点之间的人口流动形成一个连接。无论是通过数学建模预测流行趋势,还是进行人口社会学分析,系统科学的观点都是非常重要的。
作为中国学生,董恩生和杜洪如比大多数美国科学家更早对新皇冠流行病产生担忧和担忧。正是这种专业敏感性和对流行病信息的敏感性的结合,使他们更早地认识到制作世界流行病地图的重要性和价值。然而,以前的学术训练和经验积累也使他们在导师的指导下,不仅有“思考”的大脑,而且有“自然做”的能力。
但是“做”并不比“想”容易。从1月下旬至今,董恩生和杜洪如投入了大量的精力和精力对疫情图进行升级、完善和维护,并对疫情数据进行相关研究。
在人工输入阶段,他们每天工作大约10个小时。在3月中旬向全自动数据更新过渡期间,每天的工作量达到了15到6个小时,教员也与他们一起工作到凌晨3到4点。即使在团队扩大到大约50人并且数据被实时自动更新之后,每天也只需要5到6个小时甚至10个小时来检查和纠正数据。
恶魔通常隐藏在细节中。4月13日,约翰·霍普金斯大学新的官方流行病统计网站设立了自己的目标,错误地将全球确诊病例数报告为超过200万,因为佛罗里达的实际病例数21019被错误地填写为123019,导致100,000多个病例出现错误。但是不久之后,他们把这个数字带回了190万。
验证数据以确保准确性是流行病地图维护的一个重要部分。杜洪如表示,由于疾病预防控制中心的数据滞后,他们主要依靠获取当地媒体和国家卫生官员在推特上报告的数据,而其他国家和地区的疫情则是基于世界计量表和当地媒体等网站。由于更新时间早于官方数据,因此在计算机自动更新后的第二天,该小组将利用各州疾病控制和预防中心的数据以及世界卫生组织的数据检查美国的疫情数据以及其他国家和地区的数据。
董恩生表示,为了确保数据的准确性,他们还采取了四项措施。首先,他们保留数据的原始记录,用追溯记录来检查每次更新。其次,他们总结了时间序列表。第三,他们列出了所有更正的记录。第四,他们组织了人工验证。
值得一提的是,在约翰·霍普金斯大学疫情世界地图的背后,更多的中国年轻人在积极活动。
据董恩生和杜洪如介绍,目前运营团队约有50人,其中数据验证团队的志愿者主要是来自各个部门的中国学生。然而,中国提供的疫情数据为国际研究做出了更加不可磨灭的贡献。新一轮疫情应对为中国开展跨学科国际传染病研究、加强全球公共卫生参与、提高*部门和研究机构疫情数据的可视化和国际化提供了新的机遇。
突出
在董恩生和杜洪如看来,约翰·霍普金斯大学的爆发图因各种因素而突出,主要有以下八个原因:
一是早点开始工作,在世界上领先。与后来出现的其他流行病地图相比,这些数据更加准确和快捷。其次,它专门研究流行病学。美国的疫情精确到县一级,这对研究人员和公众很有帮助。第三是地图绘制的专业性。第四,数据公开透明。所有数据都上传到GitHub,为全球所有*决策部门和科研人员提供开源数据。五是确保及时更新和高用户参与度。德国、法国和意大利等非英语国家的许多用户将自愿向他们报告当地媒体报道的最新疫情,比等待官方审核渠道的确认数量要快得多。第六是疫情图的设计。黑色和红色之间的反差很大,构成了强烈的视觉冲击。第七,约翰·霍普金斯大学在全球医学和公共卫生领域享有很高的声誉,这使得流行病地图从一开始就拥有普通大学无法仅仅凭借其声誉获得的权威。八是从最初的导师推特到各个国家的媒体报道,导致社交网络和媒体传播的滚雪球效应。
从日内瓦的世界卫生组织总部到纽约的联合国总部和华盛顿的白宫流行病会议,以及美国的主流媒体,如《纽约时报》,他们中的大多数也使用他们的统计数据。
但是,董恩生特别指出,疫情图和疫情数据不能完全反映一个国家抗击疫情的能力。目前,国际社会缺乏疫情报告的全球指导文件和统一的报告标准。各国和各地区的统计数据各不相同,病毒检测水平也各不相同,不同国家的人们对疫情的看法也各不相同。
在欧洲和美国,也有许多统计上的混乱、遗漏和重叠。例如,美国*系统分为联邦*和地方*。尚不清楚联邦*的疫情是否包括在州和县的统计数据中。由于囚犯的隐私和相关法律,许多*不愿意公布疫情。在州县交界地区,出院或转送医院的病人往往跨越州界,如何统计也是一个难题。此外,考虑到双重计算的可能性,美国的军事流行病还没有被计算在流行病地图上。
在世界范围内,有时会出现一个“数据参考周期”,即相关网站的数据可能来自约翰·霍普金斯大学的疫情图,因此需要进行仔细筛选,不断提高直接获取数据的能力。
董恩生认为,尽管美国疫情严重,但从科研和大数据创新的角度来看,许多做法值得借鉴。
例如,对各种疫情预测模型的分析层出不穷,相关研究可谓“八仙过海,各显神通”。无论是面对学术界还是公众,这种数学模型分析都是非政治性的。无论预测是对是错,都可以为公共卫生对策创造一个讨论的空间,产生许多新的观点和对策。
追求多学科情报的整合,“跨境”特征突出。在美国,本科生可以选择不同专业的课程。在美国,像董恩生这样获得理学硕士学位并攻读工程学博士学位的人并不少见。然而,为了避免流行病地图的单一呈现,它需要许多学术背景,如地理、计算机和疾病传播。
事实上,约翰·霍普金斯大学系统科学与工程中心去年被重新命名,这一举动本身就凸显了“跨界”的色彩。董恩生说,系统工程本身在美国是一个新领域。除了疾病传播,它还与公共卫生学院和美国医院系统在包括CT扫描和人工智能在内的许多项目中进行合作。
此外,在科学研究领域,有能力的人无需资历就能相对顺利地脱颖而出。这对于培养科学研究和创新的氛围也非常重要。董恩生、杜洪如和他们的导师加德纳是“新人”,他们去年进入约翰霍普金斯大学,非常年轻。他们推出的流行地图很快得到了学校当局在许多方面的支持,包括资金、服务器维护、图书馆资源和运营团队建设。
约翰·霍普金斯大学在全球公共卫生领域的声誉无疑给了他们一个优越的平台,但他们作为“新血液”的活力、活力和干劲反过来又为学校品牌增添了黄金。
董恩生和杜洪如都钦佩和赞扬他们的导师——加德纳副教授。据他们介绍,这位年轻的女教师经常在凌晨2点或3点工作,审查和指导学生的工作,处理错误的反馈电子邮件,与有关各方协调,并向*和议会报告...尽管加德纳有很高的学术热情和专业敏锐度,但她并不否认学生的工作和贡献,为学生提供许多机会,并注意帮助和保护学生。
更有价值的是,他们“非常有原则”,坚持披露数据,拒绝将流行地图商业化。一些美国一流的大公司提供高资本和有利的合作条件,这似乎是“双赢”。然而,该团队仍然拒绝,坚持公开分享,反对与商业的过度联系。正是这一原则使约翰·霍普金斯大学的流行病追踪图获得了更广泛的公众影响。
梅马上就到了。现在,约翰·霍普金斯大学的流行病追踪地图已经升级到多个版本,数据分类更加丰富和详细。在世界流行病学地图中,不仅有180多个国家和地区的确诊病例排名,还有各州和各省的确诊病例排名。除了累计确诊病例数外,还有一些重要数据,如未痊愈患者数、发病率、确诊病例死亡率、检出率和住院率。在美国的流行病地图中,不仅有各州确诊病例数、人口比例和死亡率的数据,还有美国确诊病例数最高的50个县和死亡人数最高的20个县的排名。
此外,还有一个专门的章节来分析一系列重要数据,以判断疫情的传播情况,包括疫情在美国各州的种族分布情况。每100,000人中确诊病例和死亡人数的全球比较;每日新病例数据等。这决定了流行病曲线如何在世界上10个受影响最严重的国家中传播。
杜洪如说,可靠的数据是研究和决策的基础。从约翰·霍普金斯大学的流行病跟踪图中获得的大规模交通量显示了对可靠和客观信息的巨大需求。随着流行病地图的影响扩大,他感到更大的压力,在更新和检查数据时更加谨慎。这是一个面向全世界的重大公共卫生事件。流行病地图的意义超出了学术研究本身。
董恩生说,自疫情爆发以来,他一直忙于更新数据和更新疫情图,“忘记生活是什么样子。”“对我来说,工作从来没有停止过,越来越多,越来越重。有时我突然抬头看到附近的疫情。世界变化真的很快。”
我相信董恩生和杜洪如将会对这一流行病的年轻人留下深刻的印象。疫情最终会过去,世界变化的步伐不会放缓。我希望这两位中国年轻人走得更远更远。
上一篇:“科大一环”部件研制完成
推荐阅读