来源:科研圈
钟南山院士团队在《胸部疾病杂志》期刊发文,利用机器学习预测重点省份及全国的新冠疫情发展。研究认为:
疫情在二月底已达到峰值,到四月底将趋于平缓;
如果推迟5天采取封城等干预措施,中国大陆地区的感染规模将达到目前的3倍;
如果提前5天采取措施,感染规模将是目前的三分之一;
若逐渐放开对湖北省的限制,将导致当地在三月中旬出现第二个峰值。
近日,国家卫健委高级别专家组组长、中国工程院院士钟南山领导的团队在《胸部疾病杂志》(Journal of Thoracic Disease)发表研究,用机器学习方法对 2019 冠状病毒病(COVID-19)疫情流行曲线进行了预测,认为疫情在二月底已达到峰值,到四月底将趋于平缓。研究团队还预测,如果推迟五天采取封城等干预措施,中国大陆地区的感染规模将达到目前的 3 倍。此外,解除对湖北省的封锁将导致当地在三月中旬出现第二个峰值,并使疫情持续到四月底,因此团队建议继续采取有力措施进行防控。
《胸部疾病杂志》是一份国际化的同行评审开放获取期刊,由呼吸系统疾病国家重点实验室、广州呼吸系统疾病研究所(GIRH)、广州医学院第一附属医院和转化医学学会(STM)主办,现任主编为钟南山院士。
模型设计和研究方法
这项研究主要使用了 SEIR 模型。模型全称易感-暴露-感染-移除(Susceptible-Exposed-Infectious-Removed),也就是将人群分为这四个可能状态,通过计算人群如何在四种状态之间切换,判断疫情流行规律。
为了控制疫情蔓延,从 1 月 23 日起,中国采取了史无前例的干预措施,包括封城、延长春节假期、严格限制出行和人群聚集、关闭公共场所和进行体温检测。研究假设在 1 月 23 日前每个人每天接触的到的人数为 15 人,1 月 23 日后这个数字下降到 3 人,3 月 1 日后又上升到 10 人(假设复工后仍然采取一定的控制措施)。参考其他文献,研究团队在模型中设定新冠肺炎潜伏期为 7 天,病死率为 3%。
在这些前提下,研究团队对湖北、广东和浙江三个省份以及全国整体的疫情发展进行了预测。此外,研究还使用 2003 年严重急性呼吸综合征(SARS)暴发时的数据,对长短期记忆模型(LSTM)进行训练,预测全国疫情趋势。
各省份疫情预测
研究团队预测,如果继续采取目前的干预措施,湖北省内疫情在 2 月 20 日已达到峰值,当时现存确诊病例预测值为 42 792 例;疫情在四月底基本结束,累计确诊病例最终达到 59 578 例。(卫健委通报显示,2 月 20 日湖北省现存确诊病例实际值为 48 730 例。)
论文还指出:“如果没有及时采取干预措施(即推迟 5 天),2 月 25 日时(湖北省)感染数将达到 115 061 例的峰值,总感染人数将达到 167 598 人。而如果提前五天采取干预措施,感染数将在 2 月 15 日达到峰值,总感染人数不会超过 25 000 人。”
受人口流动规律影响,在全国范围内,广东和浙江累计感染人数长期在第二名、第三名徘徊。研究团队根据铁路、航空和道路交通数据,计算出各省份每天输入和输出的迁移系数(migration index)。
1 月 1 日到 2 月7 日的迁移系数。图中红色代表湖北,绿色代表广东,蓝色代表浙江;实线代表输入,虚线代表输出。可以看出,强有力的干预措施使得流入广东和浙江的人群数量在 1 月 23 日之后大幅减少,并保持在低水平。研究预测这两个省份的疫情在 2 月 20 日已达到峰值,当时确诊患者数量预测值分别为 1202 例和 1172 例;疫情预计在四月中旬结束,患者总数分别为 1511 例和 1491 例。如果推迟 5 天采取干预,两个省份的疫情将分别在 2 月 26 日和 25 日达到峰值,每个省份感染人数总计将达到 10 061 例;而如果提前 5 天采取措施,在这两个省份“疫情将得到有效的抑制”。
全国疫情预测
按照目前的干预措施,研究团队预测疫情在 2 月 28 日到达峰值,此时现存确诊预测值为 59 764 例,最终总感染人数将达到 122 122 例。(卫健委通报显示,28 日实际现存确诊为 37 414 例。)
如果推迟 5 天采取干预措施,研究团队预测疫情将在 3 月 4 日到达峰值,当日现存确诊 173 372 例,到四月底感染人数总计高达 351 874 例;如果提早 5 天采取干预措施,全国感染人数将为 40 991 例。
SEIR 模型预测的全国现存感染人数,包括 1 月 23 日采取干预措施的情况(蓝色)、推迟 5 天采取措施的情况(灰色)和提前 5 天采取干预措施的情况(红色)。实际的确诊人数用空心点标出。研究团队也对此前同行提出的几个模型进行了回顾。此前有研究预测,即使武汉封城,中国其他城市也会出现大规模疫情暴发。针对广东和浙江这两个人口流动大省的分析表明,这种情况并未发生。研究团队总结,本次研究的模型预测结果符合疫情的实际发展趋势。
研究还认为,逐渐放开对湖北的限制导致新一批易感人群流入,即节后从其他地区返回湖北工作的人群,使当地 3 月 11 日再出现一个小高峰,不过当地现有的一些防控措施有助于减少返程高峰的影响。
本次模型计算中设定新冠肺炎潜伏期为 7 天,而有文献显示潜伏期中位数为 3 天。研究团队使用不同的潜伏期对模型进行测试,发现更短的潜伏期将加快峰值的到来,但是对感染规模没有显著影响。
关于这次研究的局限,研究团队认为依靠核酸检测得出的疫情曲线很可能低于真实数值,只有采集足够的血清学数据才能了解真实的发病率。研究团队也没有考虑实验室检测能力,尽管这个因素可能限制了确诊的数量。最后,研究也没有考虑季节的影响。研究团队指出,有观点认为在非典流行时期,气温变化对疫情发展造成了重要的影响;如果这一规律也适用于 COVID-19,那么广东的疫情将比浙江和湖北更早结束。