对病毒在人群中传播的智能预测模型构建与验证是当前的工作重点。
不过,在 2020 年 2 月 27 日广州市政府新闻办举办的疫情防控专场新闻通气会上,钟南山院士在谈到疫情的预测时表示:
疫情开始时,国外有流行病学家用权威的试验模型,预测 2 月初中国感染新冠肺炎人数将达 16 万人。这是没有考虑到国家的强力干预,也没有考虑春节后的延迟复工,我们也做了预测模型,2 月中旬或下旬达到疫情高峰,确诊病例约六、七万人,投到国外权威期刊,被退了回来,感觉和上面的预测水平差太多,还有人给我发微信说“你的话几天之内就会被碾个粉碎”。但事实上,我们的预测更接近权威。
西方的傲慢与偏见?
钟南山院士此言一出,引发网友热议。
一方面,不少网友认为包括权威期刊审稿人在内的众多西方学者带有预设立场,因此投稿被退可以说是一种恶意揣测。
另一方面,网友认为由于社会背景、文化、制度等方面的差异,出现所谓的“偏见”也无可厚非。正如钟南山院士所说,国外并不了解我国国情,没有考虑到国家的强力干预和春节后的延迟复工起到的积极作用。
【雷锋网(公众号:雷锋网)注:图源新浪微博】
雷锋网注意到,虽然钟南山院士并未详细介绍被退回的疾病预测模型,但知乎一位名为“疯狂绅士”的计算机软件背景人士认为,钟南山院士的模型叫「具有饱和发病率 SIQS 传染病模型」。根据其解释,任何传染病都具有饱和发病率,即不可能完全被消灭。
该网友提到,SIQS 实际就是在 SEIR 的基础上加入了干预手段(比如这里就指国家利用早发现、早隔离的手段进行了强烈干预)。而所谓的 SEIR 正是一种常见的传染病模型,此前有关 SARS 的传播动力学研究大多也都采用了 SEIR 模型。
【图源百度百科】
实际上,这一表述也与钟南山院士当天在会上的观点类似:
我们在传统模型基础上加上两个影响因素,第一个是国家强力干预,第二个是春节后的回程高峰。
利用 AI 以 SARS 数据为基础进行训练
另外雷锋网了解到,2020 年 2 月 28 日,钟南山院士等人在医学期刊 JTD 发表了一篇名为《公共卫生干预下 COVID-19 流行趋势的 SEIR 和 AI 预测修正》(Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions)的论文。
根据论文,研究团队将 2020 年 1 月 23 日前后的人口迁移数据及最新的新冠肺炎流行病学数据整合到 SEIR 模型中导出流行曲线。值得一提的是,团队还利用 AI ,以 2003 年 SARS 数据为基础进行训练,从而更好地预测新冠疫情。
具体来讲,研究人员通过引入移入参数 In(t)和移出参数 Out(t)修改了原始 SEIR 方程,进而解释动态易感 [S] 和暴露 [E] 种群状态。修改后的模型如下图。
值得一提的是,研究团队使用 LSTM(长短期记忆)模型——一种用于处理、预测各种时间序列问题的循环神经网络(RNN),预测新增感染数随时间的变化。
对于基本训练数据集,研究团队使用了 2003 年 4-6 月 SARS 的病例统计,同时纳入 COVID-19 流行病学参数,如传染概率 b、传染系数(率)β、潜伏率 σ、退出率 γ 等。
此外,由于数据集相对较小,团队开发了更简单的网络结构防止过拟合,并使用 Adam 优化器优化模型并迭代 500次。
根据上述方法,研究团队预测,疫情将在 2 月底达到高峰,并在 4 月底得到基本控制。同时,如果国家实施的干预措施推迟 5 天,中国大陆的疫情规模将增加 3 倍;如果取消湖北检疫站点,将导致湖北省在 3 月中旬出现第二次疫情高峰,同时疫情可能持续至 4 月下旬——这些结果都得到了机器学习预测的证实。
在雷锋网编辑看来,对于我国预测模型被国外权威期刊退回一事,我们应该持一个更加开放的态度,毕竟国内外预测模型的准确性孰优孰劣尚未可知。而且,被期刊退稿在科研过程中也并不稀奇,疫情当前,科学工作者的国别、立场不该是我们最关心的问题。
参考资料:
https://www.zhihu.com/question/375257984
http://jtd.amegroups.com/article/view/36385