出品:新浪科技《科学大家》
撰文:王元卓 中国科学院计算技术研究所研究员、博士生导师,大数据研究院院长
疫情爆发期间,疫情数据的高位保持和新产生的传染突发事件对政府及相关管理部门现有的管控方法和措施都提出了新的严峻挑战。人们最关心的疫情的发展何时出现拐点?以及疫情何时能过去?我们的生活何时能恢复正常?而大数据的两个主要作用就是感知现在和预测未来!
接下来,我们通过“中科天玑”疫情数据分析系列系统,融合所采集的开源网络数据,通过智能模型的学习,基于截至2月12日12时的数据,对当前的疫情的发展给出了如下分析和判断。
根据系统的数据显示,由于返程高峰的到来,尚未能够准确的从数据分析得出疫情拐点,其要根据对返程高峰的防控情况来决定,但从现有数据分析来看,疫情的峰值有望在2月中下旬出现。
目前,湖北累计确诊人数达到33366人,河南、浙江、广东大于1000人,安徽、湖南、江西大于500人,面对目前的返程期疫情防控仍然很严峻,所以对疫情拐点预测带来了很大不确定性。
全国疫情地域分布
根据上图的图形态势,可以看出当前疫情确诊人数已经突破40000人,但值得注意的是累计疑似病例开始有下降的态势,有转好的迹象,疫情峰值有望在2月中下旬出现。
全国新增确诊病例趋于缓和,呈下降趋势,最高时接近4000人左右,疑似病例波动较大,但整体也呈现出下降态势,证明各级管理机构前期采取的“早发现、早诊断、早隔离”的措施取得明显效果,下一步各级管理机关还应该加大对机场、火车站、汽车站等交通工具的防范措施力度,避免返程高峰引起疫情再次上升。
新增治愈病例呈上升趋势,新增死亡病例仍呈缓慢的线性增长趋势,说明社会医疗保障条件的有效增强,治愈率会越来越高,死亡人数会越来越少,当前阶段。一是要加大研发力度,尽快研发出疫苗,二是要给予群众以引导,增强自我防范意识。
以上各图趋势说明,由于疫情爆发时,部分管理部门未来得及采取果断的措施,疫情已向全国播散开来,湖北邻省疫情表现更加明显,在后续各级管理机构采取果断措施之后,到目前为止在现有高强度管控强度下,新增疫情病例得到有效控制,累计疑似病例呈下降趋势。
通过智能模型对历史数据和案例的学习,已初步完成了预测模型的训练过程,不断优化参数,可以进一步拟合不断演化的疫情发展过程,从而得出更加贴合实际的预测结果。
系统成功预测了2月3号至5号为新增确诊高峰以及之后的发展趋势
此前,1月底疫情预测模型首次预测2月3号至5号为新增确诊高峰,之后将逐步下降,后经实际数据验证,证明疫情发展情况符合预测结果。随着新增疑似的变化以及干预力度加强,下降过程中会出现波动反复,但趋势不会改变。
针对统计方面的口径指标,在此向大家详细解释说明如下:
新增确诊人数:指当日0时至24时内新增的确诊病患人数。当该指标达到峰值出现拐点时,对全社会和我们每个人而言,意味着新冠病毒传播得到了初步控制,形势将逐渐向好的方面发展。
现有确诊人数:指截止当日24时的累计确诊总人数减去既往累计康复和累计死亡人数。该指标达到峰值出现拐点,意味着每日康复出院的病患人数开始超过新增确诊人数,疫情传播进一步得到控制。对于医疗疾控系统来说,意味着他们面临的诊断和治疗压力开始逐步得以缓解。
基于已有感染确诊数据和模型研究成果(具体见下图),我们再次分析预测:新冠病毒疫情的累计确诊人数峰值拐点将出现在2月中下旬,此后全国累计确诊人数将会逐步下降,医务工作者面临的压力开始逐步得到缓解,疫情发展进一步得到控制。
从目前实际统计情况来看,湖北以外的省、直辖市、自治区每日新增确诊病例数已经连续下降6天,下降的拐点在2月5日左右。需特别注意,新增确诊病例数出现拐点,并不意味着可以放松防控工作。在这一拐点之后,不排除还会出现阶段性的新增确诊人数反复回升。理由是,各地陆续复工后,多达1.6亿人口流动返程潮对疫情传播将带来巨大的防控压力,首当其冲的是珠三角、长三角和京津冀等就业和人口密集地区,尤其是浙江、广东、河南等人口大省将面临巨大的疫情防控压力。
智能分析模型拟合全国累计确诊病例数据,真实数据和预测数据曲线基本重合,模型拟合平均误差率保持在1%左右,以2月9号为例,真实数据为40224,预测数据为40188,误差率为0.09%。该模型预测数据真实反映了疫情发生周期内速度趋势。 预计2月12号全国确诊病例将达到46811人左右,各地医院应及时做好相应准备,包括床位、医护人员的配给以及配套的医疗用品。下图为全国累计趋势预测图。
总体而言,确诊病例变化符合指数增长的预期,并且可以看出确诊病例增长有放缓的趋势,而且由前10日拟合得到的第2月12日确诊病例超过实际确诊病例,这表示出疫情增长得到一定控制,说明相应的疫情防控措施有效,应当继续加大推行力度并继续落实,呼吁全国人们减少外出活动,全民佩戴口罩,配合各级管理部门的管理政策。
"中科天玑"疫情数据分析系列系统是中科院计算技术研究所大数据研究院联合中科天玑公司开发的疫情大数据分析工具,主要包括面向全国疫情预测服务的——“智疫通”和面向地方疫情服务的“疫情通”,我们将继续研究的大数据分析技术在疫情防控中的应用,希望用科学的大数据技术,为我们打赢疫情防控战役,供献一份力量。
注:报告中的分析和预测结果基于2020年2月12日12时前的相关数据,仅代表根据该日期前的疫情控制情况,预测结果仅供参考。考虑到防控措施的不断加强、节后企业开工,人口流动增加等影响,模型的预测结果可能会偏离真实疫情。本报告基于公开疫情数据,通过公开论文中的传染病模型得到。报告结论仅作为研究参考,非官方结论。发布者不对报告结果和结论的准确性负责。