《疫情防控中的数据与智能应用研究报告》发布
随着疫情的发展,大数据驱动的疫情防控已经在全国范围内迅速展开。其应用场景不断涌现,应用范围不断扩大。3月2日,中国信息与通信研究院发布了《数据与智能在防疫控制中的应用研究报告》(以下简称《报告》)。报告收集和分析了200多个大数据和人工智能技术在疫情防控中的应用案例,梳理了疫情发展的重要时间节点和相关应用案例,旨在展现信息技术在疫情防控中的应用全景,并初步探讨了下一步通过大数据等新一代信息技术开展疫情防控。
五个应用加入流行病抵抗战
报告显示,大数据和人工智能技术在支持*预防、管理和控制疫情、实现对高风险群体的监测和控制、辅助疾病研究的算法能力、电子商务平台、地图应用和在线医疗以确保人们的健康生活以及帮助社会恢复工作和生殖的通信大数据旅行卡方面发挥了五大作用。
许多机构以多主题、多渠道、多维度的方式展示了各地提供的数据,并将结果应用于公共、*和企业服务,占本报告统计案例的39.6%。例如,自1月26日推出以来,北京移动的“疫情防控人口大数据平台”为北京提供了疫情返回用户、外省返回用户和非居民用户的规模监测和分布等服务。
疫情防控应用可以识别高危人群、开展区域检测、开展市场监管等功能,相关病例占46.7%。
从科学研究的角度来看,大数据和智能技术已经完全应用于与医疗保健直接相关的场景,如疾病诊断、医学研究、医疗救助等。,其中医疗病例占17%。1月30日,百度研究院向全球基因检测机构、防疫中心和科研中心免费开放了线性时间算法——线性折叠,以及全球最快的核糖核酸结构预测网站。线性折叠算法可以将新型冠状病毒全基因组二级结构的预测从经典算法的55分钟缩短到27秒,速度提高120倍,可以节省两个数量级的等待时间,大大提高科研效率。
受新皇冠疫情的影响,生活服务的应用也是数据驱动的疫情防控的关键切入点。许多互联网企业采用O2O服务模式,利用大数据技术实现海量生活数据的收集、分类和存储,为居民提供非接触式食物配送等服务。
随着回归高峰的到来,预防人员流动造成的交叉感染是现阶段各地各单位防疫工作的重点。为了简单、快速、权威、准确地证明他过去14天的旅行信息,中国通信学会与三家基础电信公司联合推出了“通信大数据接入卡”服务,为全国16亿手机用户提供前14天的免费服务。
降低了数据采集成本
通过对大数据应用案例在疫情分析与显示、疫情防控、医疗效率提高、生活便利措施、恢复工作和生殖管理五个方面的分析,研究者发现传统的数据收集方法也存在一些不足。
中国信息与通信技术研究院云计算与大数据研究所副所长魏凯表示,收集传统健康数据的起点通常是基层社区卫生中心。社区人员手工填写表格,并通过区卫生委员会和市卫生委员会,最终收集到省卫生委员会和国家卫生委员会。一方面,这增加了基础数据收集人员的负担,另一方面,很难在数据源快速验证数据的准确性,增加了后期数据质量管理的成本。
目前,在信息化的帮助下,在线信息填报系统和智能出库平台已被广泛使用,取代了人工填报,降低了数据采集的人工成本,缩短了数据流程。企业等也使用爬虫技术收集动态数据,快速提供疫情数据可视化、疫情分析和疫情推断等服务。
魏凯建议,为了确保数据收集的全面性和准确性,应同时采用自动收集工具和数据质量核查等手段。对于多源数据,应识别主要来源,并从相应的系统或平台获取,以减少自报数据和重复收集。同时,充分利用大数据技术,实现各种疫情信息的快速实时采集。通过ETL、API、消息队列、数据流等采集手段,提供移动报表采集功能,保证实时、准确采集人口流量信息、交通实时信息、重点防控人员定位信息等各类数据,满足特殊疫情时期的数据资源需求。
数据分析逐渐深化。
据统计,2020年2月前60%以上的数据应用是初步描述性应用,如疫情分布图、人员流动显示等。例如,在疫情开始时,航空和铁路部门将通知同一航班和同一列车上的乘客特别注意并隔离确诊患者。
随着平台的建设和数据的逐渐积累,诊断应用越来越成熟,预测应用也越来越多。2月初,描述性和诊断性应用的比例达到75%,数据粒度和分析粒度更加细化,区县级甚至社区级应用开始出现。例如,在百分点信息技术的“一区一码”系统中,居民完成个人信息报告,当进入或离开居民区时,系统自动分析并协助人工管理。预测应用,例如预测潜在的感染源和途径,以及预测受感染人数的趋势,正在开始出现,并逐渐被用作*决策的参考。
魏凯说,预测和决策的应用非常复杂,数量很少,但有较高的价值。在这一流行病防控过程中,大数据和人工智能技术被用于病毒基因的检测和分析。根据病毒基因的特点,预测病毒蛋白结构有助于药物筛选,大大提高了诊断和流行病学研究的效率。
“数据逐渐从描述性分析、诊断性分析和预测性分析转变为决策性分析。总的来说,早期各种类型的描述、诊断和预测应用的成熟为*后续的精确实施奠定了基础。”魏凯说。