AI助力抗“疫” 美发布新冠病毒数据集
截至3月18日12点,世界卫生组织和其他权威机构提供的数据显示,全球确诊的新冠状病毒病例数已超过19万,数千人因此死亡。
当人们正在寻找应对新的皇冠流行病的方法时,白宫和科技界意识到人工智能在应对这一流行病中有望发挥巨大作用。有鉴于此,他们联合发布了“新皇冠肺炎开放研究数据集”(CORD-19),希望利用新兴的人工智能技术来应对疫情。
美国发布新的冠状肺炎开放数据集
据白宫科技政策办公室网站(OSTP)16日报道,艾伦人工智能研究所、陈扎克伯格基金会(CZI)、乔治敦大学安全与新兴技术中心(CSET)、微软、国家卫生研究院国家医学图书馆(NLM)和OSTP今天联合发布了“新皇冠肺炎开放研究数据集”。
据报道,该数据集包含29,000多份与新冠状肺炎、新冠状病毒和冠状病毒群相关的学术文献,其中13,000多份为完整文献。该数据集是迄今为止可用于数据和文本挖掘研究的最广泛的机器可读冠状病毒文档集合。它将主要用于医学和机器学习等相关领域的研究,以帮助人们更快更好地应对新的冠状病毒流行。
白宫首席技术官迈克尔·考雷特·西奥斯说:“白宫与美国国家科学、工程和医学研究所以及世界卫生组织合作,已经确定了几十个与新患肺炎有关的科学问题。人工智能有望帮助科学家尽快全面地总结和分析信息,并最终提出应对计划。”
考雷特·狄奥斯进一步说:“美国科技企业的决定性作用对于预防、检测、治疗和开发新的冠状肺炎疗法至关重要。我们呼吁人工智能专家采取行动,开发新的文本和数据挖掘技术,帮助科学界回答与新冠状肺炎相关的最紧迫的科学问题。”
借鉴人工智能提高文献检索速度
微软首席科学官埃里克·霍维茨(Eric Huo Weici)表示:“创建这一开放数据集的目的是激励和激励人工智能社区开发新工具,帮助科学家快速掌握数千份文件的重点和实质,从而找到更快更好地应对新的冠状肺炎疫情的措施和方法。”
霍伟慈强调:“生物医学领域每年将出版100多万种出版物,人工智能作为科学家的“得力助手”的重要性日益突出。”
研究人员表示,科学家可以通过机器学习技术和CORD-19开放数据集节省更多时间。人工智能将学习科学家想知道的东西,并在庞大的数据集中找到每个科学家需要的东西,从而大大缩小检索范围和文本大小。
各种人工智能工具相继登场。
为了应对这种流行病,各种形式的人工智能被期望“展示它们的才能”,其中最突出的是自然语言处理技术。
例如,艾伦人工智能研究所的语言模型ELMO和艾伦LP帮助科学家理解不同论文内容之间的关系。该研究所的语言学家道格·雷蒙德说:“在过去的几年里,我们在自然语言处理方面取得了巨大的进步。像cordi-19这样的数据集可能比几年前更有用,因为现在我们有了更多可用的工具。
据国外媒体报道,许多团队目前正在使用自然语言处理技术来对抗冠状病毒。例如,哈佛医学院开发了一种工具来评估病人的病例、社交媒体和健康数据。此外,一家名为“蓝点”的公司使用自然语言处理工具搜索新闻报道、公共卫生数据和其他资源,这在新的冠状肺炎爆发之初起到了监测作用。
同样,中国疾病预防控制中心的工作人员也在使用阿里巴巴达摩研究所最新的自然语言处理技术进行病历文本分析和流行病学调查。此外,达摩研究所的结构伯特模型上周被评为世界上最强的自然语言处理系统。
除了自然语言处理,其他形式的人工智能技术也不甘示弱,一个接一个地出现在舞台上,展示它们在应对新的皇冠流行病方面的优势。例如,消毒机器人可以帮助医务人员对疫区进行消毒。深度学习技术可以帮助医生预测死亡率和其他数据指标;但是图像识别技术可以使医务人员根据CT图像更快地识别出新的冠状肺炎患者。
此外,世界各国*还采用了各种技术来应对这一流行病,如全球定位系统跟踪、自我筛查应用、文本提醒和智能手机跟踪。其他正在进行的倡议包括:加拿大抗体研发公司Abcellera正在与美国国防部高级研究计划局的大流行预防平台合作开发抗体;“自动诊断使预防和治疗成为可能”(ADEPT)项目,以防止60天内爆发等。
谷歌首席执行官sundar pichai周日宣布,谷歌正与*合作创建一个网站,帮助人们筛选自己,然后决定是否寻求医疗建议。的确,Alphabet的生命科学部门正在开发新的冠状病毒检测工具。
艾伦人工智能研究所主任艾伦·阿奇奥尼说,人工智能可以帮助科学家加快进步,找到问题的解决方案。然而,他也强调,人工智能只能提高人类的能力,而不能自己解决问题。
由微软、白宫和艾伦研究所发布的冠状病毒数据集首次在美国科技博客“风投节拍”上发布。