2020年是特别的。一场新冠肺炎(COVID-19)疫情深刻地改变了全球政治、经济和人们的生活。在这场抗击新冠肺炎战役中,各种各样的高新科技都有望“大显身手”,其中较为突出的是自然语言处理技术。无论是在抗疫一线,还是在社区管控、疫苗研发等大后方,自然语言处理技术发挥的作用都不可小觑。目前世界上有多个研究团队使用该技术抗击新冠肺炎。
自然语言处理(Natural Language Processing,简称NLP)既是人工智能的核心技术,又是计算机科学和语言科学的分支学科;它推动着语言智能的持续发展和突破,并越来越多地应用于各个行业。正如中国著名学者周海中教授曾经所言:“自然语言处理是极有吸引力的研究领域,它具有重大的理论意义和实用价值。”在此次抗击新冠肺炎疫情中,自然语言处理发挥了应有的作用。
最早正式发出新冠肺炎疫情警告的并不是美国疾控中心(CDC)或世卫组织(WHO),而是加拿大一家名为“蓝点”(BlueDot)的健康监测平台;它早在2019年12月31日就向其客户发出了提前疫情警告。该平台设计了疾病监测分析程序,使用自然语言处理技术来筛选65种语言的新闻报道,以及航空公司数据和动物疾病暴发的报道,随后由流行病学家审核数据结果;这在新冠肺炎疫情暴发之初发挥了监测功能。有关专家认为:只有真正了解现状,预测疫情发展趋势预测疫情走势,才能做出更为理性判断,对下一步行为做指导。
美国哈佛医学院的研究人员借助自然语言处理技术最近开发出一种可以评估新冠肺炎患者的病例、社交媒体和健康卫生数据的工具。他们率先努力通过使用机器学习技术查看来自各种来源的数据和信息(包括患者记录、社交媒体和公共卫生数据)来寻找新冠肺炎病毒的解决方案。借助自然语言处理工具,他们还可以搜索有关新冠肺炎病毒的在线信息,并了解爆发的当前位置。另外,研究人员还利用自然语言处理技术对新冠肺炎、药物和疫苗等密集展开研究,同时包括临床诊断与治疗以及流行病学研究等。
中国疾病预防控制中心的研究人员最近在使用科技巨头阿里巴巴达摩院最新的自然语言处理技术开展新冠肺炎病历文本分析的工作,并取得阶段性成果。另外,达摩院的研究人员通过自然语言处理回顾性数据和卷积神经网络训练CT影像的识别系统,快速鉴别新冠肺炎影像与普通病毒性肺炎影像的区别,其识别准确率高达 96%。该系统每识别一个病例平均只需要不到20秒,可有效减轻医生压力;它还能直接算出病灶部位的占比比例,进而量化病症的轻重程度,大幅提升临床诊断效率。
当前,新冠肺炎疫情仍在世界范围内愈演愈烈;截至2020年12月22日,全球累计确诊病例超过7766万例。人们一边要提防新冠肺炎的传染,一边又要不断接受着海量的真假难辨的信息的轰炸。但是自然语言处理技术在疫情舆情管控中可以发挥一定的作用;该技术可以帮助人们提取新闻主要观点,识别文章情绪甚至分析文章的可信度,这将在信息战场将“谣言”粉碎,促进舆论生态良性循环,从而为抗疫工作提供一份助力。
总之,自然语言处理技术可以在抗击新冠肺炎疫情中大显身手,为打赢这场疫情攻坚战提供了有效的技术支撑。有了自然语言处理技术相助,抗疫工作将变得更安全、更高效。完全可以相信,在各国的共同努力之下,人类一定能够战胜此次疫情,并迎来更加美好的未来。
文/黄敏(作者单位:暨南大学医学部)