人工智能可能是防止下一次传染病全球大流行的秘密武器
早在2016年,也就是在一场呼吸道传染性疾病大流行让世界陷入停滞的四年前,联合国环境规划署(UNEP)就对人畜共患病敲响了警钟,将其确定为全球关注的关键新兴问题。现在,根据世界卫生组织的数据,每年约有10亿个病例和数百万人死亡是人畜共患病造成的,其中病原体从脊椎动物跳到人类身上。而在过去30年中被发现的30种新型人类病毒中,有75%源自其他动物。
但是蒙特利尔大学的科学家们相信他们新的人工智能模型有能力突出和预测新出现的病毒"热点",这可以在可能爆发的动物到人类的感染中抢占先机,最好能防止类似COVID-19的事情再次发生。
该算法花费了研究人员三年的时间和一万个小时的计算,能够识别病毒和宿主之间的8万个新的潜在互动,以及它们在世界上最值得关注的地方。
蒙特利尔大学生物科学系教授Timothée Poisot说:"我们从2020年的头几个月开始就一直在研究这个项目,在大流行病爆发之前。"
通过机器学习,而不是人工在数据中建立联系,该算法能够评估数以千计的哺乳动物物种和数以千计的病毒,并计算出所有可行的组合。
Poisot说:"基本的问题是,我们只知道病毒和哺乳动物之间的1%到2%的互动,这些网络是分散的,相互作用很少,只集中在少数几个物种中。我们想知道哪种病毒有可能感染哪种哺乳动物,这样我们就可以确定哪些相互作用最有可能发生"。
该团队使用了最大的开放数据集CLOVER,它描述了829种病毒和1081种哺乳动物宿主之间的5494种相互作用,其中大部分集中在野生动物身上,还有其他几个数据集,包括宿主-病原体系统发育项目(HP3)、增强型传染病数据库(EID2)和全球哺乳动物寄生虫数据库V2.0(GHMPD2)。
"我们拥有的一些数据集比较旧:它们包含过时的特定物种名称,或者它们有错误,因为数据是手工输入的,"Poisot谈到机器学习所需的耗时过程时说。"在那之后,主要的任务是确定我们对模型的预测能力有多大的信心。"
然后,研究人员专注于20种被认为是值得关注的病毒,这些病毒有可能会蔓延到人类身上。
"我们在团队中进行了很多讨论,因为起初一些结果对我们来说似乎很奇怪,"Poisot说,他惊讶地看到与小鼠有关的Ectromelia病毒被确定为一个值得关注的病毒。"我们持怀疑态度,但是当我们搜索文献时,我们发现在人类中曾有过这样的案例。"
研究人员还能够通过该模型确定区域,这一点可以帮助科学家以更有针对性的方式进行病毒和疫苗研究。
"我们的模型进行了空间预测,但更准确地说,该模型具体指出了在哪一组哺乳动物中以及在哪个位置可能会发现某些类型的病毒,"Poisot说。
结果显示了两个特别值得关注的地区:亚马逊流域,那里的病毒和宿主的相互作用更加原始,而且最有可能出现新的相互作用;以及撒哈拉以南非洲,在那里,该算法确定了可能携带人畜共患病毒的新宿主。
Poisot解释说:"我们正在真正转移我们需要去研究哺乳动物以发现新病毒的地方。"
虽然人畜共患的病原体可以有多种形式--细菌、寄生虫、病毒--但随着人类和非人类动物继续占据更多的相同空间,它们的流行程度预计会越来越普遍。
该团队希望其模型不仅可以为研究提供新的起点,而且可以提供现实世界的监控。下一步将是把这个人工智能提升到一个新的水平,并包括更多的微生物、免疫学和生态学机制,以便更完整地观察全球病毒群。
"该算法将我们已经知道的网络,投射到一个新的空间,有点像皮影戏:它以一种新的方式投射到相互作用上,"Poisot说。"我们现在知道要监测哪些物种,在哪里,以及什么类型的病毒。"