"); //-->
2019年末,一场突如其来的新冠肺炎疫情席卷全球。如何快速研制出针对新型冠状病毒的有效****物和疫苗,成为全球科学家最为关切的事情之一。
但这其中的困难,正如中国工程院院士王辰所言,“我们对新冠病毒的认识还远远不够,对其传播规律也缺乏想象力”。
目前,至少千余个有关新冠病毒的科研项目在全球开展。
随着对病毒和宿主的深入研究,科学家无法在有效时间内处理海量信息,尤其是当研究者专业背景受限的情况下,对信息处理的效能会更低。
2月26日,medRxiv刊发了一篇来自中科院计算所、中科院计算所西部高等技术研究院、哲源科技、图灵·达尔文实验室等研究团队有关新冠病毒的研究成果。
“相比临床专家,我们利用现有知识,通过计算技术从复杂、多维、立体等数据中摸索出规律,不断勾勒新冠病毒的‘真实面目’。”
该论文通讯作者、哲源科技负责人牛钢表示,他们的研究是立足计算医学,通过应用数学、工程学和计算科学智能化理解人类疾病的机理,并基于工业化的数据、算法、算力及生物医学技术体系为医学服务提供新洞见。
特别值得一提的是,在缺乏一线临床数据的前提下,该团队在计算医学的指导下,通过“纸上谈兵”方式获取的研究成果,竟在后续国内其他研究团队的论文中得以验证。
计算结果与临床研究的“巧合”
牛钢告诉《中国科学报》,他们利用一种被称为TWIRLS的分析系统,在4小时内对PubMed数据库收录的有关冠状病毒的1.4万多篇文献相关文本资料共计300万余单词,进行自动化分析。
最终得出病毒与ACE2结合可能引发ACE2/AT2R的功能变化,使肾素——血管紧张素系统(RAS)参与的细胞因子调控轴发生稳态失衡,并导致“细胞因子风暴”的结论,并认为这可能是参与冠状病毒感染后导致宿主病理性变化的重要调控因素。
巧合的是,这一研究结论在3月25日Research Square平台的一项由上海瑞金医院病理科教授王朝夫、中国科学院院士卞修武等为通讯作者的论文中得以验证。
该团队研究发现,表达ACE2的肺泡巨噬细胞成为SARS-CoV-2感染的靶细胞。
在新冠肺炎患者中,这些活化的巨噬细胞可能在一系列严重的“炎症因子风暴”中扮演了重要角色。
在重症和晚期ARDS进程中,经典激活性的巨噬细胞和替代激活性巨噬细胞之间的转化可能是引起肺部炎症损伤和纤维化的重要原因。
根据TWIRLS的发现,研究团队进一步建议血管紧张素II受体抑制剂(ARB类****物,例如常用****氯沙坦)可能对新型冠状病毒患者临床重症有缓解作用。
随后,研究团队与重庆西南医院感染科教授邓国宏合作,发现服用ARB类****物的有高血压病史的新冠肺炎患者,相较于未服用ARB类****物的患者或有其他基础病史的新冠肺炎患者,更能远离危重症状态。
无独有偶,3月27日,中国医学科学院研究员蒋澄宇团队在medRxiv发表的文章表明,在新冠肺炎高血压合并症老年(大于65岁)患者中,住院前服用ARB****物比未服****患者的COVID-19重症风险显著降低。
荟萃分析显示,使用ARB具有与肺炎的发病率和死亡率相关的积极作用。
“在计算医学的指导下,通过TWIRLS系统对信息进行获取、整理和分类,或许能为治疗急性病毒性肺损伤,提供更多基于调控 RAS系统功能的潜在治疗靶点。”牛钢表示。
有待进一步大规模临床验证
尽管目前在临床数据中看到ARB类****物具有一些积极意义和应用前景,但图灵·达尔文实验室副主任赵宇表示,目前仍缺乏更多尸检的组织病理学相关数据和严谨设计的“老****新用”临床试验,用来验证数据挖掘产生的初步发现。
“但这种在计算医学的指导下,通过文献挖掘从已有知识中总结规律的研究,对新冠病毒产生的新认识,有助于我们开展新冠肺炎****物、疫苗等的研发工作。”牛钢说。
记者了解到,在研究中,团队更多的时间花费在对数据接口的搭建、语料库和字典的整理、识别与“冠状病毒”精确相关的基因以及CSSE等方面。
“TWIRLS可以自动总结与冠状病毒特异性相关的实体和基因,并在研究者指导下进行自主推理。”
牛钢期望,这一方法工具,能帮助科学家更深刻理解病毒与宿主相互作用导致的疾病表型的生物学机制。
期望共同携手治病
诚然,新冠病毒超级狡猾,人体的复杂程度则更是超乎想象。
“我们不能只依赖分析少量随机抽样数据,更不能热衷于探求数据之间难以捉摸的‘因果关系’,而应更多关注数据的‘相关关系’。”
此前,中国工程院院士樊代明在接受记者采访时明确指出,生物医学大数据更多采用数据模型以及控制混杂的统计分析方法。
而这不仅仅需要算法与数据的支持,更需要强大的算力做后盾。
牛钢谈及计算医学概念时表示,过去单一零散的数据,只需要在普通服务器上用简单程序处理和统计即可。
现在都是多维海量的大数据,要用多维海量的PB级(1PB=106GB)大数据对生命进行建模,设计复杂的算法,而算法的复杂度和计算量远远超过了普通服务器所能处理的规模,必须有高性能的算力资源支撑。
“未来,我们主要立足现有的生物医学数据,引入系统科学理论和视角,通过设计新的算法挖掘数据之间的关系,为解决现有问题寻找新路径。”
中科院计算所西部高等技术研究院常务副院长张春明此前曾表示,生物学家、医学专家和计算科学家应携起手来共同丰富计算医学的内涵,将疾病的预防、诊断和治疗推向精准。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。