新方法与新工具为生命科学领域翻开一页页崭新的篇章,如今,AI for Science的到来,正在为生命科学领域带来前所未有的新机遇。在8月11日召开的2023科学智能峰会“Al for Life Sciences(生命科学专场)”学术峰会上,围绕AI for Life Sciences关键科学问题,国内外优秀的专家学者分享真知灼见,共同探讨了生命科学如何走向AI4S时代。
AI已经成为驱动药物研发的重要因素
上海交通大学特聘教授、药学院院长张翱认为,随着生命科学技术和疾病生物学的高速发展,生物医药研究范式和行业产业发展格局正在发生复杂而深刻的变化。尤其是先进计算技术和人工智能技术的快速演化,采用海量数据和先进方法来加速药物研发、推动计算资源向自然化的阶段演进已经成为发展趋势,AI计算工具的创新成为驱动药物研发的重要因素。
药物研发是多环节、漫长且昂贵的流程,每一环节的效率提高都有巨大的价值。在数据驱动的加持下,“AI+药物研发”正成为必然发展趋势。
四川大学华西医院生物治疗国家重点实验室的杨胜勇教授长期从事计算机辅助药物分子设计研究,近年来在基于AI的药物分子设计、特别是分子生成模型方面开展了深入的研究。例如,该团队建立了一种新型的基于条件循环神经网络的分子生成模型,并将该模型应用于RIPK1小分子抑制剂的研发,发现了一个具有全新结构的、高活性和高选择性的RIPK1抑制剂,该研究显示了生成式深度学习(GDL)模型生成全新分子结构的能力,表明深度学习在药物发现领域具有巨大潜力。相关研究发表于Nat Commun(2022)。
“我们团队将人工智能算法引入到药物分子设计,建立了基于胶囊神经网络的药物分子设计新方法,使用矢量神经元代替传统的标量神经元,可以在一定程度上解决药物研发中遇到的小样本问题,对数据的学习效果更好,显著提升药物分子设计以及药代动力学预测准确度。我们近期还发展了基于条件循环神经网络和自回归流的分子生成模型,这些模型已展现了良好的生成全新结构类药性分子的能力。”杨胜勇说。
AI为药物发现整体流程进行显著赋能。通过运用AI技术如深度学习、强化学习等,研究人员可以快速筛选潜在药物分子、预测药物靶点和优化药物分子设计,极大地提高了药物研发的效率和成功率。
如何让AI 手段更好地为药物研发服务?澳门大学中华医药研究院教授欧阳德方自2011年专注于计算药剂学研究,建立了药物制剂数据库,并发展了制剂预测的机器学习算法,从而构建了药物制剂人工智能平台,并且将量子力学、分子模拟和药动学模拟相结合用于药物剂型研究。
欧阳德方谈到,现代药剂学从“物理药学”,“纳米药物”再到“计算药剂学”,近十年来药剂学领域取得了很大进展,但目前仍存在许多挑战。第一是缺少高质量数据,目前制药厂仍然是一个个数据孤岛,如何进行数据分享非常重要。第二是目前对于处方研发人员来说,仍然缺乏用户友好的数字化工具或计算工具,目前急需开发用户友好的计算工具开发。第三是交叉学科人才培养,高素质人才是促进本领域发展的根本。
基于数据建模的机器学习及创新型智能计算工具的飞速发展,将不断满足日趋多元化的分析需求,并推动生命科学产业转化。总的来说,药物研发范式正在经历巨大的颠覆与变革。
AI4S新范式为生命科学研究注入新活力
人工智能正在生物学机制研究、疾病的筛查、检测和治疗中发挥着越来越重要的作用。随着人类基因组计划的完成,科学家们对于疾病与基因关系的理解更加深入。
在基因组学领域,通过机器学习和统计模型,研究人员已经成功预测基因组中编码蛋白质的功能、基因剪切事件和调控网络等重要生物学过程,为生物科学的研究提供了庞大的数据资源。
在 AI4S 新范式下,预训练模型展现了前所未有的能力,但对于具体的科学数据和信息,还需要深入结合学科底层特性,以其特殊的“语言”作为载体,如在生命科学中以蛋白序列和核酸序列这样有别于般自然语言的方式来承载信息。
在RNA药物设计方面,科研人员急切需要一种能够高效全面探索描述RNA空间的计算工具,以实现对 RNA 研究的数字化革新。深势科技开发的Uni-RNA应运而生。据深势科技大分子研发负责人温翰介绍,Uni-RNA 利用约 10 亿条高质量 RNA 序列进行了大规模的预训练,几乎涵盖了所有 RNA 空间,充分挖掘了 RNA序列的潜在信息。通过在广泛的下游任务中微调模型,Uni-RNA在 RNA 结构预测、mRNA 序列性质预测和 RNA功能预测等三个 RNA 领域的七个主要任务中全部取得了领先的结果(SOTA),为未来 RNA领域深度研究提供了无限可能性。
“ Al for Life Sciences”这一将AI能力与底层生物机理结合的新范式,正在从底层技术突破角度为整个行业注入崭新的活力,其系统性的发展有望为行业带来更多可能。
找到新抗原(neoantigen)是个体化癌症免疫治疗的核心,然而利用传统实验方法在细胞表面找到精准识别与T细胞结合的肽链(Peptides),进而验证 “免疫原性” 的方式成本高、耗时长 ,仍然是个巨大挑战。加拿大皇家学会院士、加拿大滑铁卢大学校级教授李明表示,“个体之间新抗原的特异性极高,难以在通用蛋白或多肽数据库中得到精准匹配,因此在无数据库参考的从头测序技术上,就要求有极高的精确度,亟需高效的方法验证新抗原。引入深度学习的方法,开发“新抗原从头测序”的方法,带来了新的机会。模拟人体中心耐受系统来解决在免疫原性预测中没有TCR的问题,利用深度学习技术,使得新抗原的检测精度和效率大大提高。生命科学领域中,人工智能帮助促进“湿实验”与“干实验”的结合,推动个体化癌症免疫治疗的落地和普惠。”
利用AI技术进行数据分析、模型构建和预测,以及计算工具的研发,这些都展示了AI4S在生命科学领域中所具有的巨大潜力和广阔的应用空间。
华中师范大学副教授章丹谈到,“铁死亡”是不同于细胞凋亡、坏死和自噬的细胞程序性死亡方式。过氧化氢酶(CAT)有望作为诱导肿瘤细胞发生铁死亡的新靶标,而要实现这一目标的关键,在于设计合成出高活性的CAT抑制剂。动物实验结果显示苯甲醛缩氨基硫脲类化合物(BT-Br)可以有效抑制CRPC小鼠肿瘤的生长。这项研究表明,CAT有潜力成为基于铁死亡诱导策略治疗CRPC的新靶点。这一套流程可以运用到植物领域进行除草或者抗真菌病害,这也是人工智能技术运用到实验室从计算到合成,再到分子生物学实验和动植物实验中整个流程的结果。
如今,AI for Science 新范式已经为生命科学领域提供了强大的支持,极大地推动了生命科学领域的创新与发展。随着AI技术的不断进步,未来的生命科学研究将更加智能化、高效化,为人类的健康福祉带来更多的希望。
8月10日-11日,2023科学智能峰会在北京圆满举行。作为中关村论坛系列活动,2023科学智能峰会由北京科学智能研究院主办,旨在搭建AI for Science领域科研突破、技术培育、人才交流的共建共创平台。峰会设置1场主论坛和10场主题学术峰会,议题覆盖模型算法、数据库、能源材料、算力引擎等。在会上,与会院士、专家、企业代表分享先进理念与前沿见解,展示研究成果、创新技术,展望AI for Science未来发展趋势。