8月份结束的第三届DIA中国数字临床试验创新论坛(dTrial)再次引燃业界对“数字科学引领医疗创推”的新机遇、挑战和对策的广泛讨论。数学科学及人工智能在新药研发领域的转化应用探讨,也是DIA转化医学社区在2022年下半年的论坛活动规划中的。为响应广大社区志愿者的呼声,转化医学社区经过精心准备的数字科技如何赋能新药研发的线上直播论坛,就在8月底如期开展。此次论坛,采用全程线上直播的方式进行,邀请到行业的科学家及领域中的相关企业参与讨论。
会议的核心讨论话题有两个模块,其中之一是如何通过数字化的技术赋能新药研发,其中之二是真实世界数据在新药研发中的应用。
题目一
化学分子和氨基酸序列的复杂性度量及演化——在新药设计和癌症诊疗上的潜在应用
刘宇 副研究员
北京师范大学珠海校区复杂系统国际科学中心
本次线上直播沙龙,由刘宇教授分享他和团队在氨基酸序列的复杂性度量和演化方面的进展。诺贝尔生理医学奖得主Jacob François在1970s提出的跟复杂系统研究密切相关的、非常具有启发性的思想,即不管是生物的器官、新功能,还是对其有用的次级代谢物、新蛋白质分子、基因等等客体,在自然状态下的演化都不是从零开始的,而总是“修修补补”的,即总是通过修改或组合已经存在的客体,来产生新客体。基于这样的思想基础,刘宇教授级团队近期提出了一套定量描述各种客体的复杂性和信息的理论:梯径(Ladderpath)理论,用于发掘与演化相关的具有层次嵌套关系的结构和信息。在本次演讲分享中,刘宇教授首先介绍了梯径理论及其在新药分子设计方面的应用。
梯径理论可以用在多个方面,比如生命的标志物方面,也可以用于新药的分子设计。生命的复杂性也正是生命所迷人的地方,在我们的直觉中对于“复杂性”的概念是有矛盾性的,有序与复杂在我们的意识和潜意识的领域中是有一定的模糊性。梯径理论可以帮助我们实现对复杂性的描述,通过“步骤”来进行计量,即通过生成目标的最短路径的长度,来描述目标所蕴含的“信息”。经过这个过程,我们可以把任何的序列都通过梯径的方法进行复杂性的描述,与此类似的,对分子的描述也借鉴对序列的描述流程。
因此,对任何一个分子,我们都可以在梯径理论的基础下进行复杂性的描述,也就是“程”数来描述,比如一个吗啡的分子需要9程来描述,而相对之下,ATP就需要16程来描述。而分子到蛋白质,其中有很多重复性的结构,组成信息树,在这个信息树上,有一些关键节点形成路径,如果在某个关键节点改变路径,理论上就可以形成一个新的分子。
通过这样的方式,可以生产具有三维结构的药物分子,也可以在后续的设计研发中结合AI的使用继续进行探索,这就是在通过描述分子和序列的复杂性,梯径理论在设计新药分子以及计算分子的相似性方面的应用之一。
其另外一个应用探索,就是从简单到复杂的演化机制上,比如对癌症序列的描述。那当前的应用程度如何呢?如何结合到新药研发中?刘宇教授通过具体的案例分享了他和团队的研究进展,目前,已经通过已开发的程序,能快速地处理对长达10K的氨基酸序列的分析,尤其是在对不同的物种之间的氨基酸序列的分析。而癌症细胞的序列特征,是否会跟正常细胞序列在统计上出现一些差异?癌症染色体破碎后复杂性也会提升,是否也可以跟正常细胞序列的对比中找到差异性,而把这些相关的探索应用在对癌症的了解和研究中,还需要继续后续的探讨。
在演讲中,刘教授也分享了自己对于生物研究的一些思考,生命本身就是一个复杂系统,我们对这个复杂系统的了解还有很多的前行的空间。AI的技术在药物研发中的应用,具有一定的增效动力,但是对生物尤其是肿瘤的体外模型的探索还有很大的空间可以结合。
题目二
真实世界数据驱动的创新药物研发
王冠
领星生物数据科学副总裁
本次论坛的另一个话题是真实世界数据如何驱动创新药物研发,由来自领星的王冠博士分享。随着临床大数据的发展尤其是AI技术的发展,国内外对于真实世界的数据如何应用在新药研发中,都在积极的探索。在新药研发的过程中特别是新靶点开发中,不是所有的真实世界数据都可以发挥重要作用的,其中精准医疗的多组学数据结合的真实世界数据已在国际上证明其价值。王冠博士在分享中,合成致死在新药研发领域的探索在十几年前就开始了,在肝癌的真实世界的数据中,领星的GCKB真实世界知识数据库可以验证基础研究中特别是肿瘤细胞系中的结果。真实世界患者中与肿瘤细胞学的差异将会给新药研发提供有价值的尝试路劲。
精准医疗的真实世界数据最大的优势是在免疫检查点抑制剂治疗方面。免疫治疗的最大的挑战之一是缺乏足够患者水平的数据来支持新药的研发探索,非常困难在体外和动物模型的研究中模拟人的免疫微环境。目前已经在开展中的PD1/PDL1相关的临床研究已经达到3000多个,而最终成功被FDA批准的却寥寥无几。从真实世界的多组学数据结合PD1免疫临床治疗转归结果的数据分析,可以免疫相关的临床研究提供非常重要的价值。
目前做创新药,更多的是基于第一性原理从还原路径的角度来进行。但是由于人体本身环境的复杂性,以临床治疗的多样性,导致创新药高失败率。就算三期临床成功的药物在上市后的真实世界应用中仍需要对疗效和不良反应的再评估。目前国内已经可以实现通过大数据和基因组学技术对真实世界个体化的患者临床数据及分子数据收集,并且已经发布了临床精准医疗大数据相关标准。最终得到从分子机制,细胞层面,组织层面,病理和影像,及临床治疗及预后信息等多维度的复杂数据并利用AI算法进行大数据的挖掘及新药探索。
本次大会由来自领星生物的毋冰总监担任主持,带领着所有参会同仁们就几个问题进行了讨论。国际上的创新药的临床研究中已经大量的使用真实世界数据及多组学数据,而相对来说,国内药企也正在开始相关方面的探索研究。
毋冰
领星生物数据智能商业执行总监
青岛科技大学制药工程学士,沈阳药科大学天然药物化学硕士