在各行各业越来越迈向高精尖发展的今天,传统的“经验+试错”研发模式不再能满足产业发展和升级的需求,旧有的研发技术体系的产能已经快走到了尽头,随着计算机的发展和计算能力的提高,各个产业的研发模式正在向“计算+实验”驱动转变。
在并行计算和高性能计算的支持下,通过构建计算模型,利用仿真技术模拟对象系统,能够帮助研发人员分析和研究的系统运行状态、揭示系统动态过程和运动规律,并快速处理和分析海量数据。这种结合计算优势的实验手段,大大减少了研发时间和成本,同时提高了研发效率和质量,将创新发现更快地推向市场验证、更快实现大规模的落地应用。
在计算驱动的研发范式下,新药的发现不再是大海捞针,研发人员能够快速处理数据库中数以亿计的小分子结构,对药物与靶标分子(如蛋白质)的相互作用进行模拟计算,预测化合物的生物活性和药物潜力。材料研发也打破了以往人们视材料学为“炼丹”的刻板印象,新材料的可搜索空间大幅增加,候选材料如今已经扩展到数千万量级,通过在原子尺度上模拟材料的结构、性质和演化过程,能够实现对新型材料的高通量筛选与理性设计。
各行业的研发人员不再反复陷入反复的试错循环,而是利用先进的计算技术快速“算”出新药、“算”出新材料,推动产业发展,创造商业和社会价值。
与传统的试错实验相比,“计算+实验”新范式为各行业研发带来的变革是全方位的。
首先是研发效率的大幅提升,创新产品得以更快地走向市场。
“计算+实验”的方法是在计算机虚拟环境中模拟真实世界中的各种复杂系统,能够在不实际制造或部署昂贵设备的情况下,观察系统的动态,快速测试和验证各种假设;而且借助高效的算法和计算机技术,能够在短时间内分析大量数据和可能性。
众所周知,无论是新药研发还是新材料研发,都是回报高、但周期也极为漫长的领域。新药研发之所以有“双十定律”(即研发成功一款新药需耗时10年、投资10亿美元)的阻碍,主要就在于药物筛选过程很长。
传统药物研发通常采用漏斗式筛选的方式,美国国立卫生研究院的国家癌症研究所,曾经花了二十年的时间(1960年-1980年),测试了大约35000 种植物的抗癌活性,最终只有紫杉醇和喜树碱两种成分被证明有效。据Ufts药物开发研究中心数据显示,研发人员往往根据经验提出5000至10000种化合物作为候选,然后通过试错实验筛选出其中大约250个进入临床前研究阶段,再经过多轮筛选后,大约5至10种化合物会被选中进行临床试验,最终只有1种化合物能通过临床测试、获得FDA(美国食品药品监督管理局)批准上市。这样的研发速度远远难以满足全球患者对新药的需求。
而计算方法的引入,可以在靶点发现、分子设计、化合物合成等早期阶段给予助推,比如通过分子模拟计算进行实验前的虚拟筛选和验证,从而显著缩短新药研发时间。
其次是研发成本的显著降低。
依赖传统试错实验的科学研发几乎都是劳动密集型的工程,人力和物质资源的投入可谓巨大。据统计,一款新药的研发大约需要投入66亿美元资金、总计700万小时的工作量、进行6585轮试验,以及423位科研人员的共同努力。这也是许多投资者不敢贸然涉猎前沿科学领域的主要原因之一。
计算驱动的模式则将研发转变为了计算密集型和数据密集型工作,它能够避免传统实验中大量资源的消耗,通过设计模拟实验,可以大幅度地减少实际物理实验的需求,从而降低金钱和人力投入。所以,在进入昂贵的多轮化合物筛选过程之前,研发人员就能通过计算确定正确的靶标,大大减少后续试验的重复成本。
最后,是以数据驱动的决策将研发过程变得更加理性和精准,提升了研发成功率。
对于甘坐冷板凳的科研人员和有远见卓识的投资人而言,科学研发周期长、成本高的问题或许可以克服,但失败风险大、回报率低,却一直是个难以逾越的障碍。比如新药研发和新材料研发的成功率都低至10%以下。
这在很大程度上是因为传统研发模式主要依赖的,是专家经验和直觉进行实验设计,实验的随机性、偶然性和不可解释性较强。材料学常被人戏称为“炒菜”,就是因为发现高性能材料时往往要“碰运气”这个痛点,而且难以做回溯性的中间过程解释。在催化剂的创新开发中,通过试错得到的催化剂,也很难明确其与反应性能之间的构效关系。所以,研发成功率低与实验过程的不精准、非理性有很大关系。
“计算+实验”的模式则强调用数据分析来指导实验设计和结果解释,这是一个更加系统化的、基于目标的过程,不仅提高了研发的精确度,也使得决策过程更加科学和合理。而且,在处理复杂系统的研究对象时,计算的手段具有明显的优势,它能够模拟现实世界中的系统的动态变化和相互作用,并能深入到微观层面,从而为新产品的研发提供更多、更准确的数据信息支撑,这是传统实验是难以做到的。
比方说,药物研发人员可以利用靶标的结构和功能信息以及分子模拟技术,来设计与目标靶标特异性相互作用的分子,以便专注于与疾病过程相关的特定分子靶标,整个研发过程更具目标导向,开发有效药物的几率大大增加。
在如今的各个前沿科学领域,计算正在其中扮演着不可或缺的工具角色,从技术创新到产业落地的过程中,“得计算者得天下”越来越成为行业共识。
在生命科学领域,出现了安腾(Anton)这样的分子动力学模拟专用超级计算机,美国的制药公司Relay就是借助它进行药物靶点和小分子药物结构的模拟筛选,通过计算与实验双管齐下,仅仅花了18个月、不到1亿美金就确定了胆管癌治疗药物RLY-4008的结构设计,打破了传统药物研发界的“双十魔咒”。
作为产业经济的最上游环节,新材料研发的高端化发展也离不开计算驱动。国家超算天津中心党组书记孟祥飞,曾在“计算-数据-智能融合驱动的材料创新发展高端”论坛上指出,材料是一种复杂的高维多尺度耦合系统,现有的基础理论还不能准确地描述材料成分—组织/结构—性能—服役行为的构效关系,一些深层次的机理还不清楚,导致材料研发长期基于经验,依靠“试错法”推进。而计算驱动模式下的计算材料学,已经成为现代材料研发的重要手段,可以有效提升材料研发的效率并降低研发成本。
在化学行业,单靠化学家在实验室解析表达也已成过去式,用尽可能少的计算资源去模拟复杂化学体系的电子结构以及动力学行为,是如今更主流的研究手段。基于计算与实验相结合的研究范式,实现了更加精准、可控、可调整、高预测性、高效率、高经济效益同时更加环境友好的化学研究成果和产业应用。
可以预见的是,计算结合实验的范式将在未来助力更多科学发现,成为各行各业产业腾飞的新引擎。