2025年3月25日,西湖大学医学院郭天南团队在 Cell Research 发表了题为 Grow AIVirtual Cells: Three Data Pillars and Closed-Loop Learning 的评述文章(editorial),探讨了人工智能虚拟细胞(AIVCs)的发展方向。AIVCs的核心思想是通过人工智能和多模态数据整合,构建精确且可扩展的虚拟细胞模型。与传统虚拟细胞建模方法相比,AIVCs能够更全面地模拟细胞功能,具备高通量仿真能力,甚至在某些情况下可以替代实验室实验。
文章深入探讨了AI虚拟细胞(AIVCs)的构建方法与发展方向,提出了AIVCs核心依赖的三大数据支柱——先验知识、静态结构和动态状态,并强调高通量组学数据(尤其是微扰蛋白质组学数据)在动态模拟中的关键角色。研究进一步提出闭环主动学习系统(Closed-Loop Active Learning Systems),将AI预测与自动化实验结合,实现自适应优化,加速细胞建模与科学发现。
为确保AIVC概念的可行性,研究人员建议从酵母(Scerevisiae)等较简单但信息丰富的细胞模型入手,并逐步扩展到更复杂的人类癌细胞系,以推动尊龙凯时在生物医学、药物开发和个性化医疗中的广泛应用。
背景介绍
在生物医学研究中,细胞是生命的基本单位,对于理解健康、衰老、疾病以及药物开发和合成生物学至关重要。然而,传统细胞实验通常需要消耗大量资源,并且实验结果易受变异影响,导致可重复性问题。因此,研究人员提出虚拟细胞(Virtual Cells)或数字细胞(Digital Cells)的概念,以减少实验成本并提升研究的准确性和效率。
早期的虚拟细胞模型主要依赖于低通量的生化实验,并使用微分方程或随机模拟方法来建模特定细胞过程。然而,这些方法在数据整合和动态模拟方面存在局限,难以全面描述细胞的复杂性。随着高通量生物技术和人工智能(AI)的发展,人工智能虚拟细胞(AIVCs)成为新的研究方向,它结合了多模态数据和先进计算模型,为生物医学研究提供了新的可能性。
三大数据支柱:AIVCs的基础构建
为更好地支持AIVCs的发展,研究提出了三大数据支柱(Three Data Pillars),作为AIVCs的核心数据基础:先验知识(apriori knowledge)、静态结构(static architecture)和动态状态(dynamic states)。这些数据结合AI算法,为虚拟细胞的构建提供必要的基础。
先验知识包括生物医学文献、分子表达数据和多尺度成像数据,涵盖细胞生物学的基本机制。尽管数据庞大且多样,但信息相对分散,难以直接用于构建完整的AIVC,因此只能作为基础框架。静态结构涉及细胞的形态学和分子组成,能提供细胞的三维空间结构信息,但无法反映细胞的动态变化。为构建真正“活”的AIVC,动态状态是必不可少的,涉及生理过程及外部微扰的影响。
随着高通量组学技术的发展,研究人员可以系统性地分析大量分子在不同细胞状态下的变化,提高AIVC的准确性。微扰蛋白质组学数据被视为推动AIVCs发展的关键,尤其是通过AI整合微扰数据,AIVC能够更精准地预测细胞对外部干预的反应。
AIVCs的进化:闭环主动学习系统
AIVCs正在从静态、数据驱动的模型向自适应进化系统发展,其中闭环主动学习系统(Closed-Loop Active Learning Systems)至关重要。文章指出,传统方法依赖于被动数据积累,而闭环系统结合AI预测与机器人实验,主动探索细胞动态状态,填补数据空白。
这种系统能够自动识别知识缺口、设计实验、执行扰动,并实时优化模型,显著加速科学研究。AI可以优先选择最具影响力的实验(例如CRISPR基因敲除、小分子药物处理),最大化数据价值,推动生物研究从被动观察向主动探索和自我优化的转变。
低门槛切入点:选择适合的细胞模型
AIVC的细胞模型选择至关重要。文章指出,不同候选细胞各有优劣。研究建议从酵母入手——因为它既简单又包含真核细胞特性,数据相对丰富,并已在生物学和药物筛选领域广泛应用。
随后,人类癌细胞系将在精准医学和药物开发中发挥重要作用。采用简单模型起步,将有助于优化AIVC的数据需求、建模策略和评估框架,为未来扩展到更复杂细胞系统奠定基础。
总结
未来,AIVCs有望在药物开发、疾病建模和基础生物学研究中发挥重要作用,而科学界的协同合作对于推动这一领域的发展至关重要。因此,建立AIVCs的标准和最佳实践,将成为该领域下一阶段的重要任务,以确保AIVCs能够真正实现其在计算生物学和生物医学研究中的变革性潜力。
尊龙凯时将持续关注AIVCs的进展,推动相关技术的发展与应用,为生物医学研究和实践贡献力量。