在过去的几十年里,生物学发生了巨大的变化,其中很大程度上来源于“基因组革命”,能够大规模低成本地读取细胞中的遗传信息。
合成生物学也受益于基因组革命,此后一系列突破性成果带来进展。
因此,从实践的角度来看,合成生物学(synbio)专注于为特定任务定制生物系统,例如使细胞产生一定量的生物燃料或对外部触发做出反应。
Synbio 从工程学中汲取灵感,利用其可预测的方法来管理复杂的生物学。这种方法的关键是使用一致的遗传成分并遵循四个步骤:
设计:概念化 DNA 序列或细胞变化以实现目标。
构建:将设计付诸实践,通常是创建 DNA 片段并将其引入细胞。
测试:收集和分析数据以查看新设计是否按预期运行,并记录任何意外结果或副作用。
学习:使用数据来完善和改进流程。人工智能可以在这里发挥作用,帮助指导未来的设计并使流程更加高效。
合成生物学的核心是在 DNA 水平上进行改变,以使细胞产生特定的物质或以预定的方式发挥作用。对于DNA层面的编码行为,AI能够发挥重要的作用。
基于 CRISPR 的基因编辑
人工智能在利用 CRISPR-Cas9 技术增强基因编辑方面发挥着重要作用。CRISPR-Cas9 是一种强大的基因编辑工具,允许研究人员通过添加、删除或改变 DNA 序列的部分来对基因组进行精确编辑。
然而,CRISPR-Cas9技术的挑战之一是预测和最小化脱靶效应,脱靶效应是与预期靶位点相似的DNA序列的意外修改。
人工智能可以通过分析大量基因组数据来帮助解决这个问题,以预测潜在的脱靶效应及其可能性,从而引导研究人员进行更准确、更高效的基因编辑。
机器学习算法可以在基因组序列和 CRISPR-Cas9 切割图谱的大型数据集上进行训练,以根据靶序列和脱靶序列之间的相似性以及染色质可及性等其他因素来预测脱靶效应。
此外,人工智能可以通过分析基因组背景、功能注释和潜在的脱靶位点,协助识别 CRISPR-Cas9 编辑的最佳靶位点。这使得研究人员能够以最小的脱靶风险和更高的编辑效率来选择目标位点。
人工智能可以为 CRISPR-Cas9 技术做出贡献的另一个方面是引导 RNA (gRNA) 设计的优化。gRNA是CRISPR-Cas9系统中的重要组成部分,负责引导Cas9核酸酶到达目标DNA序列。AI算法可用于分析序列特征,预测gRNA结合效率,并针对特定靶标建议最佳gRNA序列,提高整体基因编辑效率和特异性。
在这种背景下,一家有趣的公司是 Synthego,它是 CRISPR 基因组工程解决方案的提供商,利用机器学习算法来分析和预测最佳向导 RNA (gRNA) 设计,最大限度地减少脱靶效应并最大限度地提高编辑效率。
基因序列优化
基因序列优化利用人工智能算法,特别是机器学习和深度学习模型,分析大量遗传数据并确定目标生物功能的理想基因序列。通过这样做,研究人员可以提高效率和稳定性来设计合成基因。
Benchling是该领域的一家著名公司 ,它为生命科学研究提供基于云的平台,使科学家能够使用机器学习算法设计、编辑和模拟基因序列。另一个例子是 ATUM,它使用其专有的 GeneGPS技术来设计针对在任何宿主生物体中表达进行优化的基因。Twist Bioscience 还处于基因序列优化的前沿,利用硅基 DNA 合成来生成适合各种应用的优化的高质量基因。
蛋白质设计
蛋白质设计和工程利用人工智能根据氨基酸序列预测蛋白质的结构和功能,使科学家能够创造具有特定特征的创新蛋白质。这个过程可以产生新的酶、疗法和生物材料。
该领域的关键参与者是 DeepMind,它是 AlphaFold 背后的公司,这是一个人工智能系统,可以根据氨基酸序列准确预测蛋白质结构,彻底改变蛋白质结构预测。
华盛顿蛋白质研究所的 Rosetta 是另一种用于蛋白质结构预测和设计的强大计算工具,可以创建定制蛋白质。此外, Zymergen 采用人工智能驱动的技术来设计和工程新型蛋白质,并应用于农业、医疗保健和材料科学等行业。
最后,Facebook 和 Instagram 背后的公司 Meta 公布了 ESM 宏基因组图谱,其中包含超过 6 亿个假定蛋白质的结构。
尽管 Meta AI 算法 ESMFold 可能不如 DeepMind 的 AlphaFold 精确,但它拥有更快的处理时间。这种速度的提高源于该算法的蛋白质结构预测方法,该方法采用根据序列数据或构成蛋白质的线性链中氨基酸的顺序训练的语言模型。
代谢途径工程
代谢途径工程利用人工智能来查明和增强代谢途径,以生成特定化合物,包括生物燃料、药品和各种化学品。通过检查基因、酶和代谢物之间的相互作用,人工智能算法可以预测合成目标分子的最有效路线。
Ginkgo Bioworks是这一领域的先驱公司之一 ,该公司利用人工智能驱动的技术来改造微生物,以生产具有工业应用价值的化合物。
另一个值得注意的例子是 Inscripta,它提供了 Onyx™ 平台,用于设计和改造微生物菌株,以优化目标分子生产的代谢途径。此外, Zymergen 利用人工智能和自动化来设计微生物并优化代谢途径,其应用涵盖农业、医疗保健和材料科学。
自动化实验设计
人工智能可以帮助优化合成生物学的实验设计,预测哪些实验最有可能产生有价值的结果,并指导研究人员做出更明智的决策。
该领域的领导者是 Synthace,它提供 Antha 平台、基于云的软件,用于使用机器学习算法设计、模拟和执行生物研究工作流程。另一个重要参与者是 Arzeda,一家利用人工智能和计算蛋白质设计为各种工业应用构建定制基因电路的公司。
TeselaGen 正在部署第一个解决方案,该解决方案将最先进的人工智能信息技术用于生物技术,作为安全的企业操作系统。TeselaGen 由 Synthetic Evolution® 机器学习引擎提供支持,可对各种来源的数据进行标准化、分析和集成,并允许设计高通量、高内容的实验。
总而言之,人工智能有能力给合成生物学带来重大变化,帮助我们解决当今一些最紧迫的问题。生物系统的复杂性、我们拥有的数据的局限性、验证模型的困难以及各个领域之间合作的需要,所有这些都存在需要克服的障碍。