【科技前沿】人工智能成功编写“生命代码”!斯坦福大学与Arc Institute团队取得突破性进展,以噬菌体ΦX174为蓝图,首次利用AI生成了功能完整的基因组。其中,16个设计产物能精准靶向大肠杆菌,甚至有效对抗耐药菌株,这被誉为生命科学领域的“ChatGPT革命性时刻”。
人类历史上首次,人工智能生成了具备全功能的基因组!这一里程碑事件标志着合成生物学迈入新阶段。
回顾1977年,生物化学家Frederick Sanger及其团队完成了首个基因组测序——噬菌体ΦX174,为后续研究奠定基础。
四十多年后,斯坦福与Arc Institute团队以ΦX174为起点,借助AI技术成功设计了合成噬菌体基因组,实现了从读取到设计的跨越。
AI设计的噬菌体基因组之一,呈现如下结构:
命名为Evo-Φ36的AI生成噬菌体
简单来说,噬菌体ΦX174是一种专门感染大肠杆菌的病毒,它能精确猎杀细菌,同时对人体无害,因此在抗菌疗法中潜力巨大。
过去,基因组设计面临巨大挑战,需要综合考虑多重复杂因素,这严重限制了合成生物学的发展速度和应用范围。
为此,研究团队推出了核心工具——DNA语言模型Evo 1和Evo 2。这些模型基于数百万个基因组数据进行训练,能够学习基因组的深层特征和复杂模式。
Evo模型的工作原理类似于ChatGPT,但专门针对DNA序列处理,通过预测和生成,实现基因组的智能设计。
相关研究论文已发布:https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1
团队以ΦX174为模板,合成了285条基因组序列。实验结果显示,其中16个基因组能有效抑制宿主生长,精准靶向特定大肠杆菌菌株,且不误伤其他菌株,展现出高度特异性。
部分AI设计的噬菌体表现出比天然版本更强的复制能力和竞争性,甚至能对抗耐药菌,这为应对抗生素耐药性提供了新思路。
这一成果的意义深远,它验证了AI在合成生物学中的实际应用能力。
这标志着AI在合成生物学领域的重大突破——首次完整生成并验证了具备生物功能的噬菌体基因组。
该突破不仅扩展了人类对生命设计的认知边界,还为解决抗生素耐药性等全球健康挑战提供了创新疗法。
在技术博文中,研究团队详细解析了成功设计AI生成基因组的核心方法。
设计单个基因或完整基因组都是极具挑战的任务,涉及复杂的生物交互和平衡机制。
从生命进化史看,基因组已存在约40亿年,而DNA基因组的历史也有35亿年,这凸显了设计的难度。
今年早些时候,Arc Institute已证明Evo模型能生成单个蛋白质或多组分系统,但设计整个基因组需要应对更高维度的复杂性。
基因组设计的难点在于多基因相互作用、维持复制平衡、宿主特异性及进化适应性,这些在单蛋白设计中并不存在。
团队开发了多项创新技术来应对挑战,包括:
要生成合成基因组,需要一个可靠的起点。噬菌体ΦX174作为微小病毒基因组,仅含5386个核苷酸,编码11个基因,是理想模板。
左图:ΦX174噬菌体显微图像;右图:单个ΦX174噬菌体的三维结构
其大小适中,适合当前DNA合成技术,同时复杂度足以测试基因组设计能力。然而,ΦX174的重叠基因结构带来了严格约束——单个突变可能影响多个蛋白功能。
此外,它编码了多种调控元件,确保在宿主细胞内正确包装和复制。ΦX174的研究是一场跨越半世纪的接力:1977年,Fred Sanger团队完成首个测序;2003年,Craig Venter团队首次化学合成;2025年,AI生成基因组实现设计飞跃。
这一演进标志着基因组学的核心能力迭代:从读取(测序)到写入(合成),再到智能设计(AI生成)。
ΦX174基因组结构示意图
ΦX174的重叠基因使得标准注释工具失效,仅能识别11个基因中的7个。为此,研究人员开发了专属注释流程,结合开放阅读框搜索和同源性比对,成功识别全部基因。
这一工具在评估AI生成序列时至关重要,设定了底线——生成的基因组必须预测至少7个匹配天然ΦX174的蛋白质,确保功能完整性。
原始Evo模型基于海量数据训练,但缺乏对ΦX174的针对性。通过监督微调,在14,466个精选微小噬菌体序列上进一步训练,模型能更精准地生成ΦX174相关变异。
微调后,结合提示词工程,Evo可生成既相似又创新的序列,犹如在模板上注入新灵感。
生成序列后,团队建立了多维度评估体系,检查基因排列、宿主特异性和进化多样性。关键是要确保AI噬菌体能感染实验用的非致病性C型大肠杆菌。
通过要求序列包含类似ΦX174的刺突蛋白(决定宿主范围),实验证实所有16个功能性噬菌体都严格靶向C型和W型大肠杆菌,对其他菌株无效。
这证明宿主特异性可在基因组其他区域进化时得以维持。
传统噬菌体研究耗时繁琐,团队创新了筛选流程:用Gibson组装合成基因组,转化至大肠杆菌,在96孔板中监测生长抑制。成功感染会导致细菌密度在2-3小时内骤降。
该方案快速测试了285个设计,验证了16个功能性噬菌体,并表征了其适应性和宿主范围。
AI设计噬菌体的实验检测示意图
这些AI基因组携带67-392个新突变,其中Evo-Φ2147有392个突变,与天然噬菌体NC51的同一性为93.0%,按分类学标准可视为新物种。
13个基因组包含自然界未见的突变,表明Evo能探索全新序列空间。有趣的是,合成噬菌体Evo-Φ36整合了远亲噬菌体G4的DNA包装蛋白(J蛋白),这在以往是工程难题。
冷冻电镜显示,AI通过协调补偿突变,使新蛋白组合正常运作。
抗生素耐药性每年导致全球数十万人死亡,细菌进化迅速,而噬菌体疗法有望破局。研究中,团队诱导了三种对ΦX174耐药的C型大肠杆菌菌株(waa操纵子突变)。
结果显示,AI生成的噬菌体“鸡尾酒”在1-5次传代内攻克了耐药菌,而单独使用天然ΦX174则无效。
成功的噬菌体是“嵌合基因组”,融合多个AI片段,突变集中在受体交互区。序列分析表明,它们结合了2-3种不同AI设计的遗传元件。
这使人类无需依赖天然稀有噬菌体,AI可直接生成多样化群体,形成“多重打击”,让细菌难以发展全面耐药性。
总之,AI能快速筛选有效序列,让噬菌体疗法从“试错”转向“精准设计”,未来有望领先细菌变异,提供持续解决方案。
当前,噬菌体疗法正成为对抗多重耐药菌的有力武器。近期医学研究聚焦植物病原体或大型DNA噬菌体,而AI模型通过训练和验证,已能捕捉进化约束,桥接生成序列与生物现实。
随着模型迭代和合成成本下降,全基因组设计将开启未探索的进化空间,为生物技术和基础研究开辟新前沿。从读取、写入到设计,这一转变标志着人类改造生物学的能力步入全新阶段。
Brian Hie
斯坦福大学化学工程系助理教授、Arc Institute创新研究员,专注于生物学与人工智能交叉领域。他拥有MIT CSAIL博士学位,本科毕业于斯坦福大学。
Samuel King
斯坦福大学博士研究生,在Arc Institute从事合成生物学与机器学习交叉研究。他本科毕业于哥伦比亚大学(UBC),获生物学荣誉学士学位。
参考资料:
https://x.com/samuelhking/status/1968329299364376698 https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1
https://arcinstitute.org/news/hie-king-first-synthetic-phage
本文由主机测评网于2026-01-01发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114088.html