当前位置:首页 > 科技资讯 > 正文

谷歌与耶鲁AI模型C2S-Scale突破:生成抗癌新假设并获实验验证

近期,人工智能在科学应用领域再度传来重磅消息!

谷歌与耶鲁AI模型C2S-Scale突破:生成抗癌新假设并获实验验证 AI模型  癌症免疫治疗 科学假设 细胞转录组分析 第1张

谷歌公司与耶鲁大学的科研团队联合发布了一款大型模型Cell2Sentence-Scale 27B(简称C2S-Scale)。

该模型针对癌细胞行为提出了一个全新假设,并已在多次体外实验中成功验证。

这一发现引发了广泛关注,展示了人工智能模型生成原创科学假设的潜力,有望为人类抗癌开辟新途径。

网友prinz在X平台上评论道,「这表明该模型并非简单复现已知事实,而是产生了新颖、可验证的科学假设。」

C2S-Scale基于谷歌的开源Gemma模型构建,训练语料涵盖超过10亿个Token的转录组数据、生物学文献与元数据,从而使其具备跨维度解析细胞行为的能力。

目前,耶鲁大学的研究团队正在推动AI在其他免疫学情境中生成更多科学预测,这一机制有望加速抗癌新疗法的研发进程。

研究人员还在bioRxiv上公开了论文预印本,目前该论文正处于「同行评审」阶段。

谷歌与耶鲁AI模型C2S-Scale突破:生成抗癌新假设并获实验验证 AI模型  癌症免疫治疗 科学假设 细胞转录组分析 第2张

论文地址:https://www.biorxiv.org/content/10.1101/2025.04.14.648850v2.full.pdf+html

AI不仅限于复现

更能提出全新发现

C2S-Scale是一款拥有270亿参数、旨在理解单个细胞「语言」的基础模型。

它建立在Gemma模型家族之上,将单细胞分析推向了一个新前沿。

C2S-Scale在科学预测方面的成果验证了研究团队在生物学模型上的一项假设:

生物学模型同样遵循明确的模型扩展规律——就像自然语言模型一样,模型规模越大,在生物学任务上表现越优。

这也引出一个关键问题:更大的模型只是提升了已有能力,还是能够获得全新的推理能力?

模型扩展的真正潜力,在于催生新思路、揭示未知规律,而非仅限于性能的线性提升。

癌症免疫治疗的一大挑战在于许多肿瘤对免疫系统几乎「隐身」。

让肿瘤「现身」的一个关键是通过抗原呈递(antigen presentation)让它们显示出能触发免疫反应的信号。

抗原呈递,是把病原体(比如病毒、肿瘤)的「可疑分子片段」(抗原)展示在细胞表面,让免疫细胞识别并决定是否发动攻击。

研究人员赋予C2S-Scale这样的任务:让它寻找一种「条件性放大剂」,能在「免疫环境阳性」(Immune-Context-Positive)情况下增强免疫信号。

这一任务需要模型具备复杂的条件推理能力,而这种能力正是大模型随规模扩大所涌现的特性——较小模型无法捕捉这种依赖环境的效应。

为了实现这一点,研究人员设计了一个「双环境虚拟筛选」流程,以识别这种特定协同效应。

该流程包括:

免疫环境阳性(Immune-Context-Positive):输入真实患者样本,保留肿瘤与免疫系统的交互,并维持低水平干扰素信号;

免疫环境中性(Immune-Context-Neutral):输入缺乏免疫背景的细胞系数据。

研究人员在以上两种环境中对超过4000种药物进行模拟,并要求模型预测哪些药物只会在免疫环境阳性条件下增强抗原呈递,从而更符合临床实际。

结果显示,约有10%–30%的药物在文献中已有报道,这验证了模型的可信度。

而其余候选则是从未被报道过的新发现,这意味着模型不仅复现了已知生物学现象,还发现了潜在的新型免疫协同药物。

新里程碑

AI「抗癌假说」获实验验证

C2S-Scale模型发现了激酶CK2抑制剂silmitasertib(CX-4945)具有显著的「环境分化效应」:

仅在免疫信号活跃的环境中显著增强抗原呈递,而在免疫中性环境下几乎无效。

这一发现表明模型成功生成了具备实验可验证性的全新生物假设。

在后续实验阶段,研究人员在人体神经内分泌细胞模型中测试了这一假设,实验显示:

单独使用silmitasertib对抗原呈递(MHC-I)影响不显著;

低剂量干扰素单独使用仅产生轻微效果;

联合使用两者则显著增强抗原呈递,提升约50%。

这一结果证实模型预测的可靠性,并揭示出让肿瘤对免疫系统更易识别的潜在新途径。

C2S-Scale模型的计算机模拟预测多次在体外实验中得到验证。

它成功识别出一种新的干扰素依赖性放大剂,揭示出让「冷肿瘤」变「热」的潜在新途径,为免疫治疗带来新希望。

尽管该研究仍处早期阶段,这一成果已为新型联合疗法的开发提供了实证依据,并开启了以大模型驱动的生物学发现新范式——科学假设的生成、筛选与验证将日益智能化、系统化。

目前,新的C2S-Scale 27B模型及其相关资源已在Hugging Face全面开放。

谷歌与耶鲁AI模型C2S-Scale突破:生成抗癌新假设并获实验验证 AI模型  癌症免疫治疗 科学假设 细胞转录组分析 第3张

访问地址:https://huggingface.co/vandijklab/C2S-Scale-Gemma-2-27B

也可以在GitHub上获取其代码。

谷歌与耶鲁AI模型C2S-Scale突破:生成抗癌新假设并获实验验证 AI模型  癌症免疫治疗 科学假设 细胞转录组分析 第4张

代码地址:https://github.com/vandijklab/cell2sentence

研究人员希望与更多人共同探索上述工具,进一步拓展研究成果,让大模型解读更多生命语言奥秘,从而为医疗科技带来全新突破。

参考资料:

https://x.com/sundarpichai/status/1978507110477332582

https://blog.google/technology/ai/google-gemma-ai-cancer-therapy-discovery/