令人振奋的消息!AI如今也能协助科学家绘制大脑图谱了!
最近,来自加州大学旧金山分校的一支神经科学团队研发了一种全新的机器学习算法——CellTransformer,仅仅数小时便完成了对5只小鼠大脑图谱的分类与绘制。
这五只小鼠大脑的基因数据囊括了1040万个细胞,每个细胞包含数百个基因。借助这一创新算法,研究团队不仅清晰地划分出小鼠大脑内的已知区域,还发现了新的脑区。
更令人瞩目的是,这项技术有望进一步应用于人类大脑。
大脑图谱绘制自古以来就是一门学科,过去的方法相当繁琐,需要科学家用铅笔在脑部图像上连线,连接不同区域。
2020年发布的艾伦小鼠脑通用坐标框架(Allen Mouse Brain Common Coordinate Framework),就是采用这种方法绘制而成的。
这幅脑图基于1675只小鼠的脑部数据,涵盖了1000多个不同的脑区,价值非凡。
然而,这种手工特征鲜明的图谱也不可避免地存在一个问题:主观性。
宾夕法尼亚州立大学医学院的神经解剖学家金永洙(Yongsoo Kim)表示,当他向资深专家请教如何画脑图时,对方往往只有一句话:“这都是我脑子里的。”
如今,加州大学旧金山分校的Reza Abbasi-Asl及其团队推出了一套名为CellTransformer的编码器-解码器架构,数小时就能完成这项工作。
CellTransformer的工作原理是这样的:
随机掩盖一个细胞的身份和基因表达,让模型根据邻近细胞进行预测,预测错误就更新,重复数百万次。
具体来讲,研究人员会为每个细胞划定一个“邻域”——以它为中心,在一定微米距离内的所有细胞都被纳入观察范围。这样模型就能在同一时间内,既看到细胞间的空间结构,又能看到它们在分子层面的差异。
在这个邻域里,每个细胞都被视为一个token,就像语言模型中的一个词。
CellTransformer利用Transformer的自注意力机制让这些细胞彼此“交流”:模型会自动学习哪些细胞关系更重要,哪些邻居对当前细胞影响更大。
训练时,研究人员采用了一种非常巧妙的自监督方式。模型会随机选中一个细胞,将其基因表达信息“掩盖”,只保留其细胞类型标签,然后让模型根据周围邻居的情况预测该细胞原本应该表达哪些基因。
内部结构是这样的:
通过多层Transformer编码器架构,模型会让邻域内所有细胞的信息充分交互。
随后,它会把这些细胞的表示通过一个学习得到的池化操作压缩成一个向量,用来代表整个邻域的“组织环境”。
接下来,模型再结合被掩盖细胞的类型信息,通过一个较浅的解码器反推出该细胞的基因表达分布。
最后,研究人员为每一个细胞提取一个“邻域表示向量”,把所有细胞、所有切片的这些向量拼接在一起,再用k-means等聚类方法进行分析,脑区就会“自然浮现”。
已知的功能区会自然对齐,而在一些区域中,模型还会进一步拆分出更精细的亚区,甚至发现过去从未被系统标注过的新脑区。
本文由主机测评网于2026-04-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260435870.html