GenSeg运用AI技术生成高质量的医学图像及其对应的分割标注,即便在仅拥有几十张样本的情况下,也能训练出与传统深度模型相媲美的分割系统,极大减轻了医生手工标注的工作负担。
医学图像的语义分割是现代医疗中的核心环节,广泛应用于疾病诊断、治疗规划、手术辅助等任务。从皮肤病变到眼底病灶,从肿瘤边界到器官结构,精准的像素级分割结果对临床医生来说至关重要。
尽管深度学习的发展显著提升了医学图像语义分割的准确性,但一个核心难题依然存在——对大量高质量标注数据的依赖。
在医疗领域,标注一个分割样本意味着专业人员需逐像素勾画病灶区域,每张图像的标注耗时可能长达数十分钟甚至更久。此外,数据还受到隐私保护等合规限制,使得我们在许多真实临床场景中面临超低数据的困境。
尽管已有数据增强和半监督学习等尝试,但它们仍存在局限性。例如,数据增强和分割模型训练分离,生成的样本无法有效提升分割模型的性能;而半监督方法则依赖海量未标注图像,这在医疗领域难以获得。
针对上述问题,加州大学圣地亚哥分校的研究团队提出了GenSeg,一种用于训练语义分割模型的三阶段框架。该框架将数据增强模型的优化和语义分割模型的训练紧密耦合,确保数据增强模型生成的样本能有效提升分割模型的性能。
论文地址:https://www.nature.com/articles/s41467-025-61754-6;代码地址:https://github.com/importZL/GenSeg
GenSeg可以应用于不同的分割模型,如UNet和DeepLab,以提升它们在in-domain(测试数据和训练数据来自同一数据集)和out-of-domain(测试数据和训练数据来自不同数据集)场景下的性能。
通过采用对应的数据生成模型和语义分割模型,GenSeg可以应用于3D数据分割任务。
技术核心
GenSeg包含两个主要组件:一是语义分割模型,负责预测输入图像的语义分割掩膜;二是掩膜到图像的生成模型,用于预测输入掩膜对应的图像。其中,GenSeg对普通的生成模型进行了修改,使其模型结构可以在训练过程中进行优化。
整个GenSeg框架由三个阶段构成,采用端到端的训练方式:首先使用真实的图像-掩膜来训练生成模型的参数;接下来对真实分割掩膜进行增强,生成新的掩膜,再通过使用上一阶段训练好的生成模型生成对应的医学图像;最后,将训练好的分割模型在真实验证集上评估,并根据验证损失反向更新生成模型的结构。之后再次进入阶段1,开启新一轮的训练-生成-优化循环。
实验结果
相比传统方法,GenSeg在显著减少训练样本的同时,仍可达到相当甚至更优的分割性能。
总结
GenSeg通过创新的端到端生成式框架,成功突破了医学图像分割中极少标注数据难以支持模型训练的关键瓶颈。该方法通过多层级优化策略实现端到端的数据生成流程,将可优化的条件式生成模型与图像语义分割模型深度耦合,使分割性能直接反向指导数据生成过程。
本文由主机测评网于2026-04-21发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439303.html