设想一下,假若要求一位经验丰富的大厨利用发霉食材和过期调料制作菜肴,即使其烹饪技术再高超,也难以做出美味。AI的训练同样遵循这一原则。
当前主流的AI图像生成模型,例如Stable Diffusion、FLUX等,都需要从网络上抓取数以百万计的图像进行学习。然而,这些网络图片的质量良莠不齐:部分模糊不清,有些内容重复,更有甚者仅仅是广告背景图。使用这类“劣质食材”训练的AI,其生成效果自然难以令人满意。
由香港大学丁凯欣领衔,联合华南理工大学周洋以及快手科技Kling团队共同研发的一项研究,推出了一款名为“炼金师”(Alchemist)的AI系统。该系统犹如一位严苛的美食家,能够从海量的图像数据中精准筛选出最具价值的一半样本。
更令人振奋的结果是:
传统的数据筛选方式好比用筛子过滤米粒,往往只能依据单一维度进行评判:
此类方法的根本缺陷在于:它们无法辨别哪些数据才能真正促进AI的学习进程。
相比之下,“炼金师”更像一位阅历深厚的美食评论家,能够综合考量多个维度:
其核心理念在于:引导AI学会观察并反思自身的学习历程。
“炼金师”训练了一个专用的评分模型,该模型如同资深艺术导师,能够评估每张图像在整个学习过程中的贡献价值。
评判标准:
✅ 若某张图像能使AI模型获取新知识并迅速优化 → 优质数据
❌ 若某张图像经过多次学习后仍无明显提升 → 无效数据
这就好比通过观察学生解题时的表情变化和进步速度,来判断题目难度是否适宜。
研究团队揭示了一个违背常理的现象:
那些看似最为“简单”的图像,例如纯白背景下的产品照片:
恰恰相反,那些内容丰富且具有一定挑战性的图像,才是真正的“养分”
研究团队跟踪了不同评分区间图像在训练过程中的动态变化:
基于上述发现,团队创新性地提出了“偏移高斯采样”(Shift-Gsample)策略。
传统Top-K方法:
炼金师策略:
这如同制定健身方案:
为更精准地评估数据质量,“炼金师”还引入了“多粒度感知”机制:
正如营养师不仅关注单一食材的营养成分,还会统筹整餐的营养均衡。
在LAION-30M数据集上:
关键发现:
“炼金师”方法在不同规模和架构的模型上均表现优异:
在多种类型数据集上的测试结果:
HPDv3-2M数据集(真实+合成混合):
Flux-reason-6M数据集(纯合成推理数据):
研究团队对筛选后的数据进行了可视化展示:
0-20%高分区域(简单但营养不足):
30-80%中分区域(最有价值的“金中间”):
80-100%低分区域(过于混乱):
训练稳定性对比:
采用“炼金师”筛选的数据,表现出:
✅ 持续稳定的性能提升
✅ 更快的收敛速度
✅ 更小的训练波动
而随机选取的数据则呈现:
❌ 初期训练波动较大
❌ 性能提升缓慢
❌ 需要更多训练轮次才能收敛
“炼金师”的核心架构是一个双层优化框架
外层优化:学习评分策略
内层优化:训练代理模型
核心思想:
若某样本能提升验证性能 → 则提高其评分
若某样本仅降低训练损失而未能提升验证性能 → 则降低其评分
A:“炼金师”通过观察AI模型在学习过程中的“反馈”来评估数据价值:
✅ 优质数据:能使模型获取新知识并快速优化
❌ 劣质数据:模型反复学习却无明显进步
这正如通过观察学生解题时的表情与进步速度,来评判题目难度是否恰当。
技术细节:
A:因为并非所有数据都具有同等价值,关键在于质量而非数量。
类比说明:
科学原理:
1. 冗余数据消耗资源却无益于性能提升:例如重复的简单样本、模糊的噪声图像
2. 高价值数据能促进深度学习:如内容充实的中等难度样本、多样化的场景与对象
3. 防止过拟合:仅使用简单数据易导致模型“死记硬背”,需引入适当难度的数据以培养泛化能力
A:完全可以!研究表明该方法具备优异的通用性和跨模型适配性。
验证范围:
✅不同数据类型:
✅不同模型架构:
✅不同模型规模:
原理:
数据质量是其固有属性,不依赖于特定模型
正如优质食材适用于各种烹饪方式
资深教练制定的训练方案,既能满足业余爱好者,也适用于专业选手
Project Page:https://kxding.github.io/project/Alchemist/
Github:https://github.com/KlingTeam/Alchemist/
arXiv:https://arxiv.org/abs/2512.16905
本文由主机测评网于2026-03-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:http://www.vpshk.cn/20260330327.html