当前位置:首页 > 科技资讯 > 正文

谷歌开源新宠Gemma 3 270M,高效便捷

谷歌最新开源巨献Gemma 3 270M震撼登场!

仅需几分钟即可完成精准微调,无论是指令遵循还是文本结构化,其表现都令人眼前一亮,性能直逼Qwen 2.5同级模型。

谷歌开源新宠Gemma 3 270M,高效便捷 Gemma 270M  人工智能 高效模型 轻量化 第1张

发布当日,网友直呼:以为是270B,结果却是0.27B,真是令人惊喜。

谷歌开源新宠Gemma 3 270M,高效便捷 Gemma 270M  人工智能 高效模型 轻量化 第2张

这款模型不仅小巧高效,还能在浏览器中本地运行,无需联网即可生成创意内容,如睡前故事。

谷歌开源新宠Gemma 3 270M,高效便捷 Gemma 270M  人工智能 高效模型 轻量化 第3张

更有人利用这款迷你模型构建了自己的OCR应用,上传图片或PDF文件,即可用LLM即时转换为结构化Markdown格式。

谷歌开源新宠Gemma 3 270M,高效便捷 Gemma 270M  人工智能 高效模型 轻量化 第4张

值得一提的是,新模型仅有4个注意力头,比Qwen 3 0.6B少12个,名副其实轻量级。

谷歌开源新宠Gemma 3 270M,高效便捷 Gemma 270M  人工智能 高效模型 轻量化 第5张

接下来,让我们一起探索这款迷你Gemma 3的亮点。

Gemma 3 270M核心功能

正如不会用大锤挂相框,选择合适工具至关重要。

Gemma 3 270M正是“为工作选择合适工具”理念的完美体现。

作为基础模型,它开箱即享精准指令遵循,微调则能释放其真正实力。

经过优化,它在文本分类、数据提取等任务中表现卓越,准确、快速且成本可控。

紧凑且高效的架构

新模型共含2.7亿参数,其中1.7亿为嵌入层参数(因庞大词汇量),另1亿为Transformer模块参数。

凭借25.6万token的词汇量,该模型能处理特定及罕见词汇,成为特定领域和语言微调的理想选择。

极致的能源效率

该模型在终端运行毫无压力。

测试显示,在Pixel 9 Pro手机(SoC芯片)上运行INT4量化版时,25轮对话仅耗电0.75%,堪称能效最高的Gemma模型。

指令遵循

发布包含指令微调模型及预训练检查点,开箱即可精准遵循常规指令。

可用于生产的量化支持

提供量化感知训练(QAT)检查点,以INT4精度运行,性能损耗微乎其微,适合资源受限设备部署。

...