当前位置:首页 > 科技资讯 > 正文

谷歌推出超轻量级Gemma 3 270M模型

谷歌推出超轻量级Gemma 3 270M模型 谷歌 Gemma 270M 轻量级模型 指令跟踪 第1张

智东西8月15日报道,今日,谷歌推出了迄今为止最小的开源模型Gemma 3 270M,一个仅包含2.7亿参数的轻量级模型,其底层设计专为特定任务微调,具备强大的指令追踪和文本处理能力

在指令执行能力测试中,例如IFEval基准测试,Gemma 3 270M在性能上超越了尺寸更大的Qwen2.5 0.5B Instruct,与Llama 3.2 1B的能力相当。

谷歌推出超轻量级Gemma 3 270M模型 谷歌 Gemma 270M 轻量级模型 指令跟踪 第2张

Gemma 3 270M在特定任务上的表现可与大模型媲美。其小巧的尺寸和出色的性能使其非常适合用于离线、基于网页的创意任务。例如,谷歌展示了一个使用Gemma 3 270M驱动的睡前故事生成器网页应用,该应用基于Transformers.js,用户只需简单勾选即可生成精彩的睡前故事。

谷歌推出超轻量级Gemma 3 270M模型 谷歌 Gemma 270M 轻量级模型 指令跟踪 第3张

Gemma 3 270M的核心能力包括:

1、轻量级但强大的架构。该模型拥有2.7亿个参数,其中嵌入参数有1.7亿个,Transformer模块参数有1亿个。凭借庞大的256k个token词汇量,该模型能够处理特定和稀有的token,成为在特定领域和语言中进一步微调的理想基础模型。

2、极致能效。该模型在低功耗方面表现出色。在Pixel 9 Pro SoC上的内部测试显示,INT4量化模型在25次对话中仅消耗0.75%的电量,成为谷歌最节能的Gemma模型。

3、指令遵循。该模型同时发布了指令微调版本和预训练检查点。尽管该模型并非为复杂的对话用例而设计,但其基础指令遵循能力出色,能够“开箱即用”地响应通用指令。

4、可用于生产的量化。该模型提供量化感知训练(Quantization-Aware Trained, QAT)检查点,支持以INT4精度运行,且性能损失极小。这对于在资源受限设备(如手机、边缘设备)上部署至关重要。

简而言之,对于拥有明确任务、成本意识强、需要快速迭代和部署或具有隐私保护需求的用户来说,Gemma 3 270M是一个理想的选择。

Hugging Face地址

结语:轻量化模型释放端侧智能

此前,谷歌Gemma开源模型加速迭代:先是适用于单云和桌面加速器的Gemma 3和Gemma 3 QAT发布,随后是将强大实时多模态AI直接引入边缘设备的Gemma 3n推出。本次Gemma 3 270M的推出进一步丰富了轻量模型系列。

轻量化模型正在打破参数迷信。长期以来,大模型领域存在“参数规模决定性能”的固有认知。而Gemma 3 270M展示了小模型在指令遵循以及微调后的强大威力。从轻量级但强大的模型入手,用户可以构建精简、快速且运行成本显著降低的生产系统。