当前位置:首页 > 科技资讯 > 正文

AI从云端到本地:效率革命与Local Agent的崛起

自今年下半年以来,AI圈中流传着一个半开玩笑的段子:“DeepSeek R2为何还未发布?因为Scaling Law失灵了。”

在这笑话背后,是整个行业面临的严峻现实:大模型的边际收益正在递减,AI竞赛的上半场规则正在失效。

首先是训练模型所需费用的巨量增长:训练一个GPT-4级别的模型,费用已突破1亿美元大关。而据BOND于2025年5月底发布的最新《AI 行业趋势研究报告》显示,目前训练最尖端AI模型的成本已接近10亿美元规模,这一成本远超历史上任何技术开发项目,标志着AI模型训练进入了只有资本雄厚巨头企业才能主导的时代。

其次是模型能力遇到了增长瓶颈:从GPT-3.5到GPT-4再到GPT-5,大模型的智能水平跃升令人惊叹;但从GPT-4到GPT-4.5再到GPT-5,即便参数量翻倍,能力提升却越来越不明显。Scaling Law开始“撞墙”——简单地堆砌参数,不再是通往AGI的捷径。

然而,就在巨头们陷入困境时,一个“小模型”逆袭的故事正在上演。今年5月,DeepSeek R1-0528将原来671B参数的大模型蒸馏到仅有8B,不仅保持了原有能力,在AIME 2024测试中甚至反超原模型10%。

类似的故事还在Qwen3-VL 4B/8B(Instruct / Thinking)模型上演。这些案例震撼了整个AI界——站在巨人肩膀上的小模型,居然可以超越巨人本身。

从Cloud First到Local First,AI进入下半场

1965年,戈登·摩尔提出了著名的预言:集成电路上可容纳的晶体管数量大约每18-24个月翻一番。这个预言推动了计算性能的指数级增长,也推动了移动互联网和云计算革命的到来。然而到了2015年以后,这条黄金法则开始失灵。晶体管已经小到接近原子尺度,继续往下压会遇到物理极限;制造成本也水涨船高。

摩尔定律放缓后,各家科技巨头不得不寻找新路。苹果的思路是“垂直整合”,自研芯片从底层重写硬件与软件的协作方式。而英伟达则走上了另一条路,黄仁勋敏锐地意识到未来是“万核并行”的时代,于是从2006年起推动GPU通用计算化。

正如当年芯片产业所经历的那样,当摩尔定律放缓,产业也开始从“制程竞赛”转向“架构创新”。而AI产业,也正在经历和芯片产业同样的范式变迁。

过去三年,生成式AI经历了爆发式增长。但繁荣之下,三大痛点日益凸显:生产力上体验不闭环、Token成本成为应用瓶颈、网络依赖限制使用场景。然而,在这三个痛点之外,也有三股新生力量正在汇聚:小模型能力正在发生质变、端侧芯片正在打开市场、用户需求正在觉醒。

在这些痛点和趋势之下,一个清晰的共识正在形成:AI的未来不是云端取代本地,而是云端与本地的深度协同,而本地智能将承载50-80%的日常任务。

从“小模型”到“Local Agent”,为何AI产品本地体验总是差强人意?

然而,理想很丰满,现实却很骨感。在AI Agent爆发的当下,绝大多数现有产品的本地体验依然“差强人意”。

以Ollama、LM Studio为代表的本地AI产品为例,其核心问题并非模型性能不足,而是发展模式和用户需求间存在根本性差异。首先是定位偏差:这类产品本质上是为开发者设计的“本地版ChatGPT”体验工具。这对普通用户造成了三大体验问题:远离非技术用户、缺乏垂直整合、放大模型缺陷。

其次是技术栈问题:大多数本地产品在错误的技术路线上进行优化。尽管Ollama、LM Studio试图围绕开发者需求打造CLI等周边工具集,但整套Local Infra的地基并不牢靠。

综上所述,本地Agent的真正价值不在于“泛泛而谈”,而应利用身位更近、快云端一步的优势,深度整合于特定垂直场景工具,实现工具嵌入推理服务(Tool-Integrated Reasoning),带来更好的智能服务体验。

从“1-bit 模型”到“Local Agent Infra”:GreenBitAI的十年 “Local” 长征

当云端AI竞赛因成本与物理极限而趋于瓶颈时,一个坚守与深耕低比特模型近十年的德国的技术团队,正以一款专业级的 Local Agent 产品,撬动着 Local Agent Infra 这个万亿级的增量市场。

GreenBitAI的故事是一个从“做模型”到“做基础设施”的战略进化史。故事要从2016年说起。彼时深度学习刚刚崛起,GreenBitAI团队研发出首个在ImageNet上精度超过60%、70%的1-bit CNN模型。这些成果证明了这条路的正确性。

2023年,ChatGPT引爆大语言模型热潮。杨浩进和团队意识到:技术窗口来了。于是Libra(Beta版)诞生了。它虽然是一个偏垂直的文档处理Agent应用,但实际上是GreenBitAI打磨Local Agent Infra的重要抓手。

“只有躬身入局做产品,方知其中技术上的难与妙。”杨浩进说,“只有从开始就瞄准‘专业级体验’,以最终用户体验为唯一标准。”

在Libra的打磨过程中,GreenBitAI构建出完善的Local Agent Infra技术栈。该技术栈包含多个核心模块:模块一:模型层优化——不只是压缩;模块二:性能层优化——让模型在本地跑得更快、更省;模块三:上下文工程——降低难度。

一款专业级Local Agent,撬开万亿美元增量市场

2025年9月30日,GreenBitAI正式发布了Libra beta release——全球首个支持完全本地化、可在断网环境下运行的专业级AI性能需求的Agent产品。

Libra有三大核心亮点:一是专业级文档处理与生成;二是完全本地化运行;三是轻量化与高性能。

“我们做的Local Agent Infra,专门针对消费级硬件生态。”杨浩进说,“只要是想要在本地设备上落地的AI应用,我们都希望能成为他们的支撑。”

“端侧AI设备会像家庭Wi-Fi中继器一样普及。”杨浩进用了一个比喻。端侧AI正在经历相同的路径:当前是云端AI是主要选择;3年内50-80%任务迁移到本地;5年后每个房间一个AI小站。

“平台化Agent Infra可能是最大的想象空间。”当端侧AI应用爆发时,开发者需要统一的模型格式、推理引擎、优化工具。谁提供了这个平台谁就掌握了生态主导权。