当前位置:首页 > 科技资讯 > 正文

AI硬件:从“笔”到“屏”,未来交互的两条路径

过去一年,AI硬件的战场不再局限于“大模型进手机”,而是转向更底层的探索:人们将如何与AI互动。

在此背景下,AI硬件产品如雨后春笋般涌现,从AI耳机、AI眼镜到AI手机、AI录音笔等,不一而足。

一边是无需屏幕、可穿戴的“新物种”,另一边则是依托屏幕、将AI融入系统底座的传统终端升级。

我们将前者统称为“笔”:它并非指具体外形,而是泛指轻便、随身、低存在感,以音频/环境感知为主输入,通常不配备屏幕的AI硬件。

早在2024年,Humane推出的AI Pin便是一个激进例子。这款产品被定义为可穿戴电脑,旨在让用户摆脱智能手机。然而,由于高延迟、投影不可见及应用生态匮乏等问题,它只获得了约1万笔订单,随后Humane被惠普收购。

相比之下,更务实的“笔”正逐步从特定场景切入市场。以Plaud、钉钉A1、飞书录音豆为代表的AI录音硬件,专注于会议、采访等明确场景,通过随身采集语音,再由大模型完成转写与总结。

OpenAI也加入了这一行列,确认与前苹果设计负责人Jony Ive合作,开发一种不同于手机与PC的新型AI设备,强调更自然的交互与更低的存在感,形态被描述为“像一支笔”。

与“笔”并行的是另一条以屏幕为中枢的路线。微软将Copilot+PC定义为新一代PC形态,并提出NPU算力门槛;Meta和各大手机厂商则在眼镜、手机等终端上强化AI与显示、系统的深度融合。

将这些现象综合起来看,可以清晰地看到两条分岔路:新锐AI公司更倾向于“笔”——无屏、贴身、输入优先;传统互联网/硬件公司则更倾向于“屏”——在现有产品形态上,延伸显示、系统与生态能力。

显然,面对AI硬件这一品类,行业内已出现对交互成本、技术成熟度与商业化路径的不同押注。

1

2025年,在一次公开对谈中,OpenAI CEO奥特曼形容当下的数字生活“如同走在时代广场”。

他提到,信息、推送和屏幕不断争夺注意力,而他们探索的AI硬件目标却恰恰相反——“更平静(more calm),更少打扰(less distracting)”。

事实上,这一理念并不新鲜,却在近两年被重新提及。与其把AI塞进手机或PC,不如退回到更基础的一层:先感知和连接世界本身。我们把这类设备概括为“笔型AI”——轻、贴身、低存在感;在产品逻辑上,它们的感知优先级高于操作。

从行业视角看,“笔型AI”并不在于替代手机或PC成为新的硬件入口,而在于争夺个人与组织的第一手输入权:语音、环境、视角,在相对无感的前提下,让AI能够持续接收并处理信息。

然而,这一理念在过去几年中并未孕育出成功打开市场的产品。

回到2024年,Humane推出的AI Pin和Rabbit的R1都试图成为“脱离手机的AI终端”,通过语音或环境感知完成即时响应,甚至跨应用执行任务。但结果却是反响平平,未能打开市场。

体验差是最直接的原因。科技评测人Marques Brownlee直言:“这是我评测过最差的产品之一——不是因为想法,而是因为它现在根本不能用。”

另一层原因是当时端侧算力还无法支撑复杂推理,大多数无屏设备延迟与中断频繁。《华尔街日报》科技专栏作家Joanna Stern在对比体验多款无屏AI设备时写道,Humane AI Pin与Rabbit R1“更像科学项目,而不是成品”。她还在视频测试中记录到Rabbit做一次“实时翻译”用了四分钟。

而在一些更“垂”的场景里,“笔型AI”的定位迅速收缩,以记录优先的一批AI产品陆续面世。在中国市场,这种变化尤为明显,例如钉钉推出的A1录音卡片以及飞书与安克合作的AI录音豆。

海外市场也出现了类似取向的产品,如Plaud的Note Pro。这类设备更关注把碎片化的语音、会议内容和环境音转成可检索、结构化的语料。

2

与试图降低存在感的“笔型AI”不同,有屏的硬件阵营——无论是传统的PC/手机还是新锐产品——都在过去两年中积极拥抱AI。

这条路线的分水岭出现在AI从“应用能力”转向“系统能力”的时刻。

2024年5月,微软发布Copilot+PC,号称是一次AI在操作系统层面的重构。官方文档指出新一代Windows设备需要配备算力达到40+TOPS的NPU部分AI能力将以“系统原生”的方式运行而非通过独立应用调用。

AI硬件:从“笔”到“屏”,未来交互的两条路径 AI硬件 无屏设备 屏幕终端 交互逻辑 第1张

这一设计本质上是在将AI融入硬件的系统层。微软消费业务负责人Yusuf Mehdi在发布中直言这是“重新定义Windows电脑”的一次调整。

手机端也遵循同样的逻辑。无论是苹果、三星还是小米、vivo等国产厂商近年来都将AI能力直接下沉到系统层。

这表明在AI时代屏幕仍然是信息展示交易确认和权限授权的中枢。AI加持下的智能手机拥有了与超级App争抢“第一入口”的资本。

3

拆解使用逻辑后你会发现“笔”和“屏”并非同一条路。想象一个日常场景:开会时你只想完整记录对话;散会后你需要把重点写进纪要并分配任务。在AI交互层面前者需要“感受和采集”后者需要“操作和订正”。

是否让AI参与决策成为这场AI硬件分化背后的重要原因之一。有些场景可以不涉及决策先行感知但一旦进入决策环节交互逻辑就完全不同。

“决策”为何必须更谨慎?复杂系统研究者梅拉妮·米切尔在采访中表示生成式模型容易在不同情境下表现出脆弱性与自相矛盾因此人类必须保持监督与编辑的角色。

换言之模型可以帮你推进流程但人必须能够监控这个过程并且随时介入和把控。这正是有屏AI硬件不可替代的一面。