当多数AI企业还在优化“屏幕内体验”之际,OpenAI正进行一场反直觉的变革:摒弃屏幕。
据多家外媒透露,OpenAI的新一代音频模型预计将于2026年第一季度面世。在此之前,OpenAI已重新调配多个工程、产品和研究团队,集中资源投入音频AI领域;以65亿美元收购由前苹果首席设计官Jony Ive创立的io公司;并围绕一款“始终在线、语音为核心、无屏幕”的消费级设备制定长期规划。
这并非孤立创新,而是基于新假设:若AI能真正理解你的环境及活动,它是否还需屏幕来证明自身存在?
在OpenAI的愿景中,下一代设备无需低头、滑动和确认,而是如“环境共生体”,通过聆听和观察,在恰当时刻介入。Sam Altman直言,屏幕限制了AI的潜力;而Jony Ive视此项目为“新设计运动的开端”。
实际上,这种转变不仅限于OpenAI。从谷歌的音频概览、Meta的智能眼镜,到特斯拉车内的对话式AI,削弱屏幕、强化音频与环境感知,正成为硅谷的共识。
那么,这场集体转向,究竟在押注什么?
从行动层面看,OpenAI对音频的投入已超越“功能优化”,成为自上而下的战略调整。
据报道,此工作由前Character.ai研究员Kundan Kumar引领,产品研究主管Ben Newhouse与ChatGPT产品经理Jackie Shannon深度参与,统一研究、产品与工程线,目标一致:为无屏设备打造实用音频“操作系统”。
据知情人士透露,该团队已研发出全新音频模型架构,在语音自然度、情感表达和回答准确性上有显著提升,并首次支持实时打断和双向对话——模型甚至能在用户未说完时作出回应。OpenAI计划在2026年第一季度发布此代音频模型,以弥补当前语音模型在速度和可靠性上的不足。
此技术布局,与OpenAI宏大的硬件愿景相呼应。
据《华尔街日报》披露的内部员工通话显示,Jony Ive与Sam Altman已为首款产品明确方向:非手机亦非眼镜,而是一款完全无屏的“第三核心设备”,可放入口袋或置于桌面与MacBook和iPhone共用。据悉,该硬件设备很可能是一支“AI笔”。
此设备强调对环境和用户情境的持续关注,而非依赖视觉界面。Altman测试Ive的原型后,称其为“世界上最酷科技产品”,并认为这笔交易或为公司带来1万亿美元的价值。目标是在2026年底前发货,并计划以更快速度达到1亿台销量。
总之,无论最终形态如何,OpenAI追求的不仅是新玩具,而是与智能手机比肩的“超级AI助手”。
仅看OpenAI的硬件计划,易将其视为激进实验。但放眼全局,这是更广泛的行业趋势。背后原因有三:
一、屏幕创新空间正缩小。过去十年,主流交互创新如多点触控、全面屏、手势操作已近极限。继续围绕屏幕改进,边际效应递减且成本上升。
二、注意力成最稀缺资源。用户“看屏幕时间”饱和。新增需持续注视的设备只会加剧竞争,而非创造新场景。
三、AI角色正转变。系统从“被调用工具”变为“持续协助智能体”,屏幕反成障碍。理想环境智能应在后台工作,必要时才出现。
在此背景下,音频重新获得重视。它无需视觉占用,无需学习复杂界面,更易融入日常生活。因此,OpenAI、谷歌、Meta、特斯拉正不约而同将“对话”视为下一代计算入口。
无屏并不简单,反而将复杂性集中在后台。
首先是“何时说话何时沉默”。轮次控制需解决语音活动检测、说话人识别、优雅打断及上下文理解。在嘈杂多人的真实环境中,一次误判即可能失去用户信任。
其次是始终在线的电力与算力压力。设备需依赖超低功耗传感器判断“是否需要唤醒”,而多模态推理在本地与云端间动态切换。这要求极端模型压缩、内存优化及对延迟的精细管理。
再者是隐私与感知范围的权衡。摄像头提供关键上下文但也放大侵入感。物理静音、遮挡机制及清晰可感知的权限控制几乎决定此类设备的长期接受度。
音频优先设备失败往往非“做不到”,而是不够稳健和克制。
OpenAI非首个尝试无屏AI的公司。此前,一批背景各异的初创公司也抱有同样信念但成效各异。
例如,Humane AI Pin开发团队在无屏可穿戴设备上烧掉数亿美元却成为行业反面教材:响应慢、续航差、价值模糊。市场证明,“概念正确”不等于“体验成立”。
不同在于,OpenAI握有两张关键牌:一是持续进化的大模型能力;二是Jony Ive对硬件形态与人机关系的长期思考。这给了OpenAI尝试无屏的底气:大模型提供智能与适应性;设计提供交互体验和行为规范。
然而真正考验不在发布当天而在日常使用中:
若答案为肯定则无屏非退化而是更深嵌入;若非则证明屏幕存在非偶然。
本文由主机测评网于2026-06-06发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260647510.html