当前位置:首页 > 科技资讯 > 正文

AR眼镜与AI融合:行业挑战与机遇展望

从悲观到乐观的转变

近期,AI与AR眼镜市场愈发活跃,先是拥有核心科技的JBD获得巨额融资,再有华南某企业拿下行业年度最大单笔融资(金额未公开),这预示行业回暖,令人为AR创业公司感到欣慰。

作为曾在行业内两家标杆公司工作的业余评论者,我深知消费级AR技术不成熟且实践艰难。

两年前,核心微显示屏和光机占据BOM成本一半,但色彩和亮度始终无法满足需求;近眼显示光学方案复杂且未达成共识,量产一致性和良品率低下,这些高昂成本导致终端产品只有薄弱场景和有限的信息提示功能

消费级AR并非真AR。要同时满足“消费级”和“AR”,那只能是虚假的

以苹果为例,Video-See Through方案即便强大也面临挑战,无论光学模组、传感器、算法、算力如何进步,本质上人类需适应“通过摄像头望远镜式”观察世界,这似乎等待智人进化,Apple Vision Pro在消费市场前景不明。

AR眼镜与AI融合:行业挑战与机遇展望 AR眼镜 人工智能 光波导技术 消费电子 第1张

图为 Apple Vision Pro的定制光学模组

Optic-See Through方案及部分透光的BirdBath方案更易被消费者接受,但完整AR需头盔形态,只能面向企业而非消费市场。中国AR四小龙缺乏虚实交互的消费级AR算什么AR,且应用几乎空白,产品易闲置,无复购和稳定换机只能依赖“打新”。以BirdBath和光波导方案为代表的消费级AR处于早期边缘市场,企业靠大力营销获取融资生存

AR眼镜与AI融合:行业挑战与机遇展望 AR眼镜 人工智能 光波导技术 消费电子 第2张

图为 INMO Air 2

2022年底ChatGPT-3.5全球走红,在看似无关的消费级AR领域引发完美风暴。LLM技术演进不仅是该品类关键变量,还极大丰富产品组合、场景和功能,而且在国内外巨头眼中,高透光、可日常佩戴的AR眼镜是LLM落地的最佳硬件形式

理论上,接入云端大模型API,实时处理语音、文字、图片和视频流,眼镜能在多模态层面理解世界和用户偏好,如海外科技博客The Verge编辑所言:我仿佛托尼·斯塔克(钢铁侠),Gemini(谷歌大模型)则是我的J.A.R.V.I.S.。

大语言模型和生成扩散模型正全球竞速。端到端训练的高阶智能体、能识别屏幕元素并执行多步骤任务的GUI Agent,在应用端潜力巨大。今年强化学习后训练引入思维链扩展新Scaling范式,更进一步,能理解物理现实、预测并生成3D内容的世界模型,想象空间无限。单绿色窄视场光波导“无用”眼镜,也能进化为AI+AR的下一代消费电子。

作为随心调用的第二大脑,超越“头戴计算机”范畴,对现实世界实时视觉增强,理论上科幻场景将随大模型进步触手可及。实现长程推理、统一多模态信息流处理的GUI Agent,可能催生新技术路径,大幅简化AR所需的定位、建图、渲染过程,推理算力在云端,传感器和基础人机交互在终端,创新空间和产品自由度骤然扩大。

技术进步推动功能和场景扩展,降低原有功能实现复杂度和成本。这是典型技术革新创造新品類、新需求的过程。

「危」与「机」并存的中国AR四小龙

不同于武侠角色,中国消费级AR四小龙恰巧分布东西南北。原北方公司获上海投资迁往东方,另一家深圳公司移师成都。

面对AI+AR下一代消费电子诱惑,国外Meta、谷歌、微软、苹果持续多年研发,并购关键技术公司,积累深厚专利,准备在市场爆发时亮出杀手锏。

Meta的Ray-Ban堪称妙招,仅凭音频和AI优化就引爆市场。Meta还发挥财力,Orion以碳化硅为波导基底将视场扩至70°,这在轻量光波导眼镜中前所未有,Orion波导Layout扩瞳方案令人着迷,三片合色Micro LED全彩色光引擎亮度尚可,关键镜片前向漏光减少且波导片“视觉隐藏”,在阵列光波导上实现此点非同寻常,日常佩戴看不出是AR眼镜。

AR眼镜与AI融合:行业挑战与机遇展望 AR眼镜 人工智能 光波导技术 消费电子 第3张

图为 Meta Orion详解

Meta先以Orion树立高端典范,Ray-Ban Display再精准配置切入、接力,当Meta一手握Orion,一手推进LLaMa(未来或转闭源),软硬整合AI和AR同时发力不容小觑,若以下一个苹果预期看,少有人注意Meta股价现处低位。

后知后觉的媒体和用户是否察觉,消费级AR的iPhone时刻或许已到来。

国内,字节、阿里、腾讯、百度甚至华为都开始重视AI眼镜,此外,还有一家擅长企业沟通、高薪挖人的网红公司,它隐于暗处观察,特别善用指数级品牌声量快速起量,再借此在供应链议价实现极致性价比。

当巨头降临,再有清道夫下场清理,对于昔日AR四小龙,严峻市场考验不远。四小龙的尴尬在于,他们可能正为大厂产品做MVP验证。

深圳公司双线并行,X系列与Meta Orion同源的RGB三片Micro LED合色光引擎,但更早更激进,搭配单片全彩光波导显示,这是风险高、少人尝试的方案,经2年多迭代,行业量产独此一家,售价近万元。虽光引擎核心来自供应链,但量产中努力,包括设备定制、与应用材料公司推进刻蚀工艺、改进SRG光波导显示Layout,值得敬佩。

但另一产品线BB方案(BirdBath)Air系列动作值得商榷,在细小镜腿雕琢麦克风真明智吗?空间限制麦克风鼓膜面积音效天花板低,强调私密观影用户更倾向蓝牙耳机。新加画质芯片效果未知,但感觉噱头大于实用,在镜片模组引入更前沿创新方案,优化光学设计和人机工学平衡对用户价值更直观,而视场大小、虚拟屏尺寸参数易误导用户。

杭州公司虽有流言,创始人Misa极具极客气场。最新光波导眼镜仍单绿色,光舟一拖二光引擎有效降本,较之前双目方案光线准直耦入难度降低,波导Layout后期调整减少前向漏光,可直接贴合近视镜片,努力使眼镜形态正常。

另一产品线BirdBath中规中矩,整机质感佳,外观和结构设计有消费级独创,细节注重用户体验,无大毛病。但供应链提供的近视调节功能略显理想,近视用户多伴散光,散光未矫正仍需夹近视镜片。

有限接触中,Misa行事磊落,小动作少,重视用户反馈,在产品迭代、量产和成本间平衡,早见硬件局限而布局系统和软件生态,具前瞻性。

但产品仍不够“硬”,不够激进和终极,供应链方案“原创”深度有限,虽重工业设计、细节打磨、系统和软件生态,但需“硬件概念机”引发外界讨论,拓展企业想象空间。在高度不确定、高风险行业,做老实人风险最大。

上海公司老板孤傲,但BirdBath眼镜确实最佳,持续改进光引擎和配套模组,技术储备深,谷歌选其OEM合作不单为营销。新品X-prism借鉴Apple Vision Pro定制多层Pancake透镜灵感——超薄光学模组短折反射光路,可能多一片折返镜片(不确定)设计增折射光路,既减模组厚度又扩视场,并继续抑制镜片底部杂散光。

但上海公司仅一条产品线,行业看BB方案显为过渡,边缘市场定位难突破,强调主机显示分离的分体式,自研芯片,实现3DoF或6DoF稳定可用,但BirdBath+AR剑走偏锋,不做高透光光波导方案,意味市场不进则退。

成都公司较莽,老板江湖气和执行力强,曾INMO Air 2敢为先,近期产品无深印象。

四小龙尝试不同硬件方案,测试产品路线,此过程跑通供应链,获量产沉淀,以用户反馈迭代产品。风险自担。

但机海中四小龙仅暂有名声,后来者岂不可像素级复制,有何真正不可抄之处?

行业基石仍是JBD的Micro LED或视涯多层Micro OLED微显示屏,以及光引擎、光学模组、波导镜片公司,更底层晶圆、刻蚀、光学设计和材料公司。定制算法DSA或SoC芯片,端侧或云侧大模型门槛高,小创业公司难触及,真正产品护城河难挖。

如果对硬件深度有足够认知,积累设计制造、工程化、大规模量产know-how后,更懂算法、软件、系统、软硬一体模式的高维。

英伟达靠极致GPU架构设计和工程化成为AI时代第一吗?不,源于十几年科研一线观察算法,开发算子,以CUDA驱动GPGPU,架构通用且底层数据流计算高效,将复杂逻辑控制和流水线调度及对应硬件微架构留己,把高效低门槛算法开发留给编码者和模型开发者。

苹果靠极致产品体验和硬件性能统治智能手机时代吗?它靠iOS生态和扩张应用与硬件深度耦合,无法分离,并在出货量增长中逐步自研SoC,尝试攻克Micro LED屏、统一内存、自研基带。

个人浅见:无论消费级AR或AI眼镜,未来或渐成软件生意,生态竞争。砸钱做产品不如做系统,深耕供应链和关键组件不如软硬一体,有策略、有节奏地将触角伸向芯片、传感和显示核心技术。

创业本质是找寻未挖掘PMF,在众多组合和精心结构中找让用户舒适、上瘾机制。

找到PMF后,还需阻挡后来者和跨界巨头,它们堆资金、人才、供应链资源也无法复制的独特产品体验,用杀手应用滚雪球,用户越多网络效应越强,迫余者进入封闭体系。品牌心智锚定自由,市场竞争残酷,垄断才是最好生意。

黄铮一语值得细品:随时间流逝、对加深生意护城河有利的常是“资产”,时间越久对己越不利的可视为费用。

软件胜硬件,算法超商法,无法复制的软硬件封闭体系打造的品牌溢价,高于无尽性价比。

结语

消费级AR技术基本达门槛,供应链渐成熟,市场渐开,风险投资充裕。

最关键,它是AI最佳硬件落地范式,万亿级大模型投资和算力市场,稍洒点水,蝴蝶振翅,AI眼镜飓风可扫全球。

作为科技媒体出身的硬件爱好者,在互联网大厂和硬科技创业公司漂泊十余年的野生作者,看消费级AR极似2006-2010年智能手机启蒙期

千里之行始于足下,热爱能破万难。但战术勤奋掩不了战略懒惰。