当前位置:首页 > 科技资讯 > 正文

苹果Q.ai收购案:AI技术重塑人机交互

近日,苹果公司以近20亿美元的价格收购了Q.ai,这笔交易成为苹果迄今为止第二大的收购案,仅次于2014年以30亿美元收购Beats的交易。

Q.ai利用AI技术,使得设备能够在嘈杂环境中识别人类的低声交谈。此外,它还有一项独特的技术,即检测面部肌肉的细微活动。这两项技术都具备革新智能可穿戴设备交互方式的潜力。

在被苹果收购之前,Q.ai于2022年获得了Google Ventures(GV)和Aleph领投的种子轮融资,并在2023年获得了GV、Kleiner Perkins、Spark Capital参投的A轮融资,总融资额达到数千万美元。Matter Venture Partners和Corner Ventures也位列其投资人名单。

感知交互:让AI硬件融入日常生活

收购后,Q.ai的核心团队将加入苹果,其中包括Aviad Maizels(CEO)以及联合创始人Yonatan Wexler和Avi Barliya。

这是Aviad Maizels第二次向苹果出售公司。2013年,他联合创立的3D传感技术公司PrimeSense被苹果收购。该公司的技术最初应用于Xbox Kinect,后来被苹果转化为支撑iPhone FaceID的核心技术。

苹果Q.ai收购案:AI技术重塑人机交互 苹果收购 Q.ai AI技术 人机交互 第1张

Q.ai核心团队部分成员与Spark Capital投资人Nabeel Hyatt合影,图片来源:Nabeel Hyatt

在Q.ai的核心团队中,Yonatan Wexler是马尔奖(计算机视觉领域的最高荣誉)获得者。他的成果OrCam MyEye 2(帮助视障人士“看”到文字和识别物体)曾获《时代周刊》“年度最佳发明”。Avi Barliya是一位曾参与从自动驾驶系统到SpaceIL月球探测器研发的连续创业者。

几周前,一家名为Lyte的公司获得了1.07亿美元的早期融资。Lyte由Alexander Shpunt、Arman Hajati和Yuval Gerson共同创立。Alexander Shpunt曾联合创立PrimeSense并担任CTO。

Lyte专注于软硬件结合的端到端视觉感知系统,为物理AI提供一个连接智能层的感知层。让机器人的“眼睛”与“大脑”直接对话。

而Q.ai的愿景与PrimeSense时期的思路似乎一脉相承。

无论是Xbox Kinect还是iPhone FaceID,本质上都是基于感知的交互。

Kinect通过视觉感知实现体感/手势交互,而FaceID则通过视觉感知实现解锁和支付认证等功能。

Q.ai目前公布的技术有两项:一是利用AI使设备在嘈杂环境中识别人类的低声交谈;二是检测和识别面部肌肉的细微活动来检测口型或语音,进而识别用户身份并评估其情绪、心率及呼吸频率等生理指标。这两项技术都属于感知技术的范畴。

这两项感知技术如何应用于交互上?我们推测可能是耳语识别与唇语识别相结合。目前AI原生硬件的交互方式以按键+语音为主,但相比传统的纯触摸屏,语音交互需要清晰的发声。在一些场合中会出现“社交羞耻”,让用户在与设备交互时有顾虑。

苹果一直非常重视交互和用户界面设计,是打造“隐形界面”的大师。它们希望技术能够成为用户自身的自然延伸。

加入苹果后,Q.ai的技术有望触达数十亿用户并从根本上重塑人与机器之间以及人与人之间的交互方式。这让人好奇当AI硬件最终“消融”于我们的日常生活时将会是怎样一种体验?

交互界面的进化:提高人机交互的“带宽”

个人计算设备的发展和普及是算力、智能(功能)、体积、交互界面等因素联合推动的结果。

在摩尔定律的推动下,设备在单位体积和成本下的算力不断增强。这推动了个人计算设备从PC到手机不断变小。并且,在算力的支持下个人计算设备的功能也越来越丰富。

在交互界面上它的进化是一个阻力不断变小门槛不断降低的过程。

最初个人计算机的交互界面是命令行(CLI),用户主要集中在开发者和计算机爱好者这个小群体。

之后GUI和鼠标键盘被引入PC使得精确的文字编辑和表格制作成为可能这让各行业的专业人士得以使用PC并随着之后用户的进一步增长推动了互联网的普及。

iPhone的横空出世带来了多点触控的交互方式这让个人计算设备的普及率进一步提高开始出现用户量达到十亿级别的超级应用。

交互界面的阻力变小为什么会带来门槛的降低?本质上它是提高了人机交互的“带宽”。从命令行到GUI再到多点触控人们在操作时“想”得越来越少操作起来越来越直观。

在AI时代智能可穿戴设备出现人和机器的关系开始出现转变。以往是人去精确的操控机器现在机器将学会理解人类。

在人与智能可穿戴设备交互时什么方式是目前最普遍的?是多模态交互。所谓多模态交互既包括语音也包括一些手势之类。总之它是基于感知的交互。

这种基于感知的交互是主动的、直接的捕捉并解析人类的思维活动有望建立迄今为止带宽最高的人机接口也有潜力弥合人类思维与机器交互之间的鸿沟。

现阶段对于智能可穿戴设备智能有AI模型不断地发展之前智能手机打下的基础在体积(通常与续航和端侧算力相关)上也已经初步找到路径如果交互方式在未来收敛形成与多点触控一样的默认交互方式。那么AI与物理世界交织迸发出的能量将是巨大的。AI智能硬件在未来的普及率很可能不会低于智能手机。