当前位置:首页 > 科技资讯 > 正文

苹果Siri新升级:语音操控iPhone应用,挑战未来硬件交互

在自家AI团队核心成员被Meta吸纳后,苹果CEO库克也不得不站出来安抚员工,强调苹果要把握此次AI革命的机遇。他提到,苹果从来不是最早涉足新技术的公司,历史上有过很多例子,如Mac之前就有个人电脑,iPhone之前就有智能手机,iPad之前也有许多平板电脑,iPod之前也早已有MP3播放器。

苹果Siri新升级:语音操控iPhone应用,挑战未来硬件交互 苹果Siri 语音操控 跨应用 AI革命 第1张

开动员大会的效果立竿见影,这一点在太平洋两岸都同样适用。近日,据彭博社记者、苹果问题专家马克·古尔曼报道,苹果可能即将推出新版Siri语音控制功能,用户将能通过基于Apple Intelligence的个性化Siri,直接控制iPhone上的大部分应用。

具体来说,未来的Siri将拥有强大的跨应用语音控制能力,用户无需触碰屏幕即可完成操作,如发布社交媒体评论、浏览购物应用并将商品加入购物车、制订出行计划并预约Uber等。据悉,这项功能将通过App Intents接口实现,用户只需使用语音即可执行“在某应用中搜索某内容”等操作。

这也解释了为什么基于Apple Intelligence的个性化Siri会难产。毕竟,仅仅只是语音控制功能,它就要比现在的Siri有质的飞跃。

苹果Siri新升级:语音操控iPhone应用,挑战未来硬件交互 苹果Siri 语音操控 跨应用 AI革命 第2张

早在iOS 12上,苹果就为Siri增加了“快捷指令”功能,用户可以通过预设的个性化短语来让Siri驱动支持快捷指令的应用执行操作。然而,个性化Siri的AI语音控制与“快捷指令”有着本质的区别。后者只是通过预设指令实现自动化操作,进而简化应用的操作流程;前者则赋予了Siri等同于用户的权限,使其能够执行更复杂、更精细化的操作。

最重要的是,根据爆料,个性化Siri的语音操作无需提前预设指令,用户只需用正常对话的句式即可驱动。

无需提前预设指令无疑是用户体验层面的跃迁。这意味着可以实现即开即用,无需再在网络上搜索“最实用的快捷指令及设置方法”或“如何解决iOS设备快捷指令安装受限问题”等教程。只需直接对Siri讲出自己的需求即可。别看这只是小小的区别,但正是这一区别使得快捷指令从iOS 12至今一直不温不火——因为过于复杂导致大量用户并不会用。

苹果Siri新升级:语音操控iPhone应用,挑战未来硬件交互 苹果Siri 语音操控 跨应用 AI革命 第3张

毕竟,“傻瓜式操作”才是互联网产品火起来的基础。火遍全球的短视频操作逻辑就仅仅只是“滑动”而已。而苹果能够实现用户通过语音驱动个性化Siri的关键是iOS 16引入的开发者框架App Intents逐步成熟。

该框架将应用重新解耦为意图(Intent)、实体(Entity)和应用快捷指令这三个核心组件。例如,开发者需要定义应用意图(如“发送消息”)、实体(如联系人信息)和查询(如“查找特定照片”)。事实上模块化设计不只有苹果在推进谷歌也通过Android App Bundle实现了同一目的。将应用拆分成多个不同的模块不仅提高了开发效率和灵活性也方便了Siri理解不同应用可以实现哪些功能从而解决了跨应用的用户体验一致性这个难题。

苹果Siri新升级:语音操控iPhone应用,挑战未来硬件交互 苹果Siri 语音操控 跨应用 AI革命 第4张

这一点是目前国内手机厂商的AI功能还无法实现的。尽管在苹果的Apple Intelligence还只是PPT时国内手机厂商就已经做到了让用户可以通过手机AI一句话点咖啡、订机票但就在外界期待厂商通过OTA将AI能力扩展到其他场景时却没有了下文。

导致这一现象的关键在于跨应用和单个应用是两个截然不同的环境AI在面临调用多个应用时极易出现“上下文断裂”。要解决这一问题不仅需要不同的应用开发者参与还需要对系统底层实现跨应用数据共享而这恰恰是苹果在其生态中一手遮天的优势。

苹果Siri新升级:语音操控iPhone应用,挑战未来硬件交互 苹果Siri 语音操控 跨应用 AI革命 第5张

总而言之如果将目前Android手机上的AI视为一个个针对具体场景的特化智能体那么苹果的个性化Siri则更像是全能的通用智能体。据称除了健康、银行等敏感应用它能驱动几乎所有应用实现用户的需求。从某种意义上来说单看手机AI助手这个细分赛道苹果大概率就能凭此做到后来者居上。

除了解决iPhone的AI功能不足之外苹果在AI语音操控设备上的应用可能是在布局更大的战略或是在探索适配未来硬件的交互逻辑。

如今苹果要用桌面机器人、智能显示屏取代不温不火的HomePod几乎已经是板上钉钉的事情而这两者实现自然交互的最佳途径无疑就是语音。当Siri在iPhone上可以做到语音驱动不同应用自然也能在Apple Watch、iPad、Vision Pro、Mac以及桌面机器人上实现。用语音交互统一生态内不同硬件的体验对于苹果而言显然是个极具诱惑力的选择。

苹果Siri新升级:语音操控iPhone应用,挑战未来硬件交互 苹果Siri 语音操控 跨应用 AI革命 第6张

不过正如前文提到的那样让Siri调用不同应用能力的“跨应用”目前还是个挑战苹果追求一步到位的结果自然就是个性化Siri难产。当然在苹果AI业务处于落后状态的情况下“憋个大招”要远比立刻推出一个平庸的个性化Siri更能让用户接受。