当前位置:首页 > 科技资讯 > 正文

豆包手机助手:大模型时代的“类Siri”探索

电影《某种物质》中,伊丽莎白注射药剂分裂出克隆体苏,以求留住青春。

如今,科技巨头们,如百度、阿里、字节,也感受到了“衰老”的威胁,纷纷寻找自己的“苏”。

字节的“豆包”正在迅速扩展其领域,从AI助手到输入法,从TWS耳机到定制智能手机,无一不展现出其分裂的潜力。

12月第1天,字节发布了一款工程样机,搭载了豆包手机助手,基于努比亚手机M153。这款手机配备了高通骁龙8至尊版芯片、16GB内存+512GB存储,售价3499元。

豆包手机助手:大模型时代的“类Siri”探索 豆包手机助手 大模型 AI助手 生态化 第1张

骁龙8至尊版芯片搭载的新一代Hexagon NPU,不仅支持高效运行多模态生成式AI应用,还使多模态AI助手能够实现自动语音识别和大语言模型交互等功能。

虽然M153的基础配置在同期产品中并不突出,但这可能表明字节更注重体验功能而非参数性能。豆包助手的演示视频展示了其语音和侧边AI键两种唤醒方式,以及其在端侧部署中的多种技术能力。

值得一提的是,演示视频中还展示了旅行预订的完整流程,耗时8分多钟,展示了AI助手在跨平台操作中的能力。

互相克隆与排异反应

伊丽莎白需要苏来延续青春,豆包手机助手则拉开了与手机厂商“互为克隆体”的合作序幕。

豆包手机助手:大模型时代的“类Siri”探索 豆包手机助手 大模型 AI助手 生态化 第2张

为了拓展用户规模并寻找最佳落地形态,豆包尝试了多种途径,包括PC端、移动端等。然而,缺乏硬件载体使其容易陷入“轻量级外挂”的陷阱。

为此,字节推出了Ola Friend智能体耳机,但TWS耳机的形态限制了其计算与存储能力。因此,AI蓝牙耳机必须依赖外部设备接入云端大模型以输出AI功能。

从实际场景来看,AI耳机最核心的功能是利用声学信号处理与AI算法的融合,在语音交互层面实现从听到理解的跨越。因此,走向手机终端成为豆包的必经之路。

谁是苏,谁是伊丽莎白?

“在AI和游戏面前,手机性能永不过剩。”一位头部手机厂商高级副总裁曾这样表示。对于手机端侧AI部署的效能、散热等性能问题,各手机厂商仍在摸索中。

尽管不少手机厂商在过去一年中推出了自研AI助手,但大多未能实现结构性变化。而豆包与努比亚的合作则展示了AI助手在复杂场景下的实际应用能力。

豆包手机助手:大模型时代的“类Siri”探索 豆包手机助手 大模型 AI助手 生态化 第3张

OPPO是几家厂商中进步最快的一家,其收购波形智能并吸纳核心高管后,迅速建立起文本处理能力。然而,各厂商在个性化服务上的探索仍显不足。

大模型时代,硬件与软件的边界正在模糊。苹果与OpenAI的合作模式提供了一个范本:隐私部分在本地处理,算力推理部分在云端进行。

字节通过豆包AI助手走出了一条独特的道路,以“类Siri”模式部署到手机端。这不仅带动了合作方手机和耳机的销量,还重新定义了用户与手机功能之间的交互方式。

入口再定义

“豆包AI助手”正成为字节的战略重点。

在我们的印象中,豆包是一款AI应用而非Siri。今年,各类面向C端的AI助手层出不穷。然而,豆包从一开始就将语音视为重要输入方式,并几乎成为所有尝试中的核心功能。

豆包手机助手:大模型时代的“类Siri”探索 豆包手机助手 大模型 AI助手 生态化 第4张

某大厂AI应用团队表示,现在的AI产品各有特色,但豆包的语音打电话功能等创新使其与众不同。

在这场“入口之争”中,字节通过豆包手机助手直接杀入手机厂商腹地。其野心是让豆包成为手机厂商的标准化Siri,实现“所见即可问,所言即可为”。

尽管短期内可能面临挑战,但长远来看,处理好与安卓手机厂商之间的复杂生态关系将变得尤为重要。字节的战略正将这场入口之争推向一个更微妙、更关键的阶段。