当前位置:首页 > 科技资讯 > 正文

豆包2.0:超能创意与AI办公桌面,字节AI转型的核心

在超能创意1.0成功推出仅两个月后,豆包开始逐步灰度测试其升级版本——超能创意2.0。

2.0版本显著优化了模糊意图的处理能力,不仅能够深入解析图片细节,还能通过一句话实现图片的精准复刻,更厉害的是,它能够将不同参考图的灵感元素巧妙融合,生成全新的图片。甚至,你只需给豆包一组人物图片,它就能利用这些人物元素生成一个生动的绘本故事。

豆包2.0:超能创意与AI办公桌面,字节AI转型的核心 豆包 超能创意 AI办公桌面 字节AI 第1张

豆包超能创意2.0不仅限于图片处理,它还具备视频解析能力,支持用户上传视频或视频链接来提取逐字稿,或者拆解上传内容的分镜、脚本和剪辑手法。从展示效果来看,豆包能够轻松完成逐字稿的提取,但在拆解剪辑手法方面还有待提升。

与超能创意1.0相比,超能创意2.0在能力上有了质的飞跃,这得益于豆包大模型1.6版本的支持。该版本支持深度思考、多模态理解和复杂Agent的构建。此外,豆包超能创意2.0还接入了图片生成模型seedream 3.0、图片编辑模型seededit 3.0以及视频生成模型seedance 1.0 Pro。

过去几个月,豆包不断推出新的能力更新。除了超能创意外,还有AI播客、应用创造1.0以及视频通话等能力。除了视频通话是与图片生成、音乐生成等基础能力拓展相关外,其他几项能力都属于在基础能力上拓展出的场景化Agent,相比基础能力有了更多产品化的优化。

豆包2.0:超能创意与AI办公桌面,字节AI转型的核心 豆包 超能创意 AI办公桌面 字节AI 第2张

这类Agent能力的增加,使得豆包变得更加实用。豆包正在从最初主打社交的聊天机器人,逐渐演变成一个“AI助理+AI办公桌面”的组合。AI助理能实现更随身、更人性化的交流沟通,而AI办公桌面则更强调复杂需求的实现。

根据这个逻辑,就不难理解为什么豆包App和豆包电脑版会给人两种不同的使用感受。豆包App是许多用户心中的AI伙伴,可以聊天、整蛊朋友,而豆包电脑版则扮演效率工具的角色。

同一个豆包具备了生活和工作两种形态,并可以在两种形态中无缝切换。背后作为支撑的,是字节搭建起来的越来越明确的AI体系。这个体系的基础是火山引擎提供的云设施;在此之上一层是不断进化的豆包大模型;再上一层是作为“AI助理+AI办公桌面”的豆包应用;再上一层是抖音、耳机、眼镜等载体。

在这个体系下,豆包应用发挥了承上启下的作用。它不仅能快速将豆包大模型的能力应用化、场景化,还成为字节对外输出to C的AI能力的核心枢纽。

这就是为什么我们认为字节是国内诸多AI厂商中展现出更强野心和更完整思考的一家。

...(以下部分省略)