当前位置:首页 > 科技资讯 > 正文

AI电商新风口:道放打造“赛博闺蜜”重塑供应链

文|邓咏仪

编辑|苏建勋

每一次踏入直播间,你的选择正悄然重塑商业版图。

如今,直播生态已趋成熟。直播间与社交媒体上的“达人”,实则是品牌的新门店,他们塑造的人设代表着受众群体、风格与定位。达人负责捕捉新一季的时尚元素,迅速出设计图、打样,国内工厂在短短半个月内即可完成生产和出货。

这套被称为“小单快返”的模式,已运行多年,催生了如SHEIN这样的跨境巨头,成为国内市场的新常态。

然而,在广阔的海外市场,电商基础设施参差不齐,物流、生产供给的短缺,以及多元化的用户群体,隐藏着大量被AI改造的潜力。

这是曾任淘宝直播业务的道放,离开阿里后,最想实现的目标。

他1983年出生,亲历移动互联网的所有风口——2008年毕业加入百度、360等公司担任算法专家;2013年加入阿里后,一待就是11年。他曾从零开始打造亿级用户的印度短视频平台VMate,负责过“点淘”APP,2021年开始统管淘宝直播业务。

“从达人的审美,到设计师的桌子,再到工厂到消费者手中,这个过程太长了,信息严重扭曲。”道放表示。

在电商尚不发达的其他市场,他希望建立一套完整的AI电商服务体系,桥接国内供应链和海外达人生态。

货随流量而动,也重塑了供应链生态。比如,传统服装供应链中,销售体系可能分为5到9级不等,商品流转周期长,加价倍率高。品牌需提前半年设计、打样、下单,导致传统女装爆款预测准确率较低,库存难题频发。

而在消费者端,由于大模型的发展,一对一服务成为可能。这成为道放创业新项目Infimate的起点:为每个人提供一对一专属的“赛博闺蜜”。

这个赛博闺蜜如同你的专属AI购物Agent,能理解时尚趋势、提供个性化穿搭建议。“会基于你的身材、肤色及当下流行趋势,为用户搭配并给出专业建议。”道放描述道。

最重要的是,“赛博闺蜜”要帮你简化购物流程:计算最佳优惠、抢券、省钱妙招监测及下单时机等。

Manus引领Agent浪潮后,道放觉得创业时机已成熟:模型能调用内部工具完成任务。这一切需建立在有深度的垂直领域数据与场景之上。

他以火爆的“Tiffany蓝”、“牛油果绿”等趋势为例。这些由KOL、达人营造风向并传导至更广泛的消费者。

“KOL在时尚领域‘造词’,打造并传播热门时尚元素。”道放认为,结合各类公域数据训练及用户主动告知的喜好,大模型已足够完成KOL的工作:捕捉、预测及表达时尚元素,给用户精准推荐。

同时,模型建立标签后,也能将能力提供给B端,服务品牌、达人等。场景多样包括爆款预测、生成及选品决策支持,最终构建AI电商服务体系。

但不可避免会涉及一个问题:道放想做的事看似都在大厂射程范围内。为何机会在创业公司手中?

“首先,我们定位海外。海外电商平台生态和格局更分散,平台垄断程度低。这更有利于大模型切入——为C端做个性化定制,用户更信任第三方Agent。”道放表示。

更重要的是,道放在大厂内部从零到一的创业经历让他深知大厂决策时需考虑既往业务及资源侧重——对于探索Agent这类新业务方向,创业公司有更多时间和空间。

事实上在离开阿里后道放曾在朋友圈宣布将在具身领域创业目标是“为机器人尽快进入千家万户贡献自己的一点力量”。

但他和核心伙伴摸索一圈后评估下来具身智能技术探索尚早期至少5-10年才有商业化飞跃“离消费者还有点远”。

为了更贴近消费者和市场道放选择暂缓具身方向探索将重点放到AI+电商上。

在淘宝11年掌管风口上的直播电商业务对道放影响深远——他语速极快你几乎无法找到提问的切口。

道放也和大厂高管形象不同。印象中大厂高管可能手握天价预算对宏大战略信手拈来但从道放的叙述中能感受到朴素的目标——找到贴近用户的场景迅速建立商业闭环养活团队。

这是从阿里离开后道放的首次公开表达。以下为我们和道放的对话经编辑整理:

AI电商新风口:道放打造“赛博闺蜜”重塑供应链 AI电商 赛博闺蜜 供应链重塑 跨境电商 第1张

△Infimate创始人程道放 图源:企业授权

想过做家庭机器人但也许太早了

《智能涌现》:你离开阿里后发的第一条朋友圈就说自己要做具身机器人现在要做AI电商这个想法是怎么演变的?
道放:我是去年7月左右阿里内部第一波GPT影响下来就在研究AI对具身机器人和电商领域的影响我一直呆到今年2月份才最终决定出来创业。
其实我出来后还是在同步推进这两个方向毕竟具身机器人和AI电商我们都深入研究了很多年我自己也是学计算机的。
《智能涌现》:当时想从什么方向切入?
道放:从2023年7月开始我还在阿里的时候已经同时在关注具身和电商的AI应用了。出来创业后我们把所有信息采集完当时想过从家庭机器人开始切入。
当时我们思考的是具身当前的瓶颈在于真实场景的操作数据所以从可行路径来看应该去切垂类场景。在垂类上面用现有的方法可以启动能开始干活进入场景之后就能获取更多的反馈和数据才能迅速迭代。
我们的目标还是希望做具身机器人但这个赛道现在处在一个技术发展的早期阶段特别是第三步的精细操作还需要很长时间的技术积累和突破。我们估算真正能做到家庭实用级别至少还需要5-10年。
《智能涌现》:调研完之后怎么看这个赛道的发展阶段?
道放:具身智能实际上涉及三个技术方向。
第一个技术方向是AI的多模态交互涉及到交互界面跟整个认知的理解这个其实是偏软件跟大模型同步发展的。它是豆包这类大模型APP的延伸豆包多模态交互主要是文字和语音但机器人除了语言之外还需要控制表情、眼神、语气、微动作等需要更多元的交互和控制。
第二个技术方向是基于强化学习的运动能力(Locomotion)主要解决双足行走以及全身控制。像唱歌跳舞、空翻都是在这一部分基础上做出来的。
最重要的是第三个方向端到端的模仿学习去做手的操作。手的操作才会真正意义上替代人。
在现有技术进展上前两部分进展还比较好尤其是强化学习的运动能力。我们见到的所有空翻、马拉松跑步全部都是这个技术的发展结果但是这些展示的机器人很多都还需要遥控器控制的。
要做到自主操作就需要第一步的多模态交互能力包括表情微动作语音这部分还有规划层。第二步强化学习这部分也还好。
《智能涌现》:现在前两步应该都做得不错了。
道放:现在所有人面临的难点是第三步的精细操作因为它是接触式的精细动作要到毫米级的精度需要触觉和力的反馈信息而且需要通用性才能进入家庭所以很难。
我在阿里时调研完后得出结论具身机器人的发展途径应该是切垂类在垂类上用现有方法做启动虽然准确度不够好但通过不断给数据处理各种Corner Case(罕见案例)后会做得越来越好。
问题就是Corner Case(罕见案例)获取也是很难的现在的高质量数据非常缺。我调研一圈下来大家公认的还是做端到端模型是最优雅的方案但这里需要的起码是十亿级别的数据现在瓶颈还是很明显。
《智能涌现》:除了数据还有其他难点吗?
道放:首先是精度和力控的问题。手部操作需要毫米级的精度而且要有力的反馈。比如你拿一个鸡蛋力度大了会捏碎力度小了会掉这需要非常精确的力控。现在的机器人手很难做到人手那种精细的触觉反馈和力度控制。
其次是通用性的挑战。不像工业机器人只需要做固定的几个动作家庭机器人需要处理各种不同的物体、不同的环境、不同的任务。今天可能要叠衣服明天要洗碗后天要整理书架每一个任务的动作空间和要求都完全不同。
第三是数据收集的问题。Imitation Learning(模仿学习)需要大量高质量示范数据但收集人类精细操作的数据非常困难和昂贵。不像图像识别可以从网上爬数据手部操作的数据需要专门录制而且要保证动作的准确性。
Corner Case(罕见案例)太多了。真实环境下的变化太多了物体的材质、形状、重量、摆放位置都不一样很难通过有限的训练数据覆盖所有情况。
所以虽然前两步技术相对成熟但第三步的精细操作是真正决定机器人能否实用化的关键也是最难攻克的。
《智能涌现》:这意味着落地场景很受限?
道放:现在存在明显的技术能力与市场需求之间会有一些错配我们是想做“有用”比“有趣”多一点的场景的。
但用户真正需要的那些精细操作功能比如帮你处理日常家务、分拣物品之类的任务技术上还远远不成熟;现在的机器人用得更多的还是简单的迎宾互动、表演之类的离真正打工还很远。
当然不是说它没有价值只是我们需要正视这个现实同时也理解为什么消费级机器人市场推进得相对缓慢。技术发展需要时间而市场也需要找到那个平衡点。
《智能涌现》:所以是因为技术曲线发展还相对早期才选择考虑别的方向?
道放:在具身的第三阶段就是真正能够自主规划操作的部分大家公认的终局是要建立端到端的模型。但现在的真正问题在于这个端到端的数据驱动目前大家用的模仿学习方法最大的问题就是通用性很差要做出超出预期的体验感很难。
我们想做的还是让机器人能走进千家万户真正能干活。
我们预计这个方向需要等待一些通用性、“大单品”出现我们团队擅长的部分才比较能发挥出更大的能量——做产品、做商业化。