当前位置:首页 > 科技资讯 > 正文

25美元手机变身智能体:OpenClaw的奇妙探索

想象一下,仅用25美元(约173元人民币),你能做些什么?或许只是买一顿外卖或充话费,但有一位热衷于AI的开发者Ethan,却用它打造了一个“物理世界可操作的智能体”。

Ethan在一台沃尔玛售价仅25-30美元的预付费安卓手机上,运行了当下热门的OpenClaw,使其通过Discord接收指令,直接控制手机硬件——从打开手电筒、拍照识别到读取传感器,甚至尝试拨打电话。这种操作听起来颇为不可思议。

25美元手机变身智能体:OpenClaw的奇妙探索 OpenClaw 智能体 硬件执行 手机集群 第1张

Ethan的创意不止于此,他计划打造一整排手机,形成一个Agent“手机集群”。

从聊天机器人到“能动”的Agent

Ethan的方案核心在于:在安卓手机上安装Termux(一个安卓类Linux终端环境),运行OpenClaw Agent,通过Termux API调用安卓系统能力,并通过Discord与Agent对话。这样,一部25美元的手机就成了一个随时在线的“硬件执行节点”。

例如,在Discord中发出指令:“Hey Claw,帮我打开再关闭手电筒。”几秒钟后,手机手电筒果然亮起又熄灭。

背后的流程并不复杂:OpenClaw接收Discord消息,调用Termux API,再由API调用安卓系统接口完成操作。原本只有App或系统进程能完成的事,现在由一个语言模型驱动的Agent实现了。

Ethan认为,真正有趣的不只是“开手电筒”,而是“模型开始拥有物理执行能力”。

拍照+GPT 5.2:入门机的视觉能力

为了证明这不是“玩具级Demo”,Ethan进行了更具象的测试。他对Agent说:“用后置摄像头拍一张照片,告诉我你看到了什么。”手机对准桌上的Raspberry Pi,拍照后画面通过Discord回传。图片被送入GPT 5.2模型进行视觉分析,模型描述道:“一块单板计算机Raspberry Pi,以及连接的USB线缆。”

这个任务实现了:低端安卓机负责采集图像,云端大模型负责视觉理解,Discord负责交互,Agent负责流程编排——一个完整的“感知—理解—反馈”闭环在25美元的硬件上成功运行。

不仅能感知手机姿态,还可以打电话

Ethan还测试了手机的传感器能力。他问:“现在手机的姿态是什么?”Agent调用加速度计数据,分析重力方向后回复:手机大致处于竖直直立状态。这表明Agent能读取真实物理状态。

至于打电话功能,理论上可行。Ethan让Agent在联系人列表里查找“Mike”并拨号,手机确实调起了拨号界面并尝试发起通话。不过由于这是没有实际绑定号码的预付费手机,通话自然失败。

未来畅想:搭建“手机集群”

目前不少开发者选择用Mac Mini或小型服务器跑Agent集群。而Ethan用低价手机跑OpenClaw的决定令人意外。他认为这种廉价预付费手机对想尝试OpenClaw但预算有限的开发者来说是个绝佳选择。

至于未来规划,Ethan想搭建一个“手机集群”,通过Discord同时与所有智能体交互,探索更多有趣功能。

社区质疑:手机集群真有用吗?

Ethan的视频发布后,评论区意见不一。有人觉得很酷但想不出实际用途;也有人脑洞大开提出安防系统或社交媒体点赞农场等创意。

无论如何,这种云端API+低端硬件的组合让更多开发者有机会参与AI实验。

你对Ethan的这项实验有何看法?欢迎留言讨论。

参考链接:https://www.reddit.com/r/AgentsOfAI/comments/1qybhk2/this_guy_installed_open...