在当今数字化时代,许多人从事的职业或许并不属于传统意义上的真正工作。
这一引人深思的观点出自萨姆·奥特曼与Rowan Cheung的最新专访。
在这段长达30分钟的对话中,除了对AI与职业变革的深入思考,奥特曼还分享了GPT-6的开发进展、ChatGPT是否会演进为美国版微信、对AGI设想的演变、AI未来交互模式的展望,以及自己被恶搞成Sora热门梗图的感受。
可以说,此次交流涵盖了从娱乐话题到尖端科技的多维视角,既富有趣味性,也深刻揭示了未来趋势。
经整理优化的访谈全文如下:
(注:为提升阅读流畅度,对部分语气词与过渡内容进行了调整)
Q: Dev Day2025中所有发布内容——最令您振奋的部分是什么?
Sam Altman:我对所有发布都感到兴奋。将应用整合进ChatGPT的功能,实际上是我长期期待的方向。
但更让我激动的是听到用户分享他们使用Agent Builder创建的各种工具。无论是Agent Builder还是Agent Kit,都包含许多我渴望亲自体验的功能。如果必须选择一项,我认为在ChatGPT中直接运行应用将是最具变革性的。
Rowan Cheung:每周活跃用户达8亿的ChatGPT已成为新兴分发平台。开发者和创业者应如何利用Apps SDK在ChatGPT上构建应用?
Sam Altman:我认为我们需要经过多次迭代,才能明确用户主要如何使用这些功能。例如,用户会更倾向于根据应用名称调用它们,还是希望ChatGPT能主动推荐常用应用?
我预期开发者将探索出一种新的分发机制,使应用能更自然地融入使用场景。这类创新往往如此:只有当产品真正面向市场后,才能被各种意想不到的应用方式所惊喜。
Rowan Cheung:我记得你们也发布了文档指导开发者如何提升被推荐概率?
Sam Altman:是的,但需附加免责声明。新产品迭代迅速,我们将在实践中共同学习优化。
Rowan Cheung:回顾两年前的首次Dev Day,你们推出了GPT Builder,当时反响热烈。我也是最早公开构建GPT的用户之一。从那时至今,Agent Builder取得了哪些关键突破?
Sam Altman:最显著的进步是模型能力的大幅提升。相比首次Dev Day,当前模型在22至23个月内取得了惊人进展。同时,我们深入了解了用户构建Agent的需求——他们不仅希望在ChatGPT上开发,还期待在其他平台部署。最令我印象深刻的是,现在用户可以轻松构建复杂系统:通过可视化界面、上传文件、授权数据源访问、描述需求,几分钟内即可完成部署。我昨天首次完整观看演示流程时,深感震撼。借助Codex、Agent Kit等工具快速开发高质量软件,这种体验犹如经历了一次技术革命。
Rowan Cheung:现在Agent Builder是否已实现零代码构建agent?
Sam Altman:是的,但若具备编程知识,用户能实现更复杂功能。即使是普通知识工作者,也可开始构建agent。这几乎可称为Agent领域的零代码革命。
Rowan Cheung:这对下一代创业者或开发者意味着什么?
Sam Altman:这是我持续思考的问题。昨天观看Romain演示时,我想到——若在一年前实现类似功能需耗时多久?而现在几乎可实时完成,我的创意速度甚至跟不上工具效率。我不完全确定具体变革,但可以肯定的是:全球软件编写数量将大幅增长,测试与优化创意所需时间将急剧缩短。用户可以尝试更多想法,更快筛选出优质方案,但更深层的影响仍有待探索。
Q:首家用Agent自主运营的十亿美元公司何时会出现?Agent Builder是否已具备这种自主能力?
Sam Altman:尚未实现。我们曾有小规模预测池,猜测首家人运营的十亿美元公司出现时间。虽未正式设立,但已有许多推测——例如首家零人员公司。
Rowan Cheung:几个月或几年内?
Sam Altman:我预计需几年时间。但如今我们已能可信地讨论——向聊天机器人输入指令即可运行系统。这本身已非常不可思议。
Rowan Cheung:然而现有agent产品仍需要大量人工监督与反馈。何时能实现agent连续一周无需反馈自主工作?
Sam Altman:我认为Codex距离完成一周任务已不遥远。虽不一定在2025年实现,但当前我与一些用户交流时,他们表示——它已能处理全天任务,速度超乎预期。我很少因AI进步感到困惑,但观察Codex完成任务的时间延长趋势,这次确实让我震撼。可以预见,处理周级任务也将很快成为现实。
Rowan Cheung:技术瓶颈主要有哪些?
Sam Altman:更智能的模型、更长的上下文处理能力、更优的记忆系统。
Rowan Cheung:假设将20岁从斯坦福退学的年轻人带到当前时代,并赋予他您现有知识,您会建议他构建什么?避免构建什么?
Sam Altman:我近期也在思考此问题。我非常羡慕当前20岁的退学生群体,因为可构建的领域极其广阔,机会空间巨大。过去几年我几乎未拥有完整心智空间深入思考个人项目。但我知道,许多创新方向值得探索。近期与大家交流这些项目,确实令人振奋。
Rowan Cheung:我最近持续思考此问题,推测其他开发者也在探索——当前可实施项目过多。在构建产品时,您是否有建议,例如如何通过独特优势保持领先?是通过分发渠道、数据积累还是工作流模式?
Sam Altman:在抽象层面回答此问题较困难,因为最佳独特优势本质上是独有的——必须自行探索。OpenAI花费大量精力才找到自身优势。通常,此问题无通用答案。
最有效的答案,是找到仅适合您所做事项、产品技术、市场定位与时机的那种优势。这常是创造新价值的核心部分。
我能分享的一条通用经验是——在行动中探索。有一句我钟爱的商业名言:让战术驱动战略。您可以从实施有效方案开始,令人惊讶的是,过程中常自然浮现可发展为战略的元素。
若当年问我,启动ChatGPT时哪些优势将持久,我会说完全未知。我可能有某些猜测,但不会自信。后来证明,记忆功能成为关键竞争优势,也是用户持续使用ChatGPT的原因。当时我们完全未预料此点。您开始构建功能,随后自然发现这或许能成为持久优势。
Q:在GPT-6开发中,您认为应建立哪些优势?或构建产品时应考虑什么?
Sam Altman:这正是需自行探索的部分。我很乐意有机会共同头脑风暴,这将很有趣。但坦诚说,OpenAI占据我几乎全部思考,我未有机会认真考虑创办新公司,这略显遗憾。AI改变世界许多方面,但构建公司优势的基本要素未变。例如网络效应、品牌与营销优势、用户数据及市场效应。若列举近年有效方式,清单大致相似,但可能出现新战术来建立这些优势。
Rowan Cheung:近期你们推出了GDPval基准,用于评估AI模型在主要知识工作岗位中实际经济任务的表现。令我惊讶的是,GPT-5排名第二,仅次于Claude的Opus模型。你们仍发布此结果,非常值得赞赏,您如何看待此结果?
Sam Altman:首先,若我们不愿发布模型排名第二的结果,那将很糟糕。总有些事情我们做得最好,也有些不如他人。建立持续进步文化的方式是——愉快且直接地承认,在某些基准或评估中,他人表现更优。我认为Claude团队在理解企业用例与优雅呈现输出方面做得非常出色,因此我毫不意外,反而受激励追求更好。
Rowan Cheung:此基准会影响你们构建GPT-6的方式吗?
Sam Altman:会影响部分后训练方式,但GPT-6的整体策略不会改变。
Q:您对AGI的定义是——当它在多数经济价值最高的工作上超越人类时。基于GDPval评分,何时我们会达到AGI?
Sam Altman:我持续思考此问题。首先,如同许多人,我对AGI有多个定义。越接近它,概念越模糊。但我最关注且惊喜的是,我们终于迎来开端——即AI能进行新颖发现、扩展人类知识总量时。当前成就仍较小,我避免夸大。
但您可在Twitter看到许多案例,各学科科学家表示AI做出小发现、提出新方法或解决特定问题。再次强调,我既不想夸大也不低估。这才是真正重要之事。我们正处于此开端,并乐观认为未来几月或几年能大力推进,这是重大进展。这可能是我最关心的AGI指标。
Rowan Cheung:是否有特别让您兴奋的科学突破,希望AI去解决或发现?
Sam Altman:当然,如治愈疾病、发现新物理规律,那将很棒。但即使当前小事,如数学进展,也让我觉得重要。当GPT-4推出时,我有此感觉。我知道图灵测试存在争议,但公众曾视其为遥不可及,一旦AI通过,社会基本未更新认知。大众兴奋两周后,便开始抱怨AI不够快或无效,要求改进。这也体现人类伟大——那项被视为AI永恒测试的标准悄然过去,我们均已适应。我感觉类似情况将再现——我们将逐渐习惯AI进行科学发现。
Rowan Cheung:近期斯坦福进行一项workslop研究。此词描述低回报AI输出——表面完美,实际因返工增加额外工作量。
研究调查千余名办公室职员,显示41%的人过去一月曾遇同事产生的workslop,即同事使用AI生成内容需自行花费时间修改或清理。平均每次清理耗时1小时56分钟,每位员工每月因此损失约186美元。
若AI能像在场许多人一样将某些人效率提升10倍,则需系统教育与培训,让大家明白何时使用AI,何时避免。
Sam Altman:首先,许多人类自身也产生类似workslop,这不是AI独有现象。例如,某些邮件仅增加额外工作,或会议可能拖累效率。因此不必期待AI不同。经济将自我调整,利用工具提升效率的人与公司,将比用工具拖慢组织者更影响未来。当然,如同使用任何新工具,会有学习曲线,但我认为适应速度将很快。
Rowan Cheung:OpenAI是否提供教育或培训,帮助人们更好学习与使用AI?
Sam Altman:有的。人们总会用工具实现自身目标。我学到的一点是,您可以制作优秀教育内容与培训,但用户会尝试各种奇特用法,如让AI模仿鹦鹉等。但我们确实创建大量内容,帮助用户在工作流中应用AI。在Codex某些场景中,采用速度极快,整个公司集成与高效使用仅需数天或数周。
Q:Sora上充满恶搞您的视频,您是否感到担忧?
Sam Altman:实际不如想象中奇怪。观看少量或许有趣,但上百个后便觉平常。
当时团队问我,是否开放我的cameo功能?这是新技术,我认为若自己不尝试,便是失误,因此决定实施。随后乘机时,我思考是否显得怪异,上线初期确实有些,但很快适应——显然这是充满生成视频的应用,内容很有趣。
Rowan Cheung:我唯一担忧是去水印问题。今早几家公司推出Sora水印去除工具。若他人去除水印并在社交媒体发布,会影响个人品牌吗?这是何种机制?
Sam Altman:首先,我们发布此类技术的原因之一,是看到它终将普及。未来几月或几年,会有优秀开源模型,任何人都能用公开视频生成您的影像。社会最终会适应。我们发现,一种方式是提前发布并设置护栏,让社会与技术有时间共同进化。
此方法有效。文本相对简单,视频更难,因视频冲击力更强,但我相信我们将学会适应。很快大家会意识到,网络将出现大量无水印、开源模型生成的假视频,这不可避免。提前让社会适应此点,可能具有价值。
Rowan Cheung:Sora目标是生成几乎无法辨别的AI视频?
Sam Altman:目标是AGI。我认为高质量视频对实现AGI很重要,原因很多,如空间推理、从世界模型学习的内容。希望有一天,机器人领域真正进展也将非常重要。但优秀视频是好事——我不希望未来唯一交互界面仅是文字。我非常期待未来实现实时视频流交互体验,它能持续生成全新用户体验。这将很棒。但最重要的是,我认为这是通向真正AGI的宝贵路径。
Rowan Cheung:周五,您发布博客提及可能探索对允许在Cameo中使用自身面孔者进行收入分成。能分享细节吗?如何运作?
Sam Altman:是的,通常发布新产品时,会发现用户使用方式与预期不同。我们原以为少量创作者会制作酷炫复杂视频并分享,大量观众观看。确实存在此情况。但实际上,许多用户仅为三五好友制作视频,在群聊分享,而非社交媒体。我不确定此使用模式能否持续,但若持续,它将大幅影响计算资源需求与用户互动比例。
未来可能让用户为生成视频付费。例如您每天生成100个视频发送朋友,或想生成包含某位名人的视频(且他们同意),或许可对生成内容付费分成。我们需要实验探索如何操作。
但我不喜欢对六天前刚上线产品下定论,这一切可能仅是新鲜感,也可能不会形成长期使用场景。但至少截至目前,使用量很大。
Rowan Cheung:您考虑过在Sora应用中投放广告吗?
Sam Altman:尚未,但此方向有趣可能性很大。当然,也可能有令人担忧的做法。与ChatGPT不同,我们可通过订阅模式获得收入;但若Sora用户主要在信息流浏览内容,广告可能是更自然模式。
若主要是私信,则是另一种模式。我乐观认为,或许到今年底,或更现实地说,到明年第一季度末,我们能理解产品最终形态,并据此设计商业模式。我认为按生成次数收费合理,也值得尝试。其他商业模式则取决于产品如何发展。
Q:智能时代,十亿知识工作岗位可能首先受影响,随后创造新工作。您如何看待?
(注:若50年前告诉农民,互联网将创造十亿新工作岗位,他们可能不信。同样,现在许多人认为AI将创造大量新工作岗位。)
Sam Altman:我认为农民不仅不信会发生此类事情,他们可能视您的工作(互联网媒体)为非真正工作。
耕种是提供人们真正所需,养育他们,这才是真正工作。而我们这些人,生活条件优渥,食物充足,财富丰富,我们所做许多事似打发时间的游戏,需要感到重要,但可能不算真正工作。
对我们而言,这些工作感觉真实。我很感激能做既满足又重要之事。未来工作可能非常不同,或许比当前我们认为的工作形式更轻松。但我相信人类内在驱动力仍存,我们将找到许多事情去做。
Rowan Cheung:希望我们还能探索太空。您认为AGI出现后,人类将重点关注什么?
Sam Altman:我希望一切向各方向发展,尝试所有事情。太空对我很酷,但您或他人可能有各自有趣方向。我希望一切皆有可能。
Rowan Cheung:若明天可制定一条全球政策,您会定什么?
Sam Altman:很难仅选一条。但我持续思考AI监管问题——是否合理,是否让大公司占优。我认为,当模型非常强大时,应有全球性框架降低灾难性风险,尤其针对最前沿安全问题。若有一条全球政策实现此点,那将非常好。
Q:在中国,微信几乎是万能应用,购物、社交、聊天皆可。现在ChatGPT也具备购物、网页搜索、Sora等功能,你们是否想打造美国版微信?
Sam Altman:不,许多原因让我认为此方式在美国市场行不通。我们想打造的是真正卓越的AI超级助手。
Rowan Cheung:为何将功能单独推出?例如Sora是独立应用,为何不直接集成进ChatGPT?
Sam Altman:ChatGPT对许多人而言是最个人化账号,加入社交体验可能显得突兀。可想象消息功能,因用户会分享与协作。但用户对ChatGPT的认知与娱乐应用认知差异很大,可能产生不协调。当然,许多功能我们仍集成进ChatGPT。
Rowan Cheung:您认为最重要、最有用的代理是什么?最让您兴奋的是什么?
Sam Altman:可观察Codex发展,并思考在其他行业应用。例如法律、财务建模等,是否能有类似Codex的体验。已有优秀初创公司从事此方向。随着技术成熟,若这些工具在各行业达到Codex在编码领域的水平,那将是我最兴奋的方向。我能想象一个世界:您仅通过与一堆代理对话,即可启动一家初创公司。我认为Agent Builder或agent kits尚未完善,但可看到从此处到彼处的路径。
Q:此前您在主题演讲中提及语音可能是AI或代理的最终形式,能详细阐述吗?
Sam Altman:我不认为语音是交互的最终形式。许多时候,语音并非合适交互方式。
例如您在公共交通站,边走边说话,这可能很烦人。但许多时候,语音是非常自然的交互方式。语言本身如此,但有时是语音,有时是打字,此点尚未定论。
我们都习惯智能音箱类产品,虽常被调侃,但许多人确实使用并喜爱它们。而智能音箱还不够好,不是因为概念错误,而是当时AI不够强大,周边基础设施不完善。想象一下,若您仅需对设备说话,它便能准确完成您想要的操作,随后几乎不打扰您——那种体验,如同我理想中想使用的计算机。
Rowan Cheung:你们会开发语音交互吗?
Sam Altman:这需要时间。我们需要耐心打造全新设备,在大规模上实现超高质量。这是完全不同的电脑使用方式,我们需要创造性空间探索。
我们确实有令人兴奋的想法,但目前不能透露,也不会短期内公布。但我们将努力打造值得期待的产品。
参考链接:
[1]https://www.youtube.com/watch?v=zwnVUiwObl8
[2]https://futurism.com/artificial-intelligence/sam-altman-real-work-ai[3]https://x.com/rowancheung
本文由主机测评网于2026-01-08发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260115861.html