近期,开发者在OpenAI的“openai-agents-js”GitHub代码仓库中意外发现了对新模型GPT-5.1 mini的提及,引发广泛讨论。代码显示,GPT-5.1 mini可能真实存在,并揭示了OpenAI未来GPT系列模型的潜在命名规则。
尽管有网友指出,相关提及信息已从代码库中删除,但截至发稿时,在提交记录https://github.com/openai/openai-agents-js/commit/33935a43a596ad370172f3ec92b712a144a35f8f中仍可查看细节。目前尚不确定该版本是否会作为独立模型发布,有反馈称它已被合并到其他项目中。
开发者透露,OpenAI已测试GPT-5 mini的新迭代版本,该模型很可能用于支持企业账户的“内部知识库”功能。初步测试显示,其性能优于当前的GPT-5 mini。
“在GitHub上搜寻模型名称就像扮演AI侦探,OpenAI员工屡次意外泄露产品路线图。”有开发者评论道。另一些人则期望,具备高思维能力的GPT-5 mini能作为GPT-5-Low的免费无限版本,在提升性能的同时减少GPU使用量,并借助新Nvidia GPU实现快速查询。
但也有开发者质疑这一发现的可信度,“单元测试中可能包含类似‘期望gpt-5.0为false’的代码,这或许是Codex的幻觉所致。”
GPT-5 mini是GPT-5的精简版,专注于轻量级推理任务。OpenAI声称,它提供与GPT-5相同的指令跟踪和安全优势,但延迟和成本更低。官网指出,免费用户达到GPT-5使用限制后,将自动切换至GPT-5 mini。
自发布以来,GPT-5 mini最受诟病的是其响应速度。用户反馈称,与之前的GPT-4.1 mini相比,GPT-5系列所有模型在基准测试中速度明显下降。有人表示:“我曾用GPT-4.1 mini因其低延迟,但GPT-5 mini性能更差、速度更慢、成本更高,最终我退回使用4.1版本,感觉GPT-5是一种倒退。”
开发者补充道:“GPT-5 mini几乎在所有方面都不如GPT-4.1,它总爱总结对话拖慢流程,思考缓慢,回答肤浅,工具调用功能基本失效。与GPT-4.1相比,其推理质量和实用性大幅降低。”
不过,也有用户持不同观点:“我早已停用GPT-4.1,因为它连代码库的细微更改都处理不了。GPT-5 mini在单文件小修改上表现优异,速度快且无问题。”对于速度争议,有解释称,这是推理型模型与非推理型模型的区别,建议用户根据需求选择“最小化推理”或“低程度推理”模式。
“我不在乎速度,只希望它别把我当5岁孩子对待。”还有用户抱怨GPT-5 mini常荒谬拒绝回答,即使使用企业级API接口也是如此。
在编程方面,GPT-5 mini的表现也未达预期。开发者指出:“当任务简单时,我改用Grok Code Fast1。GPT-5 mini在代码解释和编写上较弱,回答组织差,有时类似早期GPT-3版本。而Grok回答简洁易懂。我原期望GPT-5 mini是更智能的GPT-4.1,但事实并非如此。”
GitHub Copilot团队的bogganpierce回应称:“我们正探索快速调整以提升性能,如果GPT-5 mini在特定场景表现不佳,请记录在vscode repo上。mini自然比GPT-5智能度低,但听到它无法执行指令是危险信号。我的工作流是用GPT-5或Sonnet 4.5规划,再用Haiku或GPT-5 mini执行,效果不错。”也有开发者表扬:“我用Delphi开发,GPT-5 mini运行良好,能轻松编写万行代码,质量优于4.1。”
模型差评背后,据The Information报道,OpenAI员工感到公司正偏离其纯研究实验室的起源。例如,用户参与度指标成为研发团队的关键KPI,有员工对后训练阶段重视“参与度指标”不满,认为这优先产品“增长”,是公司Meta化的迹象。
“我们不希望OpenAI变成依赖流量的公司。”在职员工表示。随着前Meta员工大量加入,OpenAI的战略愈发类似Meta。LinkedIn数据显示,约630名OpenAI员工曾任职Meta,占总员工20%,内部Slack甚至设有前Meta员工频道。
员工担忧OpenAI文化过于像Meta或其他硅谷大厂。今年初,内部调查询问公司文化是否变得像“大型科技公司”。鉴于Meta在内容审核、隐私等问题上的争议,一些员工格外警惕。
2024年,前Meta高管Kevin Weil加入OpenAI后,提出将ChatGPT周活用户推至十亿并通过“牙刷测试”,引发高管不满。CTO Mira Murati等人认为应优先打造优质产品而非单纯增长用户。
对新应用Sora,有员工质疑方向是否正确,并担心公司对社交平台挑战(如内容审核)准备不足。CEO Sam Altman试图缓解焦虑,在Slack中称Sora不必然推动“超级智能”目标,但人们仍需要“有趣、轻松”内容,这与Meta的论点相似。
员工还担心公司对广告态度软化。Altman曾称广告为“万不得已的选择”,但近期表态更开放:“广告有点让人反感,但非完全不可接受,有些广告是净增值。”战略规划部负责人Irina Kofman(前Meta员工)的团队正研究基于ChatGPT“记忆”展示广告的可能性。
支持商业化者指出,公司规模两年内从800人扩张,上半年营收43亿美元,变化合理。Altman在全员大会上强调提升ChatGPT使用频率,产品团队据此推出功能,研究团队虽由首席研究官Mark Chen独立领导,但方向仍受影响。
参考链接:
https://x.com/testingcatalog/status/1982165811729973726?s=46
https://www.theinformation.com/articles/openai-readies-facebook-era
https://www.reddit.com/r/GithubCopilot/comments/1mtqbzo/gpt5_mini_is_not_just_bad_its_a_disaster/
本文由主机测评网于2026-01-14发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260117601.html