
GPT-5-Codex – OpenAI推出的Agent编程优化模型
智能
2025-09-16 10:39
声明:该文章来自(AI工具集)版权由原作者所有,K2OS渲染引擎提供网页加速服务。
GPT-5-Codex是什么
GPT-5-Codex 是 OpenAI 推出的专为编程优化的模型,基于 GPT-5 进一步强化。模型聚焦于真实世界的软件工程任务,如从零搭建项目、代码重构、调试、测试和代码审查等。模型能根据任务复杂度动态调整思考时间,简单任务秒回,复杂任务深度思考,支持独立完成长达 7 小时的复杂任务。模型代码审查能力出色,能精准发现关键缺陷,减少无效评论。GPT-5-Codex 支持多模态输入,能在云端查看图片或截图并展示工作成果,是开发者的强大编程助手。
GPT-5-Codex的主要功能
- 代码生成与优化:根据自然语言描述快速生成高质量代码,支持多种编程语言、优化现有代码提升性能。
- 代码审查:支持自动发现代码中的关键缺陷和潜在问题,提供详细审查报告帮助开发者快速定位和修复。
- 交互式编程:在交互式会话中快速响应简单任务,同时能独立处理复杂任务,如大型重构,持续工作超过7小时。
- 多模态输入:支持图片输入用在前端设计和UI任务,能展示工作进度的截图提供直观反馈。
- 集成与扩展:无缝集成到VS Code、GitHub、ChatGPT等开发环境,支持网页搜索等外部工具调用提升开发效率。
GPT-5-Codex的性能表现
- 代码生成与优化:在SWE-bench Verified基准测试中,GPT-5-Codex准确率达74.5%,高于GPT-5的72.8%,且在代码重构任务上准确率从GPT-5的33.9%提升至51.3%。
- 动态思考时间:GPT-5-Codex能根据任务复杂度动态调整计算资源,简单任务token使用量比GPT-5减少93.7%,复杂任务token使用量增加102.2%,能独立工作超过7小时处理复杂任务。
- 代码审查能力:GPT-5-Codex错误评论率仅4.4%,高影响力评论占比达52.4%,平均每个PR评论数从GPT-5的1.32条降至0.93条,能有效发现关键缺陷、减少无效评论。
- 多模态处理:支持图片输入用于前端设计和UI任务,能展示工作进度的截图提供直观反馈,提升开发体验。
- 集成与扩展:支持无缝集成到VS Code、GitHub、ChatGPT等开发环境,通过容器缓存技术使新任务和后续任务的中位完成时间缩短90%,提升开发效率。
GPT-5-Codex的核心优势
- 优化方向:GPT-5-Codex是 GPT-5 的一个版本,专为在 Codex 中的代理编码进一步优化,训练重点是现实世界的软件工程工作,包括从零开始构建完整项目、添加功能和测试、调试、执行大规模重构以及进行代码审查等复杂任务。
- 动态思考时间:根据任务复杂度自动决定投入多少计算资源。对于最简单的 10% 任务,比 GPT-5 减少 93.7% 的 token 使用量;面对最复杂的 10% 任务,花费两倍时间进行推理、编辑、测试和迭代,能独立工作超过 7 小时处理大型复杂任务。
- 代码审查能力:被专门训练用在代码审查和发现关键缺陷,会导航代码库、推理依赖关系、运行代码和测试来验证正确性。在评估中,错误评论率仅 4.4%(GPT-5:13.7%),高影响力评论占比 52.4%(GPT-5:39.4%),平均每个 PR 0.93 条评论(GPT-5:1.32 条)。
- 前端任务表现:在创建移动网站时的人类偏好评估中显示出显著改进。在云端工作时,支持查看用户提供的图片或截图输入,视觉检查进度,并向用户展示工作截图。
GPT-5-Codex的不足
- 任务挑剔:对任务的范围和合理性有一定的限制,对于过于复杂的任务会直接拒绝。
- 环境设置麻烦:在设置过程中,可能会对用户的开发环境做出错误的假设,导致需要手动重新配置系统文件和环境设置,增加使用前的准备工作。
- 多Agent工作流问题:虽理解多个Agent的概念,但没有真正的子Agent,无法像Claude Code那样在长期研究任务中自动继续前进。
GPT-5-Codex的项目地址
项目官网:https://openai.com/index/introducing-upgrades-to-codex/
GPT-5-Codex的应用场景
- 软件开发全流程:从零开始构建完整项目,包括需求分析后的代码实现、功能添加、测试编写、调试及大规模代码重构等复杂任务。
- 代码审查环节:在代码上线前自动进行审查,发现关键漏洞和潜在问题,帮助团队提高代码质量和开发效率。
- 交互式编程协作:与开发者在交互式会话中配合,快速响应简单任务,同时能独立处理需要长时间思考的复杂任务,如大型重构。
- 前端设计与开发:支持图片输入,用在前端设计和UI任务,能查看用户提供的设计图或截图,生成相应的代码,展示工作进度的截图。
[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
排名
热点
搜索指数
- 1 扩大高水平开放 拓展发展新空间 7904516
- 2 “嘎子哥”因穿警服直播带货被行拘 7807843
- 3 夫妻选车牌 妻子随手摇出6666 7714107
- 4 “十四五”期间9家新央企组建设立 7618796
- 5 外交部回应迪士尼等起诉中国公司 7522344
- 6 女生军训被抓去表演节目跳起上车舞 7423816
- 7 男子欠5000多万被抓 家藏茅台鹿鞭 7327886
- 8 河南一高校喝蜜雪冰城需自带水杯 7231870
- 9 NASA称“太阳正逐渐苏醒” 7139975
- 10 男子回应将仨娃放地铁口:老婆失联 7044875