昨夜,科技圈被一则消息点燃。
5月17日凌晨,OpenAI正式发布了基于云的软件工程智能体——Codex的预览版。
兴奋的 Altman 在 X 平台连发数条推文表示:
有了这样的工具,一个人竟然能做出这么多软件,真的让人惊叹又振奋。 “你直接去做就行了”一直是我很喜欢的一句流行语,没想到这么快就能在 AI 和它的使用者身上体现,而且意义还这么大。
上新AI编程新神器
据介绍,Codex能够并行处理多项任务,包括编写功能代码、解答代码库相关问题、修复错误以及提交拉取请求以供审核等。其背后依托的是codex-1模型,这是OpenAI o3模型的一个版本,专门针对软件工程进行了优化。
Codex的操作流程十分便捷,用户可以通过ChatGPT的侧边栏访问它,输入提示并点击“代码”按钮即可下达编程任务,或者点击“提问”按钮向Codex询问有关代码库的问题。
每个任务都在预加载了用户代码库的独立隔离环境中独立处理。Codex具备读取和编辑文件的能力,并且可以运行包括测试工具、类型检查器等在内的命令。任务完成时间通常为1到30分钟,具体取决于任务的复杂程度,用户可以实时监控Codex的进度。
完成任务后,Codex会在其环境中提交更改,并通过引用终端日志和测试输出,为用户提供详细的可验证证据链,便于用户追溯任务执行的全过程。用户可以查看结果、要求进一步修改、创建GitHub拉取请求或直接将变更集成至本地环境。
为了使Codex更好地适应不同项目的需求,用户可以在代码库中放置AGENTS.md文件,类似于README.md文件,用于指导Codex如何浏览代码库、运行哪些测试命令以及遵循项目标准规范。
在安全性方面,OpenAI对Codex进行了精心设计。Codex完全运行在云端的安全隔离容器中,在任务执行期间互联网访问被禁用,仅能与通过GitHub仓库明确提供的代码以及用户通过设置脚本配置的预安装依赖项进行交互,无法访问任何外部网站、API或其他服务。
此外,Codex经过训练能够识别并精准拒绝旨在开发恶意软件的请求。
目前,Codex已向ChatGPT Pro、Enterprise和Team用户开放,Plus用户也将很快可以使用。OpenAI还同步推出了codex-1的精简版本,基于o4-mini专为轻量级开源编码Agent“Codex CLI”而打造。定价为:
输入 tokens:每 100 万 $1.50
输出 tokens:每 100 万 $6
OpenAI的技术团队已经开始将Codex纳入其日常工具包,用于卸载那些重复且范围明确的任务,如重构、重命名和编写测试等。一些外部合作团队如思科和Temporal也通过使用Codex加快了开发与调试节奏。
然而,Codex仍处于早期开发阶段,作为研究预览版,目前尚不具备某些功能,例如前端工作所需的图像输入支持,在Codex运行过程中实时调整智能体的能力等。
此外,远程智能体的执行速度比交互式编辑慢,这可能需要一定的适应时间。但OpenAI表示,未来计划推出更具交互性和灵活性的智能体工作流。
首站花落阿联酋?
与此同时,OpenAI正在大力推进其全球AI基础设施的扩张。
据报道,OpenAI计划在阿联酋阿布扎比帮助开发一个可能成为全球最大的数据中心园区。这个5吉瓦的数据中心将占地10平方英里,功率相当于五座核电站的总和。该项目是OpenAI全球AI基础设施扩张的重要一步,并得到了阿联酋官员的支持。
该数据中心园区是OpenAI“星际之门”(Stargate)倡议的一部分。知情人士透露,OpenAI将成为最近宣布的5吉瓦数据中心园区的主要锚定租户之一。
阿布扎比投资工具MGX也在考虑加入该项目,与OpenAI和G42一起参与其中。此外,英伟达和思科也支持阿联酋的“星际之门”数据中心项目,英伟达将供应配置Blackwell GB300系统的硬件。
美国商务部本周四宣布,阿联酋与美国政府同意建立“美阿AI加速伙伴关系”框架。美方将促进与阿联酋更深层次的技术合作,包括启动一个一期规划装机容量1GW的AI数据中心。
该数据中心属于总规划容量5GW的美阿AI园区内数据中心群,位于阿布扎比,占地10平方英里。该园区将由阿联酋科技公司G42建设,并同多家美国企业共同经营。