最常见的开发人员工作流程发生在浏览器中。 OpenAI 为桌面 Codex 应用程序构建了计算机使用功能,然后检查了数据并发现了现实。
所以它运送了一个Chrome 扩展程序反而。
Chrome 版 Codex 推出5 月 7 日(macOS 和 Windows),为 AI 代理提供自己的选项卡组来测试 Web 应用程序、跨 Salesforce 和 Gmail 等登录网站收集上下文,并并行运行 Chrome DevTools。关键的设计选择:它不会接管用户的活动浏览会话。
计算机使用劫持屏幕。 Chrome 插件在后台运行。
OpenAI 宣布:“Codex 应用程序中的新 Chrome 插件...可以测试 Web 应用程序、跨选项卡收集上下文、高效并行使用 Web DevTools,并在不接管浏览器的情况下保持结果井井有条。”隔离很重要。通过将 Codex 限制在其自己的具有单独选项卡组的浏览器实例中,OpenAI 限制了代理中断活动工作流程的风险。
用户通过 Codex 插件菜单安装扩展,然后通过计算机使用设置中管理的允许列表和阻止列表授予逐个站点权限。官方开发者文档详细说明权限模型:Codex 在与每个新网站交互之前都会询问,并且浏览器历史记录访问的范围是根据请求确定的,没有始终允许的选项。该版本遵循快速扩展节奏。 OpenAI 在 2 月份推出了 Codex 作为 macOS 应用程序,并在 4 月份添加了功能,现在将 Chrome 插件与 Windows 桌面应用程序一起提供。该公司更广泛的路线图包括一个将 Codex 与 ChatGPT 聊天机器人和 Atlas 网络浏览器结合在一起的组合应用程序。
Codex 目前每周有超过 400 万活跃用户,自 2026 年初以来增加了 8 倍。OpenAI 告诉 Paul Thurrott,该扩展的目标是“基于浏览器的工作流程,例如检查日志、测试 Web 应用程序、审查仪表板和使用内部工具”。
另外两项功能正在同时成熟。语音模式由新发布的 GPT-Realtime-2 模型(OpenAI 的第一个具有 GPT-5 级推理和 128K 上下文窗口的语音模型)提供支持,可能会在 5 月 19 日至 20 日的 Google I/O 大会期间进入 Codex。测试中的远程控制功能可以让 Codex 通过 SSH 连接到机器,持续操作它们,并启用手机到桌面控制、ChatGPT for Android 版本 1.2026.125 中的文本字符串参考会话恢复、远程 Composer 命令以及用于桌面 Codex 访问的启动器快捷方式。
