网络安全这条赛道最近的变化有点像被重新校准过一次刻度。OpenAI 把 Daybreak 防御工具链做了一次整体升级,同时放出 GPT-5.5-Cyber 完整版模型,语气不算激进,但指向很清晰:AI 正式从“找漏洞”往“修漏洞”挪了一步。
在 CyberGym 基准测试里,这个模型跑出了 85.6% 的成绩,比 GPT-5.5 的 81.8% 和 Anthropic Mythos 5 的 83.8%都高出一截。数字本身只是结果,更关键的是测试任务的设定——不是语言理解,也不是代码生成,而是模拟已知漏洞的复现与利用路径。这类任务本质上更接近攻防对抗的中间态。
安全行业过去几年有个共识:漏洞发现正在被工具链自动化吞噬,但修复一直拖在后面。原因不复杂,发现是“识别问题”,修复是“改写系统行为”,后者牵涉依赖关系、兼容性、上线节奏,甚至业务风险。AI 即便能生成补丁,也很难保证不会引入新的隐患。
OpenAI 这次把叙事往前推了一点。Codex Security 插件被升级后,开始在开发环境里直接分析漏洞并生成修复建议。官方给出的运行数据是:3 月预览以来,已经扫描超过 3000 万次代码提交,并确认自动修复约 50 万个安全缺陷。
这个比例放在工程语境里不算轻。尤其是在开源项目和云原生代码密集环境中,安全补丁的滞后往往是系统性问题,而不是单点问题。AI 如果真能稳定介入“修复环节”,影响的不只是安全团队的工作流,更可能改变 CI/CD 管道里原本的人机分工。
不过修复能力的提升并不意味着风险下降,反而可能让攻击和防御同步加速。漏洞被更快发现,也意味着攻击者的试探周期会被压缩,安全窗口时间进一步缩短。行业里已经有人开始把这种状态称作“零时差攻防”。
OpenAI 同步推进的“Patch the Planet”开源安全计划,多少有点补位意味。联合 Trail of Bits、HackerOne 等安全机构,对 cURL、Go 等 30 多个核心开源项目提供模型与算力支持,再加上人工审核补丁质量。这种“AI生成 + 专家复核”的组合,本质还是在控制自动化扩张的边界。
安全厂商也已经开始接入。Palo Alto Networks、Wiz 进入 Daybreak 合作体系,说明这套能力正在从模型产品走向企业安全栈的底层接口。对于传统安全公司来说,这更像是一个必须接入的能力模块,而不是可选插件。
如果把这条线拉长看,会发现一个变化正在发生:安全行业的价值中心从“规则和特征库”往“生成能力和修复能力”迁移。过去依赖人写规则,现在依赖模型生成补丁,再由系统验证。人仍然在回路里,但位置已经后移。
真正的变量也许不在模型能不能修漏洞,而在于——当修复速度被机器拉到极致之后,软件系统还能不能维持原有的稳定节奏。网络安全这个行业,正在从防守效率竞赛,慢慢变成系统演化速度的竞赛。