一次发了三样
6 月 22 日,OpenAI 在自家的 Daybreak 安全计划下一口气放出三样东西:GPT-5.5-Cyber 的完整版,一个专做防御的模型,只对通过审核的安全机构开放;一个叫 Codex Security 的插件,把漏洞扫描塞进开发流程;还有「Patch the Planet」,专门去常用开源项目里找 bug 并修。OpenAI 特意说明,模型找出来的问题得先经人审过,才往外披露。
跑分得打个折扣看
这个模型能在大代码库里做更深的分析,定位敏感组件、验证可疑漏洞,还能写补丁、跑测试。OpenAI 说它在 CyberGym 上拿了 85.6%,比标准版 GPT-5.5 的 81.8% 高,号称「单模型最高」。但 CyberGym 是 OpenAI 自己的内部评测,没上过第三方榜单,这个数字听听就好。配套还有个伙伴计划,约 30 家安全厂商能把这套能力接进自家产品。
真正的看点
有意思的不是模型更强,而是它怎么发——限定给审核过的机构、还要人工复核。同一套攻防能力,给谁、怎么把关,比跑分高那几个点要紧得多。
via: OpenAI 官方公告