关注我们: 微信公众号

扫码关注我们

刚刚、GPT 5.6 突然发布:Sol 能力逼近 Mythos,限量开放

云头条 2026-06-27 14

OpenAI 预览 GPT-5.6 Sol:最强模型先交给少数伙伴,美国政府已过审。

2026 年 6 月 26 日,OpenAI 正式预览 GPT-5.6 系列模型,其中旗舰版本名为 GPT-5.6 Sol。

这不是一次普通模型更新。

OpenAI 同时推出了三档模型:Sol、Terra 和 Luna。

5.jpg

1)Sol 是旗舰模型,主打最强能力;

2)Terra 面向日常工作,在接近 GPT-5.5 表现的同时,价格便宜约 2 倍;

3)Luna 则定位为更快、更低成本的版本。

更值得关注的是发布方式。

OpenAI 表示,GPT-5.6 系列不会立即全面开放,而是先通过 API 和 Codex 向少数可信合作伙伴和机构开放预览。

OpenAI 称,公司已经在发布前向美国政府预览了模型计划和能力,并应政府要求,先从小范围受限预览开始。

OpenAI 同时强调,这种政府访问流程不应成为长期默认机制。

OpenAI 认为,如果最先进模型长期被限制在少数范围内,将影响用户、开发者、企业、网络防御者和全球合作伙伴获得前沿工具。

从能力看,GPT-5.6 Sol 被 OpenAI 称为迄今最强模型,重点提升集中在代码、生物学和网络安全任务上。

在代码方面,OpenAI 称 GPT-5.6 Sol 在 Terminal-Bench 2.1 上刷新了状态。该基准主要测试命令行工作流,包括任务规划、迭代执行和工具协同能力。

6.png

在生物学任务方面,GPT-5.6 Sol 在 GeneBench v1 上表现强于 GPT-5.5,而且使用的 token 更少。该基准主要评估长周期基因组学和定量生物学分析能力。

7.png

网络安全是这次发布中最敏感的部分。

OpenAI 称,GPT-5.6 Sol 是其目前网络安全能力最强的模型,在漏洞研究和利用相关长周期任务上明显提升。

OpenAI 还表示,在 ExploitBench 上,GPT-5.6 Sol 接近 Mythos Preview 的表现,但输出 token 只有约三分之一。

8.png

不过,OpenAI 同时试图划清安全边界。

OpenAI 称,GPT-5.6 Sol 更擅长帮助用户发现和修复漏洞,而不是稳定执行端到端攻击。在针对 Chromium 和 Firefox 的安全评估中,GPT-5.6 Sol 已能发现漏洞,并判断这些漏洞可能如何被利用。不过,在测试条件下,它还没有自主完成一条真正可用的完整攻击链。

OpenAI 认为它已经很会找漏洞、分析漏洞,但还没强到需要被归入最高级别网络安全风险模型。

不过,OpenAI 也承认,基准测试无法覆盖模型被用户与其他工具组合使用后的所有风险,因此 GPT-5.6 将采用更强的分层安全机制和分阶段发布。

在产品机制上,GPT-5.6 引入了新的 max reasoning effort,让 Sol 获得更长推理时间。OpenAI 还推出 ultra 模式,通过子 agent 协作处理复杂任务,而不是只依赖单个 agent 完成。

价格方面,GPT-5.6 按每 100 万 token 计费。Sol 输入价格为 5 美元,输出价格为 30 美元;Terra 输入 2.5 美元,输出 15 美元;Luna 输入 1 美元,输出 6 美元。OpenAI 还为 GPT-5.6 引入更可预测的 prompt caching,支持显式缓存断点和至少 30 分钟缓存生命周期。

9.jpg

此外,OpenAI 还宣布,GPT-5.6 Sol 将于 7 月登陆 Cerebras,速度最高可达每秒 750 token。该版本初期也只会面向部分客户开放。

GPT-5.6 的发布已经说明,最强模型不再是单纯的产品上线,而是一场先过审、再开放的过程。

Altman 称,GPT-5.6 Sol 更聪明高效,价格与 GPT-5.5 相同;Terra 具备 5.5 级性能但价格减半。但应美国政府要求,GPT-5.6 今日仅限量预览,OpenAI 正争取尽快向更多用户开放。

10.png

关键词:

网友留言2

未查询到任何数据!
◎欢迎您留言咨询,请在这里提交您想咨询的内容。