刚刚、GPT 5.6 突然发布：Sol 能力逼近 Mythos，限量开放

云头条 2026-06-27 14

OpenAI 预览 GPT-5.6 Sol：最强模型先交给少数伙伴，美国政府已过审。

2026 年 6 月 26 日，OpenAI 正式预览 GPT-5.6 系列模型，其中旗舰版本名为 GPT-5.6 Sol。

这不是一次普通模型更新。

OpenAI 同时推出了三档模型：Sol、Terra 和 Luna。

1）Sol 是旗舰模型，主打最强能力；

2）Terra 面向日常工作，在接近 GPT-5.5 表现的同时，价格便宜约 2 倍；

3）Luna 则定位为更快、更低成本的版本。

更值得关注的是发布方式。

OpenAI 表示，GPT-5.6 系列不会立即全面开放，而是先通过 API 和 Codex 向少数可信合作伙伴和机构开放预览。

OpenAI 称，公司已经在发布前向美国政府预览了模型计划和能力，并应政府要求，先从小范围受限预览开始。

OpenAI 同时强调，这种政府访问流程不应成为长期默认机制。

OpenAI 认为，如果最先进模型长期被限制在少数范围内，将影响用户、开发者、企业、网络防御者和全球合作伙伴获得前沿工具。

从能力看，GPT-5.6 Sol 被 OpenAI 称为迄今最强模型，重点提升集中在代码、生物学和网络安全任务上。

在代码方面，OpenAI 称 GPT-5.6 Sol 在 Terminal-Bench 2.1 上刷新了状态。该基准主要测试命令行工作流，包括任务规划、迭代执行和工具协同能力。

在生物学任务方面，GPT-5.6 Sol 在 GeneBench v1 上表现强于 GPT-5.5，而且使用的 token 更少。该基准主要评估长周期基因组学和定量生物学分析能力。

网络安全是这次发布中最敏感的部分。

OpenAI 称，GPT-5.6 Sol 是其目前网络安全能力最强的模型，在漏洞研究和利用相关长周期任务上明显提升。

OpenAI 还表示，在 ExploitBench 上，GPT-5.6 Sol 接近 Mythos Preview 的表现，但输出 token 只有约三分之一。

不过，OpenAI 同时试图划清安全边界。

OpenAI 称，GPT-5.6 Sol 更擅长帮助用户发现和修复漏洞，而不是稳定执行端到端攻击。在针对 Chromium 和 Firefox 的安全评估中，GPT-5.6 Sol 已能发现漏洞，并判断这些漏洞可能如何被利用。不过，在测试条件下，它还没有自主完成一条真正可用的完整攻击链。

OpenAI 认为它已经很会找漏洞、分析漏洞，但还没强到需要被归入最高级别网络安全风险模型。

不过，OpenAI 也承认，基准测试无法覆盖模型被用户与其他工具组合使用后的所有风险，因此 GPT-5.6 将采用更强的分层安全机制和分阶段发布。

在产品机制上，GPT-5.6 引入了新的 max reasoning effort，让 Sol 获得更长推理时间。OpenAI 还推出 ultra 模式，通过子 agent 协作处理复杂任务，而不是只依赖单个 agent 完成。

价格方面，GPT-5.6 按每 100 万 token 计费。Sol 输入价格为 5 美元，输出价格为 30 美元；Terra 输入 2.5 美元，输出 15 美元；Luna 输入 1 美元，输出 6 美元。OpenAI 还为 GPT-5.6 引入更可预测的 prompt caching，支持显式缓存断点和至少 30 分钟缓存生命周期。