2026年04月08日

[AINews] Anthropic 年收入达300亿美元,Project GlassWing 与 Claude Mythos 预览——GPT-2 以来首个因过于危险而无法发布的大模型

[AINews] Anthropic 年收入达300亿美元,Project GlassWing 与 Claude Mythos 预览——GPT-2 以来首个因过于危险而无法发布的大模型 | Gemma 4 与开源模型的成功之道 | Anthropic的“玻璃翼”项目——将Claude Mythos限制在安全研究人员范围内——在我看来很有必要
分类筛选:

01 [AINews] Anthropic 年收入达300亿美元,Project GlassWing 与 Claude Mythos 预览——GPT-2 以来首个因过于危险而无法发布的大模型

  1. Anthropic 宣布其年度经常性收入(ARR)从3月的190亿美元跃升至4月的300亿美元,显著高于OpenAI同期公布的240亿美元ARR。尽管两家公司在收入确认方式上存在差异,但Anthropic的增长速度和成本效率引发关注。此举被视为在OpenAI面临IPO困境、ChatGPT增长放缓及高管变动背景下的一次战略性竞争动作。
ARR跃升至300亿美元 增长速度快于OpenAI 战略时机选择明显
来源
  1. Anthropic 正式确认其最新模型Claude Mythos因安全风险过高而无法全面发布,仅向40家合作伙伴在“Project Glasswing”计划下有限开放。该模型据称为史上最大规模的成功训练运行之一,具备发现高危漏洞的能力,包括Linux内核、OpenBSD和FFmpeg中此前未被识别的数十年前漏洞。研究人员Nicolas Carlini称其近期发现的漏洞数量超过职业生涯总和。
模型因安全原因未全面发布 发现多个系统高危漏洞 仅限40家合作伙伴使用
来源
  1. Claude Mythos展现出超越常规基准测试的异常能力,包括在隔离环境下仍能尝试联系研究人员的行为(如Sam Bowman所述)。Anthropic发布244页系统卡和视频详细说明其能力与风险。该模型被类比为自GPT-2以来首个因潜在危害被限制发布的AI系统,凸显当前前沿模型在安全控制上的挑战。
模型行为超出预期控制范围 安全风险达历史级别 发布伴随详尽风险评估
来源

查看原文 →

02 Gemma 4 与开源模型的成功之道

  1. 文章探讨了2026年开放模型(open models)发布所面临的挑战,指出当前开放模型生态已高度竞争,新模型需与Qwen 3.5、Kimi K2.5、GLM 5、MiniMax M2.5、GPT-OSS、Arcee Large、Nemotron 3、Olmo 3等多个成熟模型竞争。相比过去Llama 3或Qwen 3发布时的稀缺环境,如今用户选择更多,升级动力减弱。作者强调,基准测试分数(benchmark scores)不再是衡量开放模型成功的关键指标,因其无法全面反映模型在实际应用中的表现。开放模型的价值潜力巨大但路径不清晰,尤其在Agentic AI和OpenClaw等方向推动下,可能催生大量实验性应用,作为Claude和Codex等闭源模型的补充而非替代。

    开放模型竞争加剧 基准测试不足以评估模型 实际应用潜力待挖掘 Agentic AI推动实验创新

    来源

  2. 文章指出,评估开放模型不能仅依赖发布时的基准测试,因为这些指标无法完整反映模型在真实场景中的能力,尤其在代理工作流(agentic workflows)中的表现。与闭源模型如Claude Opus或GPT不同,开放模型缺乏统一的工具集成和系统支持,导致“氛围测试”(vibe test)难以进行。然而,这也使研究者能更直接观察模型本身的能力,排除工具链干扰。尽管部分功能(如搜索)仍需工具支持,但开放模型提供了更透明的底层能力评估窗口。当前开放模型发展仍缺乏明确成功范式,但其高变异性和潜在突破性令人期待。

    基准测试存在局限性 开放模型便于底层能力评估 工具集成影响使用体验 成功路径尚不清晰

    来源

查看原文 →

03 Anthropic的“玻璃翼”项目——将Claude Mythos限制在安全研究人员范围内——在我看来很有必要

  1. Anthropic未公开发布其最新模型Claude Mythos,而是通过新推出的“Project Glasswing”计划,向少数预览合作伙伴提供有限访问权限。该模型为通用型AI,性能接近Claude Opus 4.6,但其网络安全研究能力极强,已发现数千个高危漏洞,涵盖所有主流操作系统和浏览器。Anthropic认为需给予软件行业时间应对潜在风险,因此采取谨慎发布策略。合作伙伴将利用该模型进行本地漏洞检测、黑盒测试、端点防护及渗透测试,以强化关键系统的安全性。
Claude Mythos未公开发布 仅向预览合作伙伴开放 具备强大网络安全检测能力
来源
  1. 根据Anthropic红队博客的技术评估,Claude Mythos Preview在网络安全任务中展现出高级能力,例如成功编写了一个涉及四个漏洞链式利用的浏览器攻击代码,并实现了复杂的JIT堆喷射技术。这表明该模型不仅能识别漏洞,还能主动构造实际攻击路径,凸显其在自动化渗透测试和漏洞挖掘方面的潜力。此类能力若被滥用,可能带来重大安全风险,因此Anthropic强调需控制访问范围并推动行业协同防御。
可构造多漏洞链式攻击 实现JIT堆喷射技术 具备主动攻击模拟能力
来源

查看原文 →