2026年06月17日

Probably 获 900 万美元融资,打造更可靠的 AI 类型

Probably 获 900 万美元融资,打造更可靠的 AI 类型 | 最快、最大、最强:NVIDIA Blackwell 横扫 MLPerf Training 6.0 | 白宫拒绝解除对 Anthropic Fable 5 的出口禁令,此前 NSA 警告其安全护栏可被绕过
分类筛选:

01 Probably 获 900 万美元融资,打造更可靠的 AI 类型

Probably完成900万美元种子轮融资推出数据科学工具实现9999准确率

Probably宣布完成900万美元种子轮融资,投资方为Andreessen Horowitz。该公司同时披露其首款数据科学工具,目标是减少大语言模型(LLM)幻觉和事实性错误,并将系统准确率提升至99.99%。

该产品面向复杂数据集快速问答场景。每条结果附带引用来源和审计轨迹。其核心机制是“harness”校验系统:LLM先生成初步答案,再由确定性验证器与原始数据集比对,不一致结果将被退回。Probably表示,模型已围绕该验证器进行训练,整体系统针对速度和准确性进行联合优化。

该方案的重点不在扩大模型规模,而在通过上下文约束和验证流程降低歧义。公司称,当前版本可运行在比前沿模型弱4个等级的较小模型上,并支持本地硬件部署。这反映出AI工程正从单纯追求模型能力,转向可靠性与可验证性设计。

900万美元种子轮融资落地 确定性验证器抑制模型幻觉 较小模型可在本地硬件运行
来源

查看原文 →

02 最快、最大、最强:NVIDIA Blackwell 横扫 MLPerf Training 6.0

标题:NVIDIA发布Blackwell平台MLPerf 6.0训练成绩提速2.6倍强化大模型训练

英伟达公布基于Blackwell架构的平台在MLPerf Training 6.0基准测试中的训练结果,重点覆盖大语言模型与推荐模型等工作负载。现有信息显示,Blackwell相较前代平台最高实现2.6倍性能提升,强调大规模训练任务的吞吐、扩展性与稳定性。信息有限。

MLPerf Training是衡量AI系统训练性能的行业基准,由MLCommons维护。此次结果说明,训练基础设施已成为影响模型迭代速度、可扩展规模和作业完成可靠性的关键因素。随着模型参数量和训练复杂度持续增长,计算平台对互连带宽、并行效率与系统稳定性的要求同步提升。

从行业角度看,训练基准成绩正成为GPU、网络和整机系统竞争的重要指标。Blackwell此次披露的数据,反映出AI训练平台正向更高密度、更强集群扩展能力和更低训练周期演进,但原文摘录未提供完整测试配置与具体任务明细。

Blackwell训练成绩最高提升2.6倍 MLPerf 6.0聚焦训练基础设施能力 大模型训练更依赖系统级优化
来源

查看原文 →

03 白宫拒绝解除对 Anthropic Fable 5 的出口禁令,此前 NSA 警告其安全护栏可被绕过

标题:美国政府维持Claude Fable 5出口禁令涉及Mythos模型护栏绕过风险

Anthropic与特朗普政府周一结束紧急磋商后,美国政府决定不解除对Claude Fable 5的出口管制。该模型此前被限制出口,原因是官方认定其安全护栏可能被绕过,并进一步访问底层未受限的Mythos模型,带来网络作战能力扩散风险。

相关警报由亚马逊首席执行官Andy Jassy直接向政府提出。随后,美国国家安全局(NSA)完成审查,并确认Claude Fable 5存在护栏被剥离的风险。根据公开信息,争议核心在于模型安全控制与底层能力隔离是否充分,而非模型常规功能本身。

超过100名网络安全专家签署公开信支持Anthropic,认为出口禁令可能削弱安全审计与防御研究能力,同时难以阻止境外开源模型继续发展。信息有限,现有内容主要来自转述,相关技术细节与管制范围尚未完整披露。

美国维持模型出口限制 NSA确认护栏绕过风险 百名专家反对禁令做法
来源

查看原文 →