2026年06月21日

ServiceNow:预计股价将继续走低 - Seeking Alpha

ServiceNow:预计股价将继续走低 - Seeking Alpha | 《MIT Technology Review》:一家初创公司称其已突破制约大语言模型发展的瓶颈 | 有人刚刚通过开放互联网,在美国 6 个不同州的 6 块消费级 GPU 上,以 30 tok/s 运行了一个 744B 参数模型
分类筛选:

01 ServiceNow:预计股价将继续走低 - Seeking Alpha

ServiceNow股价预期下行反映企业软件估值承压

摘要:
信息有限。Seeking Alpha发布一则关于ServiceNow的市场观点,标题显示其判断ServiceNow股价可能继续走低。现有内容未披露具体财务数据、产品版本或业务更新,因此可确认的信息主要集中于二级市场表现预期。

从信息结构看,这是一篇投资分析内容,而非产品发布或技术升级公告。ServiceNow是一家企业工作流与IT服务管理软件供应商,其股价预期变化通常与估值水平、增长预期、利润率或宏观支出周期相关,但原文未提供明确依据。

该信息反映出AI与企业软件板块中,资本市场仍在关注商业化效率与估值匹配度。由于缺少正文细节,暂无法进一步判断其对产品路线或行业竞争格局的具体影响。

信息来源为市场分析观点 原文未披露具体支撑数据 事件不属于产品发布新闻
来源

查看原文 →

02 《MIT Technology Review》:一家初创公司称其已突破制约大语言模型发展的瓶颈

Subquadratic发布新技术独立评估显示突破LLM十年计算瓶颈

美国迈阿密AI初创公司Subquadratic于上月结束隐身运营,并宣布其新技术已解决限制大语言模型近10年的数学瓶颈。当前披露信息有限,但公司已公布一项独立评估结果,显示相关技术主张具备一定验证依据。

现有材料未披露算法名称、版本号及完整测试指标,但报道指出,独立评估结果提升了外界对其技术可行性的关注。若该瓶颈确被突破,可能影响大语言模型在训练效率、推理成本和上下文扩展等方面的工程实现。

这类进展反映出LLM底层计算架构仍在快速演进。相比单纯扩大参数规模,针对核心数学与系统瓶颈的优化,正成为生成式AI竞争的重要方向。

独立评估增强技术可信度 目标直指LLM底层瓶颈 信息披露仍较为有限
来源

查看原文 →

03 有人刚刚通过开放互联网,在美国 6 个不同州的 6 块消费级 GPU 上,以 30 tok/s 运行了一个 744B 参数模型

leyten发布Shard分布式推理框架744B模型广域网实现30tok每秒

研究者 leyten 本周发布分布式推理项目 Shard。该项目将 744B 参数的 GLM-5.2 部署在 6 张 RTX Pro 6000 GPU 上,节点分布于美国 6 个州,跨普通广域网(WAN)运行,在 22-75ms 节点时延下实现约 30 tokens/s 吞吐。

其核心方法包括三项技术:一是基于广域网的 speculative decoding(推测解码),由小型 draft model 预生成多个 token,再由大模型一次往返验证;二是采用 ring pipelining with direct return(环形流水并直接返回),减少结果逐级中继;三是将 draft model 预编译为 CUDA Graph,带来 3.8-5.3 倍加速。基线性能从 1.87 tokens/s 提升至 16.6 tokens/s,最终达到约 30 tokens/s。

相较 2022 年 Petals 在更小模型上 1-2 tokens/s 的结果,Shard 在跨公网分布式推理上显示出更高可行性。信息有限,原文未提供完整实验配置、精度指标及复现细节。

744B模型跨6州广域网运行 三项优化将吞吐提升至30tok每秒 分布式公网推理可行性增强
来源

查看原文 →