2026年06月25日

OpenAI 与 Broadcom 发布面向 LLM 优化的推理芯片

OpenAI 与 Broadcom 发布面向 LLM 优化的推理芯片 | Anthropic AI 首席执行官 Dario Amodei 警告:到 2027 年,1 万亿美元算力时代或将使 AI 公司面临破产风险 | OpenAI 发布其首款定制芯片,由 Broadcom 打造
分类筛选:

01 OpenAI 与 Broadcom 发布面向 LLM 优化的推理芯片

标题: OpenAI推出Jalapeño推理芯片面向LLM提升性能效率与扩展性

摘要:
OpenAI与Broadcom联合推出定制AI芯片Jalapeño,面向大语言模型(LLM)推理场景。该产品定位于提升AI系统的推理性能、能效表现和部署规模,重点服务高并发模型调用需求。

Jalapeño是一款面向inference的专用芯片,不以通用训练负载为核心目标。公开信息显示,其设计重点在于优化LLM推理链路,以更高吞吐、更低功耗支持模型在线服务。原文未披露制程、算力、带宽等参数,信息有限。

此次合作反映出AI厂商正加强自研或定制芯片布局,以降低对通用GPU的依赖。随着推理需求持续增长,专用加速器将成为云端AI基础设施的重要组成部分。

面向LLM推理专用设计 联合定制芯片强化基础设施 推理性能与能效为核心目标
来源

查看原文 →

02 Anthropic AI 首席执行官 Dario Amodei 警告:到 2027 年,1 万亿美元算力时代或将使 AI 公司面临破产风险

Anthropic CEO Dario Amodei警示2027年1万亿美元算力成本冲击AI企业

原文为 Reddit 转发信息,信息有限。可确认内容显示,Anthropic 首席执行官 Dario Amodei 就 AI 行业算力投入风险发出预警,称到 2027 年,1 万亿美元级别的计算资源支出可能将 AI 公司推向破产风险。

现有文本未提供完整采访内容、模型名称、资本开支构成或测算方法。可提取的核心信息是,前沿 AI 公司在训练与推理阶段的 compute 成本持续上升,资金消耗可能超出商业化回报能力,进而影响行业融资、基础设施投资和模型发布节奏。

这一表述反映出生成式 AI 行业的共同问题,即大模型扩展依赖高强度资本投入。若算力成本与收入增长失衡,行业可能转向更强调效率优化、模型压缩和推理成本控制的技术路线。

2027年算力支出或达1万亿美元 高算力投入可能压缩企业现金流 行业或转向效率优先路线
来源

查看原文 →

03 OpenAI 发布其首款定制芯片,由 Broadcom 打造

标题: OpenAI发布Jalapeño推理芯片功耗效率提升面向实时编码模型

摘要:
OpenAI于周三发布首款定制推理处理器Jalapeño,并与Broadcom联合设计和制造。该芯片面向OpenAI推理系统优化,目前仍处于测试阶段。公司称,早期结果显示其性能功耗比优于当前先进替代方案。

Jalapeño专用于推理(inference)场景,即已训练模型响应用户请求的执行过程。OpenAI表示,该芯片在运行实时编码模型时具备更低运营成本。公司还称,自有AI模型参与了芯片开发。相比之下,预训练等高强度任务预计仍将继续依赖Nvidia GPU。

此举显示OpenAI正向基础设施纵向整合推进,以降低对外部GPU供应商的依赖。Google和Amazon此前也已布局同类AI加速器(AI accelerator)。若推理成本持续下降,相关模型服务的单位经济性和大规模部署能力将进一步改善。

首款定制芯片面向推理 性能功耗比优于现有方案 实时编码模型运营成本更低 OpenAI推进算力基础设施自研
来源

查看原文 →