2026年06月10日

借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译

借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译 | 科技公司能否学会青睐更便宜的 AI 模型? | Anthropic 的 Claude Fable 5 是公众目前可访问的 Mythos 版本
分类筛选:

01 借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译

标题: Google发布Gemini 3.5 Live Translate支持70种语言实时语音翻译

摘要:
Google宣布推出Gemini 3.5 Live Translate。这是一款面向实时语音到语音翻译的音频模型,现已开始在Google产品中逐步上线。该模型可自动识别70多种语言,并在翻译输出中保留说话者的语调、节奏和音高。

与传统轮替式翻译系统不同,Gemini 3.5 Live Translate采用连续语音生成机制,无需等待发言结束再统一翻译。模型在上下文完整性与响应时延之间进行动态平衡,使译文语音仅比原始发言滞后数秒,并减少停顿感。该能力还支持流式语音处理、多语言输入自动识别,以及在高噪声环境下的稳定运行。

目前,该模型已通过Gemini Live API和Google AI Studio向开发者开放公开预览,并于本月起在Google Meet中向企业用户提供私有预览,同时也将通过Android和iOS版Google Translate面向普通用户提供。其适用场景包括多语言通话、会议、教学和直播等实时口译需求。

支持70多种语言自动识别 连续翻译降低实时交互延迟 已覆盖开发者企业和终端用户
来源

查看原文 →

02 科技公司能否学会青睐更便宜的 AI 模型?

标题:
AI行业转向低价模型80%工作负载或在12至18个月降本99%

摘要:
AI行业正在出现从“大模型优先”转向“低成本模型优先”的趋势。Coinbase联合创始人Brian Armstrong预测,未来12至18个月内,80%的AI工作负载将转向价格低99%的模型,只有20%的高复杂度任务继续使用最新一代模型。

这一变化的核心驱动因素是推理成本压力上升。法律AI工具Harvey近期与推理平台Fireworks AI合作测试,采用Claude Opus与GLM 5.1的混合调度方案,将高强度任务分配给Opus处理,在不降低输出质量的前提下,把推理成本降低了3倍,并减少了服务器占用时间。

如果该趋势持续,AI厂商的竞争重点可能从模型能力转向成本效率与任务编排。对OpenAI、Anthropic等依赖高端模型商业化的大型实验室而言,低价模型替代更多通用任务,可能直接影响其收入结构与上市前的增长预期。

低价模型替代通用任务加速 混合调度降低推理成本3倍 模型竞争维度转向成本效率
来源

查看原文 →

03 Anthropic 的 Claude Fable 5 是公众目前可访问的 Mythos 版本

标题: Anthropic发布Claude Fable 5预览版支持公众接入并启用高风险限制

摘要:
Anthropic于6月9日发布Claude Fable 5预览版,这是其Mythos系列模型首次面向公众开放。该模型可通过Claude API和按量计费的Enterprise方案使用,并将在6月22日前向Pro、Max、Team及席位制Enterprise订阅用户免费开放。

Anthropic表示,Claude Fable 5在软件工程、知识工作和视觉理解方面表现突出,但对高风险场景实施了硬性安全限制。在网络安全、生物、化学和模型蒸馏等领域,系统会阻止相关响应,并回退至Claude Opus 4.8。公司称,发布前已针对越狱攻击对分类器进行了压力测试。

此前,Mythos模型因网络安全风险仅向少数合作伙伴提供,随后扩展至15个国家的数百家关键基础设施相关组织。此次公开发布,反映出前沿模型商业化正在加速,同时也显示厂商正通过分级访问、响应拦截和能力回退机制控制部署风险。

Mythos系模型首次向公众开放 高风险任务触发能力回退 6月23日起改为按量积分计费
来源

查看原文 →