2026年04月30日

更多 Gemini 功能即将登陆 Google TV

更多 Gemini 功能即将登陆 Google TV | AI评估正成为新的算力瓶颈 | IBM推出Granite 4.1系列模型
分类筛选:

01 更多 Gemini 功能即将登陆 Google TV

Google TV推出Gemini AI功能集成Nano Banana与Veo模型

Google在周三宣布为Google TV新增一系列AI驱动功能,并推出专属短视频信息流,将YouTube Shorts直接接入主屏幕。此次更新以Gemini为核心,新增“Create”按钮,支持调用图像生成模型Nano Banana和视频生成模型Veo,首批支持设备为美国市场的Gemini-enabled TCL电视。

Nano Banana支持通过语音指令编辑照片,如更换背景或服装;Veo可根据文字描述生成视频片段或动画静态图像。Google Photos亦升级,新增基于Gemini的语义搜索功能,可快速定位特定回忆,并推出“Remix”艺术风格滤镜与“Dynamic Slideshows”动态幻灯片功能。

此次整合反映Google将生成式AI从移动端向家庭大屏场景延伸的趋势,强化客厅场景的互动娱乐体验。

Google TV集成Gemini AI支持图像视频生成 YouTube Shorts接入电视主屏推短视频流 Google Photos新增语义搜索与动态幻灯片
来源

查看原文 →

02 AI评估正成为新的算力瓶颈

标题:
AI评估成本成新瓶颈单次GAIA测试达2829美元

摘要:
AI模型评估成本已突破关键阈值,成为制约研究的新瓶颈。Holistic Agent Leaderboard(HAL)在9个模型与基准上执行21730次智能体推演,耗资约40000美元;单次GAIA测试前沿模型成本达2829美元。

评估成本受架构选择与重复运行显著影响。Exgentic实验显示相同任务成本差异达33倍,主因在于脚手架设计;UK-AISI将智能体步骤扩展至百万级以研究推理时计算。科学机器学习中,The Well评估单架构需960 H100小时,完整四基线扫描达3840 H100小时。

静态基准压缩技术难以适用于新型智能体评估。当前基准存在噪声高、对脚手架敏感、部分可压缩等问题,训练闭环评估本身成本高昂,可靠性提升进一步推高开销。

AI评估成本超越算力成新瓶颈 智能体评估单次测试超2800美元 评估成本差异达33倍受架构影响 静态压缩技术难解动态评估难题
来源

查看原文 →

03 IBM推出Granite 4.1系列模型

标题:
IBM发布Granite 4.1模型家族涵盖5类模型支持企业级AI应用

摘要:
IBM推出Granite 4.1模型家族,包含语言、视觉、语音、嵌入及Guardian五大类模型,专为大规模企业AI系统设计。该版本为IBM迄今最全面的模型发布,覆盖3B至30B参数规模的密集解码器语言模型。

Granite 4.1在指令遵循与工具调用方面表现突出,8B指令模型性能媲美前代32B混合专家模型。语音模型实现业界领先转录准确率,视觉模型在表格与图表提取任务中排名靠前。Guardian模型提供有害内容检测能力,强化系统安全性。

此次更新体现企业AI向多模态、高集成工作流发展的趋势,支持开发者构建更灵活、高效的商用AI系统。

语言模型指令遵循能力显著提升 语音转录准确率达行业领先水平 视觉模型强化表格图表提取性能 Guardian模型集成有害内容检测机制
来源

查看原文 →