2026年04月03日

使用Veo 3.1 Lite构建,我们最具成本效益的视频生成模型

使用Veo 3.1 Lite构建,我们最具成本效益的视频生成模型 | Gemma 4:逐字节对比,性能最强的开源模型 | 微软推出三款新基础模型挑战AI对手
分类筛选:

01 使用Veo 3.1 Lite构建,我们最具成本效益的视频生成模型

  1. 谷歌推出Veo 3.1 Lite视频生成模型,作为其最具成本效益的视频生成方案,价格低于Veo 3.1 Fast的一半,但保持相同运行速度。该模型支持文本生成视频和图片生成视频,提供横屏(16:9)与竖屏(9:16)比例,以及720p和1080p分辨率输出。用户可自定义视频时长为4秒、6秒或8秒,费用相应调整。该模型面向开发者,旨在支持高并发视频应用开发,已于今日通过Gemini API和Google AI Studio的付费层级开放使用。
Veo 3.1 Lite成本低于Fast版一半 支持文本与图片生成视频 提供多种分辨率与时长选项
来源
  1. 谷歌宣布自4月7日起降低Veo 3.1 Fast模型的定价,进一步降低开发者集成视频生成功能的门槛。此举配合Veo 3.1 Lite的发布,完善了Veo 3.1系列模型的产品线,使开发者可根据性能与成本需求灵活选择。公司强调将持续推动视频生成技术的可及性,并预告未来将有更多更新。
Veo 3.1 Fast将于4月7日降价 完善Veo 3.1系列模型布局 提升开发者接入便利性
来源

查看原文 →

02 Gemma 4:逐字节对比,性能最强的开源模型

  1. Google发布新一代开源AI模型Gemma 4,旨在提供每参数最高智能水平,专为高级推理和自主代理工作流设计。该模型基于Gemini 3的技术研发,包含四个版本:E2B、E4B、26B MoE和31B Dense,适用于不同硬件环境。31B模型在Arena AI文本排行榜上位列全球开源模型第三,26B模型排名第六,性能超越参数规模大20倍的模型。Gemma系列自初代发布以来已被下载超4亿次,衍生出超10万种变体。新模型采用Apache 2.0许可,强调可访问性与开放性,支持边缘设备低延迟运行,推动移动端AI应用发展。
Gemma 4为Google最强开源模型 31B模型全球开源排名第三 支持边缘设备低延迟运行 采用Apache 2.0开源许可
来源

查看原文 →

03 微软推出三款新基础模型挑战AI对手

  1. 微软AI研究实验室于周四发布三款基础AI模型,分别为MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2,支持文本、语音和图像生成。MAI-Transcribe-1支持25种语言语音转文字,速度是Azure Fast的2.5倍;MAI-Voice-1可在1秒内生成60秒音频并支持自定义声音;MAI-Image-2为视频生成模型,已于3月19日在MAI Playground上线,现三款模型均接入Microsoft Foundry平台。这些模型由Mustafa Suleyman领导的MAI Superintelligence团队开发,该团队于2025年11月成立。微软强调其“以人为本”的AI理念,并指出新模型在成本上较谷歌和OpenAI更具竞争力。
三款多模态AI模型正式发布 支持语音转写、音频与视频生成 强调低成本与实用性优势
来源
  1. 微软宣布其AI模型将通过Microsoft Foundry和MAI Playground平台提供服务,其中MAI-Image-2已于3月19日率先在MAI Playground上线。MAI Playground被定位为大型语言模型测试软件,现整合转录与语音生成功能。公司表示未来将有更多模型直接集成至微软产品中。此举显示微软正加速构建自主多模态AI技术栈,以在竞争激烈的生成式AI市场中与OpenAI、谷歌等对手抗衡,尽管其仍与OpenAI保持合作关系。
模型通过Foundry和Playground平台发布 MAI Playground支持模型测试与体验 未来将深度集成至微软产品线
来源
  1. 微软AI负责人Mustafa Suleyman在博客中阐述其“人文主义AI”理念,强调模型设计以人类沟通方式为中心,注重实际应用场景。MAI Superintelligence团队作为开发主体,于2025年11月成立,直接向Suleyman汇报。微软指出,新模型定价低于谷歌与OpenAI同类产品,意在以成本优势吸引企业用户。尽管未披露具体定价或性能基准数据,但公司明确将价格作为市场竞争关键策略之一。
提出“人文主义AI”设计理念 强调模型实用性与人类沟通优化 以低成本策略应对市场竞争
来源

查看原文 →