2025-11-25
国产全模态/多模态模型加速开源
昆仑元发布BaiZe-Omni-14b-a2b全模态融合模型;哈深Uni-MoE-2.0-Omni实现文本、图像、音频统一SOTA;腾讯开源1B参数HunyuanOCR刷新多项记录。国产模型以轻量参数、全模态能力、开源策略快速迭代,降低行业落地门槛,对下游应用与开发者生态形成强支撑。
2025-11-21
多模态大模型军备竞赛
OpenAI、谷歌、腾讯、Meta 72 小时内连环发布 GPT-5.1/Codex-Max、Gemini 3 系、HunyuanVideo 1.5、SAM-3D 等旗舰模型,上下文窗口、视频生成、3D 理解同步刷新 SOTA。巨头以「周」为单位迭代,标志生成式 AI 进入多模态长序列新战场,直接决定云算力需求与开发者生态归属。
2025-10-01
开源多模态与稀疏注意力
腾讯开源 80B 参数 HunyuanImage 3.0,宣称开源最强生图模型;DeepSeek 发布 V3.2,引入 DSA 稀疏注意力并 API 五折。两大开源项目推动图像与长文本生成成本骤降,加速下游应用落地,并挑战闭源模型性价比。
2025-07-08
多模态大模型技术突破
阿里HumanOmniV2、腾讯Hunyuan3D-PolyGen、Vidu Q1等国产多模态模型在视频生成、3D建模、参考生成等方向取得SOTA成绩,标志国内从单模态追赶转向多模态并跑,奠定下一代内容生产基础设施。
2025-06-30
端侧/小模型提速
腾讯Hunyuan-A13B、华为盘古7B/72B及2700万参数推理模型相继开源,小尺寸+高性能路线降低部署成本,为端侧与私域场景提供新选择。
2025-02-24
视频/多模态生成新SOTA
Meta V-JEPA、腾讯Hunyuan Video、Pixverse V4.0、海螺AI导演模式等国产视频模型密集迭代,支持同步音效、转绘、导演级控制;谷歌Veo 2成本曝光一分钟30美元,国产方案正实现“更快更省”的AI影视制作。
2024-12-21
视频生成大模型提速
腾讯开源混元视频模型被社区优化为FastHunyuan,生成步骤从50步压缩至6步,速度提升8倍,官方预告下月推出图生视频功能,国内视频AIGC进入“分钟级”可用阶段,创作门槛进一步降低。