2026-02-27
国产模型全球爆发
MiniMax、月之暗面、快手可灵3.0等国产大模型周调用量首次超越美国,霸榜OpenRouter与视频生成双赛道;人民币走强叠加技术突破,显示中国AI从“跟跑”进入“领跑”窗口,全球算力与话语权格局生变。
2026-02-26
国产大模型密集升级
春节后阿里、MiniMax、可灵等集中发布新一代开源/闭源大模型,Qwen3.5横扫开源榜、可灵3.0视频基准夺冠、MiniMax推Expert2.0零代码Agent平台,标志国产模型在性能、多模态与易用性上全面冲刺,争夺开发者与行业客户。
2026-02-10
AI视频生成爆发
字节Seedance2.0、Xmax X1、阿里Qwen-Image-2.0等国产模型集中发布,实现导演级可控、毫秒级实时交互与2K质感生成,获冯骥等头部创作者点赞,标志AI视频进入生产力阶段,影视、短剧、广告等内容产业成本结构将被重写。
2026-02-02
AI视频/3D生成进入720p量产时代
xAI Grok Imagine 1.0率先实现10秒720p高清视频一键生成,谷歌Project Genie支持草图秒变可玩3D世界,叠加何恺明“一步像素直出”扩散新框架,内容创作门槛被大幅降低,短视频、游戏资产生态将迎来生产力革命。
2026-01-31
多模态大模型新范式
Emu3在Nature发文,仅用“预测下一Token”统一视觉-语言任务,挑战扩散模型霸权;阿里2步扩散提速40倍,SkyReels-V3开源一张图生成2K视频,标志多模态生成进入“快、统一、开源”新阶段,为AGI探路。
2026-01-29
国产大模型开源井喷
DeepSeek效应持续发酵,昆仑SkyReels-V3、蚂蚁LingBot-World、MiniMax Music 2.5等国产模型相继开源,覆盖视频、音乐、世界模型等多模态,推动中国成为全球开源高地。
2026-01-21
视频生成商业化爆发
快手可灵AI月活破1200万、2025年收入1.4亿美元,Medeo AI海外上线“自然语言拍大片”,美图AI闪光灯登顶出海榜,国产视频生成工具在C端付费与全球化上同时验证PMF,2026年迈入精品化与多模态控制新阶段。
2026-01-07
开源追赶闭源差距缩小
黄仁勋称开源大模型与闭源顶流仅差6个月,DeepSeek、Qwen、Kimi等中国模型在CES被老黄“点名验货”;Lightricks开源LTX-2可本地生成20秒4K同步音视频,开源生态加速缩小性能与体验差距。
2025-12-29
多模态与视频生成创新
字节开源StoryMem框架以“视觉记忆”实现多镜头一分钟叙事视频,角色场景一致不“变脸”;Insta360推出全景深度模型DAP,200万360°数据刷新空间智能;NVIDIA发布游戏基础模型NitroGen,视频-动作多模态应用持续拓宽内容创作与交互边界。
2025-12-26
多模态内容生成与交互体验升级
ChatGPT新增富文本块、小红书开源InstanceAssemble精准排版、快看AI互动漫画上线、TurboDiffusion单卡2秒出视频,显示多模态生成正从“能出图”走向“可控、可交互、可商用”的新阶段。
2025-12-25
AI视频生成提速200倍
清华与生数科技开源TurboDiffusion框架,通过稀疏注意力与SageAttention把扩散模型推理提速100-200倍,消费级显卡即可秒级生成高分辨率视频,成本与门槛骤降,有望引爆短视频、广告、游戏等UGC内容生态。
2025-12-24
AI for Science与视频生成效率革命
深势科技8亿融资、TurboDiffusion 200倍加速、VTP视觉分词器开源等进展,显示AI在科学计算与视频生成两大高算力场景实现“低成本秒级”跃迁,科研与创意内容生产门槛被快速抹平,AI正从“可用”走向“好用、敢用”。
2025-12-21
多模态与生成控制新范式
浙大ContextGen、CineCtrl、DualCamCtrl等研究实现布局-身份一致、相机运镜精准控制,把“生成”推向“可控工业级”,降低视频、图像创作门槛,支撑下一代内容生产管线。
2025-12-18
多模态视频生成升级
阿里通义万相2.6、字节Seedance 1.5 Pro等模型新增音画同步、多镜头叙事、角色一致性等功能,国产视频生成综合体验超越Sora 2,推动AIGC内容工业化生产。
2025-12-14
世界模型与多模态生成
Runway发布通用世界模型GWM系列,可同步模拟环境、人物与机器人操作;谷歌升级Gen-4.5,SIGGRAPH Asia亦展示30→200FPS的4D重建方案。生成式AI正从“出图”走向“出世界”,为影视、机器人和元宇宙提供可交互的物理一致场景,重新定义内容生产管线。
2025-12-12
视频/3D生成与多模态应用
Runway发布通用世界模型GWM-1,智谱开源视频生成核心技术,港大ViMax实现AI自编自导自演,谷歌升级虚拟试穿,Medeo AI推视频Agent一键改剧本,多模态生成从2D图像迈向可推理、可交互的3D世界,内容生产门槛进一步降低。
2025-12-08
多模态内容生成突破
苹果STARFlow-V、可灵AI主体库、阿里Qwen3-TTS、美团LongCat-Image等集中发布,实现30秒稳定视频、角色一致记忆、49种音色及中文图文编辑SOTA,多模态AIGC进入可用级时代。
2025-12-03
AI视频生成进入有声电影时代
Runway Gen-4.5、快手可灵O1、Kling 2.6等模型实现物理光影、重量感、多主体参考及原生音频同步生成,Elo评分登顶Video Arena,标志着AI视频从“无声短片”跃迁至可商用影视级制作,冲击传统内容工业。
2025-12-02
AI视频生成升级战
Runway Gen-4.5、PixVerse V5.5、可灵O1、爱诗科技等模型在光影物理、导演级分镜、音画同步上集体突破,120人团队盲测夺冠,宣告“秒级出片”进入工业可用阶段,冲击影视广告传统流程。