2026-03-01

多模态与长时智能体突破

Meta发布EgoAVU引擎,首次实现第一视角音视频同步理解,性能提升113%;Factory推出可连续运行40天的Missions智能体,完成端到端软件工程闭环。两项进展分别攻克“视听融合”与“长期自主”两大难题,把多模态感知与智能体可靠性推向新量级。
2026-02-28

国产多模态大模型爆发

DeepSeek V4、SkyReels-V4、MiniCPM-o-4.5 等国产多模态模型密集发布,原生支持图文影音生成,性能跻身全球 Top2,填补低成本开源空白,标志中国大模型从追赶进入第一梯队并率先卷向落地。
2026-02-27

AI硬件密集发布

阿里“千问”AI眼镜MWC首秀、Meta×Prada时尚智能眼镜传闻、魅族放弃手机All-in座舱AI,显示互联网与时尚巨头同步押注“多模态+可穿戴”新入口,AI硬件从概念验证进入品牌卡位赛。
2026-02-22

AI大模型军备竞赛升级

OpenAI、谷歌、Anthropic、xAI等头部公司密集发布新一代旗舰模型或硬件,性能指标刷新纪录,资本支出与估值同步飙升,标志着大模型进入多模态、高推理、低延迟的“次世代”较量,直接决定未来云与终端话语权。
2026-02-11

国产大模型密集上新

春节前后,阿里千问、讯飞星火X2、智谱GLM-5、百度ERNIE 5.0、蚂蚁Ming-Flash-Omni 2.0等国产大模型集中发布或升级,参数规模、多模态与落地场景全面提速,标志国产底座模型进入“军备竞赛”新阶段,直接牵动云算力、芯片、应用生态上下游。
2026-02-10

AI视频生成爆发

字节Seedance2.0、Xmax X1、阿里Qwen-Image-2.0等国产模型集中发布,实现导演级可控、毫秒级实时交互与2K质感生成,获冯骥等头部创作者点赞,标志AI视频进入生产力阶段,影视、短剧、广告等内容产业成本结构将被重写。
2026-02-09

顶级大模型性能争霸

Anthropic Claude Opus 4.6 在多项基准反超 GPT-5.2,阿里 Qwen3.5 将开源原生多模态版本,神秘 Pony Alpha 免费上线性能爆表,头部模型迭代速度缩短至季度级,能力边界从文本扩展到视觉、语音、科学推理全场景。
2026-02-07

多模态与世界模型突破

MiniCPM-o 4.5实现全双工“边看边说”,清华开源统一世界模型性能超硅谷40%,Waymo×DeepMind用Genie 3让自动驾驶“脑补”罕见场景。多模态实时交互与世界模型成为下一个主战场。
2026-02-05

多模态模型开源突破

上海AI Lab万亿参数Intern-S1-Pro、面壁MiniCPM-o4.5等全模态模型相继开源,推动科研与终端侧多模态能力普惠,降低行业创新门槛。
2026-02-02

多模态大模型技术突破

谷歌、DeepSeek、阶跃星辰等密集发布新一代多模态基座模型,在视觉Token效率、推理速度、Agent适配等维度刷新SOTA;世界模型与可交互虚拟环境同步成熟,标志着“一句话生成可执行宇宙”进入公测阶段,为游戏、自动驾驶、机器人提供通用模拟器。
2026-01-31

多模态大模型新范式

Emu3在Nature发文,仅用“预测下一Token”统一视觉-语言任务,挑战扩散模型霸权;阿里2步扩散提速40倍,SkyReels-V3开源一张图生成2K视频,标志多模态生成进入“快、统一、开源”新阶段,为AGI探路。
2026-01-30

开源多模态大模型爆发

商汤、蚂蚁、昆仑天工等集中开源多模态大模型,覆盖视频、语音、世界模型与法律垂直领域,性能对标或超越GPT-5.2、Genie 3,标志国产模型进入国际第一梯队,大幅降低行业落地门槛并加速生态繁荣。
2026-01-29

国产大模型开源井喷

DeepSeek效应持续发酵,昆仑SkyReels-V3、蚂蚁LingBot-World、MiniMax Music 2.5等国产模型相继开源,覆盖视频、音乐、世界模型等多模态,推动中国成为全球开源高地。
2026-01-25

AI for Science突破

复旦、西工大等团队分别在染色质三维结构预测与多模态分子表征取得SOTA,AI正成为基因组学与药物发现的基础设施;高门槛、高价值的科研场景反哺大模型技术迭代,打开长尾应用空间。
2026-01-24

国产大模型与多模态突破

百度2.4万亿参数文心5.0正式版登顶LMArena国产榜首,LeCun创业公司以RAE架构挑战Next-Token范式并获35亿美元估值,显示国产与学术派在大模型架构、多模态及商业化上正形成双轨突破。
2026-01-22

2.4万亿参数文心5.0全模态升级

百度发布2.4万亿参数的文心大模型5.0,采用原生全模态统一架构,实现文本、图像、视频、音频联合训练与生成,刷新国内模型规模与多模态融合天花板,为搜索、云、车、IoT等全线业务打开新空间。
2026-01-21

视频生成商业化爆发

快手可灵AI月活破1200万、2025年收入1.4亿美元,Medeo AI海外上线“自然语言拍大片”,美图AI闪光灯登顶出海榜,国产视频生成工具在C端付费与全球化上同时验证PMF,2026年迈入精品化与多模态控制新阶段。
2026-01-18

具身智能与机器人进展

UC伯克利新研究让机器人首次可靠使用洗碗机,展示多模态感知与长时序任务规划的突破;硬件+大模型融合加速家庭与服务业落地,为2026具身智能商业化打开想象空间。
2026-01-15

多模态生成进入4K竖屏时代

谷歌Veo 3.1原生支持竖屏4K,苹果Manzano打通“看懂+绘制”,国产PixVerse P1迈向通用级,视频、图像、语音一体化生成质量跃升,短视频、广告、教育等内容产业迎来零门槛AIGC。
2026-01-14

国产多模态大模型突破

智谱-华为开源首个全流程国产芯片训练的SOTA多模态模型GLM-Image,采用自回归+扩散解码器混合架构,在国产昇腾芯片上完成训练,实现图像生成与语言模型深度融合,标志着国产算力与算法协同的重大进展,对打破国外技术垄断具有重要意义。