2025-09-04
AI硬件与终端创新
从硬币大小的Anker AI语音记录器、Nest新设备到特斯拉金色Optimus、洗碗人形机器人,硬件形态多点开花;华为麒麟9020三折叠、腾讯混元世界模型原生3D重建,显示AI正向可移动、可穿戴、家居与机器人端渗透,加速“模型-硬件-场景”闭环落地,带动供应链与消费级市场升级。
2025-07-20
3D重建与物理动画技术进展
KAUST提出V2M4,实现单目视频到4D网格动画秒级转换;港科大S3PO-GS解决户外单目SLAM尺度漂移;UIUC发布PhysRig,用可微物理绑定显著提升角色动画真实感,三项成果均入选ICCV 2025。
2025-03-24
多模态大模型技术突破
谷歌Gemini Live上线屏幕共享与实时视频交互,伯克利TULIP、腾讯混元-T1、阿里LHM等视觉-语言-动作模型集中发布,标志着多模态理解与生成交互进入可用阶段,为机器人、自动驾驶、3D内容创作打开新空间。
2025-03-21
AI for Science纵深:医疗、药物、3D重建齐突破
全球首款儿科大模型、AI检出早期胰腺癌、北大痤疮AI分级、浙大知识引导药物发现、西湖大学单目3D重建等成果集中发布,AI正从辅助诊断走向精准治疗与药物设计核心环节,科研范式转换加速。
2025-03-05
多模态生成与3D重建突破
即梦AI上线“动作模仿”一键视频生成,Fast3R实现千张图片秒级3D重建,微软开源多图层透明图片模型ART,DiffRhythm 10秒生成完整歌曲。多模态算法与工程优化并进,大幅降低内容创作成本,冲击影视、电商、XR等行业。
2024-12-14
国产 AI 游戏与 3D 生成
巨人网络发布“千影”大模型,文字或图片即可直出开放世界有声游戏;中科院 CityGaussianV2 实现显存友好级大规模 3D 场景重建。生成式 AI 正把游戏开发、数字孪生和城市建模的门槛降至“零代码”,可能颠覆内容产业生产管线。
2024-07-17
多模态大模型技术突破
国内外机构密集发布音频、视频、3D及视觉语言多模态模型,实现语音免文本交互、8秒高质量视频生成、零样本数字人等新能力,推动内容创作、自动驾驶、教育等场景落地。
2024-03-05
3D生成赛道爆发
DUSt3R、TripoSR等工具相继开源,实现单图或双图秒级3D重建,刷新GitHub热榜,降低游戏、XR、工业建模门槛,预示3D AIGC进入“可用即爆款”阶段。