2025-11-23
算法优化与硬件加速
北大-华为-上财联合提出近线性时间聚类局部搜索算法,适用于大规模数据;IDEA研究院发布“万物可抓取”模型与国产GPU渲染器,打破国外垄断,共同提升AI计算效率与自主可控。
2025-06-04
多模态生成与编辑
扩散、流匹配等生成式模型在语音、视频、3D、跨模态转换上连续突破,实现局部无痕编辑、离线手机端运行、动漫化一键成片,标志“生成即服务”进入可商用阶段,将重塑内容产业生产链。
2025-05-07
AI视频生成再提速
Lightricks LTXV-13B、CausVid、ICML时空稀疏加速方案将视频生成速度提升30倍或实现秒级出片,消费级硬件可跑,预示短视频、广告、UGC内容生产流程将被彻底重塑。
2025-03-17
多模态与3D生成技术突破
港科大广州与趣丸提出Uni-Renderer单模型完成渲染+逆渲染,腾讯混元3D开源,Thera开源超分、LBM一键改光照去路人,CVPR 2025多篇论文推进跨模态因果对齐,内容创作门槛进一步降低。
2024-08-25
多模态大模型技术突破
Meta发布Transfusion统一文本-图像生成模型,融合Transformer与Diffusion架构,标志多模态AI进入“大一统”时代;同期Ideogram 2.0在文本渲染准确性上超越DALL·E与Midjourney,为开发者提供更高可控性,推动内容生产、广告设计及教育工具全面升级。
2024-08-15
行业应用与商业落地
火山引擎推出豆包大模型文旅解决方案,腾讯云2.52亿核小时渲染《白蛇:浮生》,联想连续两季利润增长,Wipro报告显示生成式AI带动云支出飙升,表明大模型正快速转化为可规模化的商业收入。
2024-01-12
端侧实时3D与智能系统
谷歌SMERF实现单iPhone实时厘米级300㎡场景NeRF渲染,千挂科技推出“脱手脱眼”L4重卡,荣耀发布AI内核操作系统MagicOS 8.0,显示大模型与实时感知、边缘计算结合,加速自动驾驶与移动设备体验升级。