2025-01-19
扩散模型极限量化突破
MPQ-DM团队把扩散模型权重压缩至2-4位,在W2A4精度下FID再降58%,生成质量仍媲美全精度,为端侧超高清文生图、视频生成铺平道路;同期NYU/MIT/谷歌提出“测试时计算”新Scaling Law,扩散模型推理阶段可动态加码,性能直冲天花板,标志着生成式AI进入“后训练+后推理”双轮时代。
2025-01-12
扩散模型极致压缩
北航与ETH提出BiDM,首次将扩散模型权重与激活完全二值化至1 bit,存储节省28倍、推理加速52倍,为端侧高保真生成铺平道路,或重塑AIGC部署格局。
2025-01-05
端侧高分辨率生成模型突破
Snap发布手机端秒级高分辨率图像生成模型SnapGen,标志着端侧AIGC能力再上新台阶,将推动社交、广告、电商等内容生产链条去云端化,降低算力成本并提升隐私安全,为移动端创意应用打开新空间。