2026-02-10

端侧模型极致压缩

腾讯混元发布0.3B 2Bit产业级端侧模型,内存<600MB;华为推出扩散语言模型Agent,部分场景提速8倍;清华&千问重塑归一化让Transformer深度回归,推动大模型在消费级硬件与边缘场景落地,端侧智能迎来“可用”拐点。
2025-03-15

Transformer架构革新

何恺明与LeCun团队提出DyT,用9行代码移除归一化层,性能不降反升,已被CVPR 2025收录;同期清华开源「赤兔」推理引擎,国产软硬协同加速落地。双重突破挑战Transformer「标配」认知,为高效大模型训练与端侧部署打开新路径。