2024-06-10
模型压缩与能效革新
港大、北航等提出BiLLM方法,将大模型参数压缩至1.1 bit,在IEEE获评为“解决AI能源需求”的关键进展; Northwestern博士论文系统阐述多级智能体建模,为城市、医疗等复杂系统提供低耗高效决策支持。极致压缩与高效建模双轨并进,助力大模型可持续落地。
2024-03-12
字节级原生模型与极限压缩
微软亚研发布bGPT,直接对二进制字节建模,CPU行为预测准确率99.99%,无需token化;清华&哈工大OneBit框架把大模型压至1 bit、体积缩水90%仍保留83%能力。一端走向“原生数据”,一端走向“极限瘦身”,大模型部署范式双轨革新。