AI快开门

发现最好的AI工具

2024-06-10

模型压缩与能效革新

港大、北航等提出BiLLM方法,将大模型参数压缩至1.1 bit,在IEEE获评为“解决AI能源需求”的关键进展; Northwestern博士论文系统阐述多级智能体建模,为城市、医疗等复杂系统提供低耗高效决策支持。极致压缩与高效建模双轨并进,助力大模型可持续落地。
2024-03-12

字节级原生模型与极限压缩

微软亚研发布bGPT,直接对二进制字节建模,CPU行为预测准确率99.99%,无需token化;清华&哈工大OneBit框架把大模型压至1 bit、体积缩水90%仍保留83%能力。一端走向“原生数据”,一端走向“极限瘦身”,大模型部署范式双轨革新。
2024-02-29

端侧与消费级AI算力门槛骤降

英伟达RTX 500/1000 Ada移动工作站、微软1Bit三进制大模型、陈丹琦128k Llama-2推理优化等硬件与算法协同突破,使大模型可在本地低功耗运行,端侧AI应用即将规模化爆发。