2025-06-02
大模型高效推理与量化
微软BitNet v2实现原生4bit量化几乎无损,Mamba作者提出Grouped-Tied Attention专为推理加速,两条路线同步把大模型部署成本砍半,为端侧和云端规模化落地扫清算力障碍,行业进入“低价高密”新阶段。
2025-04-30
AI编程颠覆开发者生产力
微软CEO官宣30%代码由AI生成,Claude Code实测79%前端任务可自动完成,小米MiMo 7B在奥数与代码生成上越级打平320B模型,低精度BitNet v2进一步降低本地部署门槛,预示“人类只改Bug”时代加速到来。
2025-04-21
轻量化与端侧AI突围
微软BitNet b1.58 2B4T、Intel AI Playground、Gemma 3 QAT等原生低比特模型开源,0.4GB内存+单CPU即可跑2B参数,性能媲美全精度;Arc核显、3090消费级显卡成为边缘AI新算力,推动PC、智能音箱、IoT设备本地跑大模型,降低云成本与隐私风险,加速AI普惠。