AI快开门

发现最好的AI工具

2025-06-02

大模型高效推理与量化

微软BitNet v2实现原生4bit量化几乎无损,Mamba作者提出Grouped-Tied Attention专为推理加速,两条路线同步把大模型部署成本砍半,为端侧和云端规模化落地扫清算力障碍,行业进入“低价高密”新阶段。
2025-04-30

AI编程颠覆开发者生产力

微软CEO官宣30%代码由AI生成,Claude Code实测79%前端任务可自动完成,小米MiMo 7B在奥数与代码生成上越级打平320B模型,低精度BitNet v2进一步降低本地部署门槛,预示“人类只改Bug”时代加速到来。
2025-04-21

轻量化与端侧AI突围

微软BitNet b1.58 2B4T、Intel AI Playground、Gemma 3 QAT等原生低比特模型开源,0.4GB内存+单CPU即可跑2B参数,性能媲美全精度;Arc核显、3090消费级显卡成为边缘AI新算力,推动PC、智能音箱、IoT设备本地跑大模型,降低云成本与隐私风险,加速AI普惠。
2025-04-18

端侧 AI 与硬件加速

微软 1-bit BitNet 仅 0.4GB 内存跑 2B 模型,联发科天玑 9400+ 提出 AGENTIC AI UX,RTX 5060 Ti 凭 DLSS 4 本地跑 32B 大模型,显示“手机+PC”端侧轻量化部署进入实用阶段。