2025-04-22
低成本AI应用普及
微软1bit 2B模型0.4GB内存可跑,PPIO提出“AI提速降费”,真我Bud Air7 Pro翻译耳机支持32种语言,AI正从“云端大参数”转向“边缘小快灵”,降低门槛激活长尾场景。
2025-04-21
大模型推理与幻觉治理
OpenAI o3/o4-mini在代码推理刷新纪录的同时,幻觉率飙升至33%,引发RL过度优化质疑;清华Hyper-RAG以超图增强知识关联,显著降低幻觉。行业共识:推理性能与可信度需同步提升,RAG、搜索-推理协同及原生1bit轻量化成为新方向,将决定大模型在医疗、法律等高可靠场景的落地速度。
2025-04-21
轻量化与端侧AI突围
微软BitNet b1.58 2B4T、Intel AI Playground、Gemma 3 QAT等原生低比特模型开源,0.4GB内存+单CPU即可跑2B参数,性能媲美全精度;Arc核显、3090消费级显卡成为边缘AI新算力,推动PC、智能音箱、IoT设备本地跑大模型,降低云成本与隐私风险,加速AI普惠。