2026-03-12

开源大模型进入“多模态+Agent”新阶段

英伟达Nemotron 3 Super、谷歌Gemini Embedding2、北大系寒序芯片等同步推进开源权重、多模态统一嵌入与推理加速,降低开发者门槛,挑战OpenAI/DeepSeek闭源体系,预示开源阵营将主导下一代AI基础设施。
2025-09-18

端侧小模型与推理优化潮

Meta发布MobileLLM-R1瞄准手机端小型推理,Groq融资7.5亿美元推超高速芯片,Ring-mini-2.0以1B参数超10B性能,显示“小而强”模型+专用硬件正成为边缘AI新趋势。
2025-09-08

AI硬件与芯片自研

马斯克xAI曝光3nm自研推理芯片X1,预计明年量产;ASML斥资13亿欧元控股Mistral,光刻机龙头深度绑定大模型;软硬一体趋势下,自研芯片成为模型厂商降本增效核心战略。