2026-03-12
开源大模型进入“多模态+Agent”新阶段
英伟达Nemotron 3 Super、谷歌Gemini Embedding2、北大系寒序芯片等同步推进开源权重、多模态统一嵌入与推理加速,降低开发者门槛,挑战OpenAI/DeepSeek闭源体系,预示开源阵营将主导下一代AI基础设施。
2025-09-18
端侧小模型与推理优化潮
Meta发布MobileLLM-R1瞄准手机端小型推理,Groq融资7.5亿美元推超高速芯片,Ring-mini-2.0以1B参数超10B性能,显示“小而强”模型+专用硬件正成为边缘AI新趋势。