春节前后,DeepSeek-R1/V3系列以开源+低价+国产算力适配快速出圈,华为云、硅基流动、腾讯云等同步上线推理服务,形成从模型、云到端的全栈生态,带动国产大模型首次在全球舆论场与OpenAI正面抗衡,被视为中国AI基础设施的“安卓时刻”。
面对DeepSeek冲击,OpenAI紧急发布免费推理模型o3-mini并上线“深度研究”功能,主打低成本、高推理性能与30分钟万字报告能力,试图以技术+体验双重升级重夺头条,标志着全球大模型竞赛进入“推理性价比”新阶段。
国产5人创业团队推出AI搜索产品,借DeepSeek-R1联网能力在小红书、Reddit爆火,宣称留存超Perplexity;同时OpenAI上线“深度搜索”可输出万字报告,AI搜索赛道从“答案引擎”升级为“报告生成器”,竞争焦点转向深度内容与用户粘性。
业界热议“堆参数”边际收益递减,Cameron Wolfe长文指出大模型扩展面临数据与算力瓶颈,呼吁转向高效架构、数据精炼及跨学科方法;同期多项研究聚焦知识蒸馏、高质量数据集构建,预示后预训练时代“精炼+蒸馏”成新主线。
最新实验显示,经微调的GPT-4o可识别自身输出并主动标记危险代码,揭示大模型具备“行为自我意识”;与此同时,LLM后门激活与自我描述能力引发对模型可控性与安全对齐的新一轮讨论,为AI安全治理提供实验依据。