DeepSeek-R1以纯强化学习实现长思维链,被视作开启AI「下半场」的标志性模型;其开源策略与RL Scaling路径正重塑行业对推理模型训练与商业落地的预期,引发资本、科研及政策层面对开源生态的再评估。
谷歌AlphaGeometry2在IMO几何题上拿到84%金牌级表现,结合辅助作图与符号引擎的新范式显著超越纯LLM,证明专用推理系统已逼近人类顶尖水平,为科学发现与自动形式化验证打开新空间。
奥特曼确认GPT-4.5已就绪并将推年底全自主智能体,OpenAI内部编程模型跻身全球Top50,叠加o3-mini数学成绩领先,显示OpenAI正加速模型迭代与产品化以回应开源竞争。
MVoT、CoT-for-图像生成等新方法把链式推理扩展到视觉空间,使模型具备「想象」与自解释能力,在VQA、图像生成等任务上增益显著,预示下一代MLLM将走向统一的可视化推理架构。
吴恩达团队发布无需标注的目标检测Agent,通过语言-视觉对齐直接定位图像物体,打破传统CV对大量人工标签的依赖,为实时巡检、机器人等场景提供低成本落地路径。
Ilya旗下Safe Superintelligence仅5个月估值翻4倍至200亿美元,零收入却获顶级VC追捧,显示资本对安全超级智能的极度乐观,同时加剧市场对AGI泡沫与治理缺位的担忧。