2026-02-08
编程模型巅峰对决
OpenAI GPT-5.3-Codex与Anthropic Claude Opus 4.6同日发布,在Arena、Epoch双榜互有胜负,折射大模型编程能力评估复杂度,也预示代码生成进入“速度+稳健”双轨竞争新阶段。
2025-10-06
多模态大模型升级战
OpenAI、阿里、腾讯、字节等头部厂商密集发布新一代多模态模型:OpenAI Codex Alpha强化编程,阿里Qwen-VL-30B-3B提升数学与视频理解,腾讯混元图像3.0登顶LMArena文生图榜首,字节AI生视频突破4分钟时长,显示多模态能力正成为大模型竞争主战场。
2025-10-01
编程模型新标杆
Anthropic 与智谱相继推出 Claude Sonnet 4.5 与 GLM-4.6,均宣称“全球最强编码模型”,支持 30+ 小时长任务自主编程,API 价格不变。新模型在 SWE-bench、代码补全及复杂推理上刷新 SOTA,引发“百模大战”新一轮对齐竞赛,降低开发者成本。