2025-08-02
下一代旗舰大模型冲刺
GPT-5真身Horizon Alpha、谷歌IMO金牌模型、阶跃Step-3、字节Seed Diffusion等密集曝光,数学、代码、多模态推理全面刷新SOTA,开源与闭源同步提速,标志基模型竞争进入“性能+效率+成本”三维决胜阶段。
2025-06-08
多模态慢思考与评估基准
复旦等发布首个多模态逻辑推理基准,Gemini 2.5 Pro仅得60分;VL-Rethinker框架让视觉模型学会“三思后行”,超GPT-o1近7个百分点,揭示多模态推理仍是短板,慢思考成提升核心路径。
2025-01-25
医疗大模型开源突破
百川智能推出国内首个全场景深度思考模型 Baichuan-M1-preview 及开源医疗增强模型 M1-14B,实现语言、视觉、搜索推理三合一,并在医疗循证领域达到新高度,加速 AI 医疗落地与生态开放。
2024-12-07
OpenAI o1系列升级与高价Pro版
OpenAI连续发布“满血版”o1完全体与200美元/月的ChatGPT Pro,首次将多模态与强推理结合,并配套49页论文公开技术细节,被视为年内最重磅模型迭代,直接拉高商用AI订阅价格天花板,引发行业性能与商业模式双重震荡。
2024-06-24
顶级模型能力跃迁
OpenAI、Anthropic、华为等密集放出“博士级”大模型或下一代路线图,Claude-3.5-Sonnet、盘古5.0、ChatGPT新引擎在推理、多模态、科学任务上逼近或超越人类专家,标志基础模型进入“博士智能”阶段,将重塑科研、教育、专业服务等知识密集型行业。