多模态推理 - AI话题

2026-03-29

BioReason-Pro首次将序列、结构、进化多模态信息整合进生成式推理框架，Zero-shot注释准确率超越UniProt人工审编，直接放大AI在“暗蛋白质组”中的发现空间，为靶点挖掘与药物设计提供可解释、可泛化的新基座。

2025-08-02

GPT-5真身Horizon Alpha、谷歌IMO金牌模型、阶跃Step-3、字节Seed Diffusion等密集曝光，数学、代码、多模态推理全面刷新SOTA，开源与闭源同步提速，标志基模型竞争进入“性能+效率+成本”三维决胜阶段。

2025-06-08

复旦等发布首个多模态逻辑推理基准，Gemini 2.5 Pro仅得60分；VL-Rethinker框架让视觉模型学会“三思后行”，超GPT-o1近7个百分点，揭示多模态推理仍是短板，慢思考成提升核心路径。

2025-01-25

百川智能推出国内首个全场景深度思考模型 Baichuan-M1-preview 及开源医疗增强模型 M1-14B，实现语言、视觉、搜索推理三合一，并在医疗循证领域达到新高度，加速 AI 医疗落地与生态开放。

2024-12-07

OpenAI连续发布“满血版”o1完全体与200美元/月的ChatGPT Pro，首次将多模态与强推理结合，并配套49页论文公开技术细节，被视为年内最重磅模型迭代，直接拉高商用AI订阅价格天花板，引发行业性能与商业模式双重震荡。

2024-06-24

OpenAI、Anthropic、华为等密集放出“博士级”大模型或下一代路线图，Claude-3.5-Sonnet、盘古5.0、ChatGPT新引擎在推理、多模态、科学任务上逼近或超越人类专家，标志基础模型进入“博士智能”阶段，将重塑科研、教育、专业服务等知识密集型行业。

2024-06-18

Runway Gen-3、Luma AI Extend、谷歌Video-to-Sound、Gemini 1.5 Pro在视频生成、音效合成与视频推理基准Video-MME上连创SOTA，标志着AI视频进入“有声高清+长时+强推理”时代，将重塑内容生产、广告、影视及教育赛道。

AI快开门