OpenAI在12天直播压轴发布新一代推理模型o3及轻量版o3-mini,数学、编程能力逼近人类顶尖水平,高算力模式下每任务成本数千美元,标志着通用人工智能(AGI)探索再下一城,引发全球开发者与资本高度关注。
谷歌推出Gemini 2.0 Flash Thinking,主打“快思考”——推理速度提升5倍,可实时展示思考链,数学、物理、摩斯码等多模态难题秒级解决,直接对标OpenAI o1,加速大模型竞技进入“秒回”时代。
百度HelixFold 3升级,生物分子结构预测精度媲美AlphaFold 3;生成式物理引擎Genesis实现一句话精准仿真,为材料、药物、机器人研究提供高保真模拟平台,AI驱动科研进入“生成即实验”阶段。
阿里云百炼平台上线音视频实时互动能力,Meta发布统一视觉理解与生成的MetaMorph模型,生成式物理引擎Genesis一句话生成高精度仿真视频,显示多模态大模型正从实验室快速走向场景落地。
微软Phi-4预训练采用40%合成数据,14B参数模型逼近70B效果;DeepMind提出逆向思维微调提升LLM推理能力,显示高质量合成数据与新型训练策略正成为突破Scaling Law的重要方向。
腾讯开源混元视频模型被社区优化为FastHunyuan,生成步骤从50步压缩至6步,速度提升8倍,官方预告下月推出图生视频功能,国内视频AIGC进入“分钟级”可用阶段,创作门槛进一步降低。
2024年微软被曝购入近50万块英伟达GPU,全球第一,xAI首批GB200 NVL72到货晒图,云与巨头持续加码高性能算力,为下一代大模型与AGI冲刺奠定硬件基础,芯片供应链成为AI竞争胜负手。