2025-12-21
2025大模型技术拐点
Karpathy、卡帕西等权威连续发声:o3、GPT-5、RLVR等标志大模型进入‘物理可验证’新阶段,Scaling Law仍在生效,行业潜力仅释放<10%,预示科研与产业应用同步爆发。
2025-11-30
多模态感知与文档智能升级
腾讯混元开源1B参数HunyuanOCR,统一检测+识别+理解端到端架构,ICDAR 2025夺冠;视觉CoT新范式让VLM具备人类-like思考链;Spatial-SSRL进一步提升大模型空间理解能力。多模态感知进入“轻量级+高精度+强语义”时代,文档、图像、3D场景一网打尽。
2025-11-18
AI科研自动化突破
Sakana AI“AI科学家”可自主提出假设、做实验并撰写论文,12小时完成半年科研任务,准确率79.4%;Transformer作者创业团队揭示RLVR稀疏更新机制。AI正从科研辅助转向“共同作者”,加速科学发现范式变革。
2025-11-12
模型效率与训练范式之争
NeurIPS满分论文质疑RLVR,阿里、清华、月之暗面用异步PPO、图像压缩、低成本H800训练证明“数据工程+基座”优于堆算力,开源社区加速复现o1级推理。
2025-10-25
大模型训练效率革命
数据集蒸馏WMDD/GUARD用10%样本保持全量性能;斯坦福AgentFlow让7B模型在线强化学习超越GPT-4o;北大RiskPO针对低概率高信息路径优化后训练。三大研究齐指“降本增效”,缓解算力焦虑。
2025-10-23
多模态大模型竞速
阿里Qwen、字节Seed 3D、腾讯WorldMirror等密集发布多模态/3D生成大模型,性能与落地场景全面内卷,推动AIGC进入3D与实时交互时代。
2025-10-22
长文本与推理效率突破
DeepSeek-OCR用视觉压缩颠覆分词器,北大华为LouisKV将长序列推理提速4.7倍,复旦Game-RL用游戏数据增强VLM推理,长上下文与推理成本难题出现新解法。
2025-10-08
AI安全与开源工具链
Anthropic开源Petri框架,可自动审计模型安全;谷歌新语音搜索跳过ASR直接检索,减少误差;Verlog强化学习框架为LLM智能体训练提速,共同推动AI安全与开源基础设施成熟。
2025-10-07
记忆与Agent基础设施
Supermemory获260万美元融资,打造通用AI记忆API,让任何Agent具备跨会话长期记忆;综述指出大模型缺乏行动能力,Agentic强化学习成为补齐短板的新方向。记忆层与Agent框架的完善,为构建可持续学习、可商业落地的智能体提供基础设施,吸引资本与研究者加速布局。
2025-10-04
机器人学习开源井喷
英伟达在 CoRL 大会一次性开源 Newton 物理引擎、Isaac GR00T N1.6 基础模型及 Cosmos 数据生成平台,与 Google DeepMind、迪士尼共建“物理直觉”生态;斯坦福 DexUMI 框架让机器人通过观察人手完成采茶、做早餐等精细任务,获最佳论文提名。仿真、数据、模型全链路开源将显著降低机器人研发门槛。
2025-09-13
顶尖AI人才流动与产业信号
27岁清华姚班、OpenAI核心研究员姚顺雨确认离职,或回国加入大厂或创业,引发中美AI人才竞夺新波澜;同时Arm、字节-交大等团队加速芯片与RL训练优化,预示“人才+硬件”双轮驱动将重塑下一波模型竞赛。
2025-09-11
开源模型与推理加速突破
阿联酋K2 Think以320亿参数实现2000 tokens/秒刷新开源速度纪录;月之暗面开源Checkpoint Engine可在20秒内热更新万亿模型;清华提出ReST-RL统一强化学习范式,显著改善LLM推理一致性,开源生态正从“可用”迈向“高效”与“可信”。
2025-09-03
端到端自动化开发工具突破
MetaGPT发布RealDevWorld端到端测试框架,在真实开发环境精准度达92%,OpenAI组建应用团队并11亿美元收购Statsig,美团开源Longcat-Flash-Chat强化Agent工具调用,标志着大模型正从“对话”走向“自动完成工程交付”。
2025-08-30
智能体与推理范式演进
吴恩达疾呼“并行智能体”成新重点,多agent协同分析、编码、监督可指数级提效;Karpathy点赞开源Environments Hub,为RL与LLM交互提供标准化“世界接口”。当单模型性能逼近瓶颈,环境+多agent的“系统级智能”被视为AGI下一跳。
2025-06-22
开源多模态与强化学习
OpenUni 1.1B多模态模型开源性能媲美8B BLIP3-o;同期RLHF→PPO→GRPO系统指南发布,降低推理模型训练门槛,推动中小团队低成本复现顶尖效果,加速社区创新。
2025-06-06
AI硬件与底层优化
AMD收购Brium挑战英伟达、华为CloudMatrix 384超节点训推共卡提速50%、清华蚂蚁开源全异步RL框架AReaL,显示AI芯片与系统级优化成为大厂争夺下一波算力红利的主战场,国产方案开始崭露头角。
2025-06-04
算力与训练效率革新
华为MoE训练提速70%、智源Video-XL-2单卡万帧理解、英伟达RL Scaling翻倍推理能力,算法-系统协同优化显著降低大模型训练与推理成本,为行业规模扩张提供可持续算力方案。
2025-06-02
数据瓶颈与自进化训练
CMU的SRT与Ubiquant熵最小化方法相继实现“零标注”自迭代,数学推理暴涨100%,10步即可收敛,宣告后训练告别昂贵RLHF,为互联网数据枯竭背景下的AGI路径提供可持续方案。
2025-05-29
多模态大模型技术突破
通义 OmniAudio 从 360° 视频生成空间音频,Meta Multi-SpatialMLLM 刷新空间理解,MiniMax 开源 V-Triune 统一视觉 RL,清华-腾讯 RBench-V 暴露画图短板,多模态进入“视听空间”新战场。