← 返回列表

AI行业新闻简报 2025.06.03 周二

📊 6 个话题 📰 12 条新闻 🕐 2025-06-03 05:30

【概览】

微软BitNet v2与Mamba作者新注意力机制同步把大模型推理成本砍半,宣告“低价高密”算力拐点到来;CMU、Ubiquant 用零标注自进化训练突破数据枯竭瓶颈,数学推理暴涨100%。具身智能、中文原生创新、AI记忆框架与多模态评测齐头并进,AGI 正从实验室走向规模化落地。

01 | 大模型高效推理与量化

原生4bit几乎无损、注意力机制再瘦身,两条技术路线同日落地,云端与端侧部署成本直接减半,大模型进入“低价高密”新阶段,规模化商用最后一道算力屏障被击穿。

02 | 数据瓶颈与自进化训练

CMU 的 SRT 与 Ubiquant 熵最小化方法用“1 条数据 + 10 步优化”实现数学推理性能翻倍,彻底摆脱昂贵 RLHF,为互联网数据枯竭后的可持续 AGI 训练提供自进化范本。

03 | 具身智能与人形机器人落地

2025 智源大会首设全天具身智能论坛,MIT 乒乓球机器人 88% 命中率逼近人类顶级选手,感知-决策-执行闭环在硬件端跑通,人形机器人跨越实验室到产线爆发的临界点。

04 | 中文AI原生创新

哈工大手写传感器让大模型“写”懂汉字字形斩获 ACL 评审最高分,阿里通义开源 MaskSearch 框架使小模型在开放问答上媲美大模型,中文社区首次从“追跑”转向“定义标准”。

05 | AI记忆与遗忘机制突破

港中文提出统一记忆框架赋予大模型类脑长期记忆,港理工同时揭示“伪遗忘”漏洞并给出结构级删除方案,兼顾隐私与持续学习,推动大模型从对话工具向可信 Agent 演进。

06 | 多模态与评测基准

360 开源 1200 万细粒度图文对数据集 FG-CLIP,浙大等发布 5700 问空间智能评测基准,双双瞄准“模型幻觉”与“空间盲区”,为多模态大模型提供更高阶试金石。

【展望】

当量化与注意力革新把算力成本压到“白菜价”,自进化训练又解开数据枷锁,大模型已具备“随处可跑、无师自通”的商用条件;具身智能、中文原生创新、可信记忆框架与严苛评测基准同步成熟,AGI 正从“能用”走向“好用、可信、规模化”。下一步,行业焦点将转向安全治理与跨场景落地速度,低成本、高智能、可信赖的 AI 基础设施竞赛正式打响。