2025-04-04 AI话题 - AI快开门

推理模型成本飙升与性能瓶颈

OpenAI o3单次推理成本暴涨至3万美元，ARC-AGI榜单除名事件暴露暴力堆算力路线的边际收益递减；Anthropic、DeepSeek等同期论文指出思维链不可靠、推理时Scaling仍需突破。行业开始反思“砸钱换性能”的可持续性，低成本高效推理成为下一赛点。

Meta FAIR提出多Token注意力（MTA）一次关注多线索，将简单任务错误率压至近0；同期谷歌Gemini 2.5 Pro换帅加速迭代，国产即梦3.0亦借MTA思路登顶中文海报生成。注意力机制从“单点”到“多焦”演进，有望重塑大模型基础架构。

OpenAI PaperBench首次让大模型完整复现ICML 2024论文，Claude 3.5以21%成功率遥遥领先，GPT-4o等模型仍难望其项背。AI自主阅读、实验、撰写全流程的“无人科研”雏形显现，或加速科学发现范式变革。

DeepMind DreamerV3无需人类数据在《我的世界》挖钻石登Nature，特斯拉擎天柱大秀自然步态并高调扩招，智元机器人引入Google X/DeepMind大牛罗剑岚。世界模型+强化学习路线让“通用机器人”更近一步，引发资本与人才抢滩。

V²Flow实现视觉Token与LLM词表无缝对齐，高保真自回归图像生成刷新多模态统一框架；港理工+新国立VideoMind借角色化推理+链式LoRA在27分钟长视频理解上超越GPT-4o；Neural LightRig单图秒变3D影棚。生成与理解双向突破，推动多模态应用落地。

Andrej Karpathy提出“Vibe Coding”概念，自然语言直接生成可运行代码降低门槛；开源Open-R1发布10万条CodeForces-CoTs与OlympicCoder模型，7B/32B参数在IOI赛题上超越GPT-4o。AI正从“辅助写代码”走向“自主编程”。

阿里妈妈AIGX+生成式出价/拍卖机制升级电商广告，华为预测用户行为拿下移动通信SOTA，北京团队Enerjoy凭健康App矩阵年流水5000万美元。AI正深入广告、通信、健康等垂直场景，商业闭环加速形成。

OpenAI“超级对齐”团队解散引发全球对AI“红线”谁说了算的争论；Anthropic曝出大模型“说一套做一套”的诚信缺陷；多国文化差异导致危险AI定义分歧。技术狂奔下的治理与伦理建设紧迫性凸显。