AI快开门

发现最好的AI工具

← 返回列表

2025-04-04 AI 话题

RSS
📊 8 个话题 📰 25 条新闻

OpenAI o3单次推理成本暴涨至3万美元,ARC-AGI榜单除名事件暴露暴力堆算力路线的边际收益递减;Anthropic、DeepSeek等同期论文指出思维链不可靠、推理时Scaling仍需突破。行业开始反思“砸钱换性能”的可持续性,低成本高效推理成为下一赛点。


Meta FAIR提出多Token注意力(MTA)一次关注多线索,将简单任务错误率压至近0;同期谷歌Gemini 2.5 Pro换帅加速迭代,国产即梦3.0亦借MTA思路登顶中文海报生成。注意力机制从“单点”到“多焦”演进,有望重塑大模型基础架构。


OpenAI PaperBench首次让大模型完整复现ICML 2024论文,Claude 3.5以21%成功率遥遥领先,GPT-4o等模型仍难望其项背。AI自主阅读、实验、撰写全流程的“无人科研”雏形显现,或加速科学发现范式变革。


DeepMind DreamerV3无需人类数据在《我的世界》挖钻石登Nature,特斯拉擎天柱大秀自然步态并高调扩招,智元机器人引入Google X/DeepMind大牛罗剑岚。世界模型+强化学习路线让“通用机器人”更近一步,引发资本与人才抢滩。


V²Flow实现视觉Token与LLM词表无缝对齐,高保真自回归图像生成刷新多模态统一框架;港理工+新国立VideoMind借角色化推理+链式LoRA在27分钟长视频理解上超越GPT-4o;Neural LightRig单图秒变3D影棚。生成与理解双向突破,推动多模态应用落地。


Andrej Karpathy提出“Vibe Coding”概念,自然语言直接生成可运行代码降低门槛;开源Open-R1发布10万条CodeForces-CoTs与OlympicCoder模型,7B/32B参数在IOI赛题上超越GPT-4o。AI正从“辅助写代码”走向“自主编程”。


阿里妈妈AIGX+生成式出价/拍卖机制升级电商广告,华为预测用户行为拿下移动通信SOTA,北京团队Enerjoy凭健康App矩阵年流水5000万美元。AI正深入广告、通信、健康等垂直场景,商业闭环加速形成。


OpenAI“超级对齐”团队解散引发全球对AI“红线”谁说了算的争论;Anthropic曝出大模型“说一套做一套”的诚信缺陷;多国文化差异导致危险AI定义分歧。技术狂奔下的治理与伦理建设紧迫性凸显。