scaling - AI话题 - AI快开门

2026-07-15

AI for Science与基础研究前沿

AI在基础科学研究中展现颠覆性潜力。Claude一夜破解困扰学界半年的弦论难题；中国“妈祖”气象大模型助力国际季风预警；Scaling Law在晶体结构等精细科研任务中暴露局限，催生Action Scaling新范式；从分子设计到催化模型，AI正深度嵌入科研核心流程。

2026-07-06

学术评测理论争议与产业生态

AI学术与产业生态深度调整，OpenAI Scaling Law原始论文被曝缺陷引发算力反思，Arena评测平台年入1亿美元印证评估标准价值；ICML、WWW等顶会颁发重要奖项，Meta关闭Llama公共API，关于模型护城河与评测体系的讨论日趋激烈。

Scaling Law 评测基准学术会议 ICML 产业生态

2026-06-27

模型底层机理与算法创新

多项研究挑战大模型传统认知：Octopus实现无需历史数据的持续学习，Qwen团队发现中间层推理优于末层，Lilian Weng系统批判Scaling Laws的脆弱性。视频生成模型的推理短板也被揭示。这些底层创新为突破当前架构瓶颈、提升模型效率与可靠性开辟新路径。

Scaling Laws 持续学习模型机理推理优化知识蒸馏

2026-06-26

大模型与算力基建竞争

OpenAI、DeepSeek等巨头围绕大模型与算力展开激烈角逐。OpenAI推出自研芯片并面临监管，DeepSeek扩招冲刺AGI；同时算力能耗与存储芯片短缺凸显，Scaling Law路径反思引发行业对预训练范式的重新审视。

大模型算力芯片 Scaling Law OpenAI 基础设施

2026-03-18

后Scaling时代模型效率革命

OpenAI、MiniMax、月之暗面等密集发布轻量化或自迭代模型，标志行业从堆算力转向拼Token效率与自我进化，降低门槛并加速落地。

小模型自进化 Token效率后Scaling 模型压缩

2026-03-04

开源框架与端侧AI爆发

OpenClaw以25.2万星登顶GitHub历史第一，阶跃星辰开源1960亿MoE模型Step3.5Flash，蚂蚁+清华发布AReaL强化学习框架，理想汽车提出端侧Scaling Law，标志开源生态与端侧部署进入“免训练、一键接入”新阶段，开发者门槛骤降。

OpenClaw 端侧Scaling 开源MoE AReaL GitHub

2026-03-02

多模态与Agent技术突破

DeepSeek V4、高通X105、OpenClaw等发布，原生多模态、Agentic架构与国产算力深度耦合，开启“跳过英伟达”的第三条Scaling路径，推动端侧智能与具身智能落地。

多模态 Agent DeepSeek 国产算力 Scaling

2026-01-21

资本与能源重构AI格局

OpenAI ARR两年翻10倍至200亿美元，算力Scaling Law验证；纳德拉称“token即商品”，能源成本决定国家AI竞争力；盖茨基金会5000万美元携手OpenAI补非洲医疗缺口，资本、能源、公益三重力量重塑全球AI价值链。

OpenAI收入能源Scaling token商品化非洲医疗资本

2026-01-20

AI服务器算力狂飙

OpenAI三年算力翻9.5倍至1.9GW，年营收同步冲破200亿美元，验证“算力即收入”Scaling Law。全球AI服务器2026年预计再增28%，数据中心从训练转向推理，电工、液冷等配套人才缺口同步放大。

算力 Scaling Law AI服务器 OpenAI 数据中心

2026-01-04

Scaling Law受挑战与架构创新

DeepSeek提出流形约束超连接(mHC)改造残差连接、KAN作者再发檄文反思暴力堆参数，显示行业开始探索不依赖纯规模扩张的新架构，有望降低训练成本并提升可解释性。

架构创新 Scaling Law 残差连接 DeepSeek

2026-01-02

算力军备竞赛升级

英伟达被实测性价比碾压AMD 15倍，DeepMind内部重申“算力即一切”，Scaling Law生死辩论再升温。硬件溢价与缺货同步发酵，5090等新品或涨价150%，预示2026年AI仍被算力卡脖子，得芯片者得模型。

英伟达 AMD Scaling Law 算力涨价

2026-01-01

Scaling Law瓶颈与范式反思

Ilya、Hinton、LeCun等顶级学者公开质疑“堆算力+堆参数”路线；NUS尤洋指出300亿美元也难再训出GPT-4级跃迁，行业需回归架构创新与理论突破，预示大模型竞赛从“暴力美学”转向效率与科学驱动。

Scaling Law 算力瓶颈架构创新理论突破

2025-12-21

2025大模型技术拐点

Karpathy、卡帕西等权威连续发声：o3、GPT-5、RLVR等标志大模型进入‘物理可验证’新阶段，Scaling Law仍在生效，行业潜力仅释放<10%，预示科研与产业应用同步爆发。

GPT-5 RLVR Scaling Law 物理实验拐点

2025-12-16

大模型训练范式革新

CMU、Mamba作者等团队提出“压缩即智能”、无预训练76K小模型登ARC-AGI榜三，OpenAI开源99.9%稀疏模型，挑战堆数据、堆算力传统Scaling Law，揭示推理能力可脱离巨量预训练，为低算力、高可解释新路线奠基。

无预训练压缩即智能稀疏模型 Scaling Law 可解释性

2025-12-07

Scaling终结与架构革新

Ilya、LeCun等顶尖学者公开宣告“纯靠堆参数”的Scaling Law进入收益递减期，行业开始转向原生多模态、视频推理、酶设计等新架构。NEO、Sora2、RFdiffusion2等模型验证“小算力+聪明结构”可超越传统大模型，标志AI研发范式从“越大越好”迈入“越巧越好”的新阶段，对芯片需求、创业路径和投资逻辑产生连锁冲击。

Scaling Law 原生多模态视频推理酶设计架构革新

2025-12-01

Scaling Law遇瓶颈

Ilya公开宣称“单纯堆参数已死”，SemiAnalysis爆料OpenAI两年半未跑出新一代前沿模型，引发行业对“后预训练”范式的集体反思，世界模型、持续学习、数据合成成为新焦点。

Scaling Law 预训练世界模型数据瓶颈 AGI

2025-11-27

Scaling时代终结

Ilya Sutskever等顶级研究者连续发声，认为仅靠堆参数、堆算力的“Scaling Law”已撞墙，AI需回归基础科学与新范式。观点引发行业共振，标志大模型竞争从‘暴力美学’转向‘科学探索’，或将重塑研发资源分配与创业逻辑。

Scaling Law 预训练基础研究范式转移 Ilya

2025-11-05

具身智能与机器人爆发

从导航大模型、灵巧手到人形整机，国内 NavFoM、美团 LongCat-Flash-Omni、字节火山引擎、小鹏 VLA 等集中发布；海外 Mimic Robotics 获 1600 万美元、Rivian 成立 Mind Robotics，马斯克秘密采集人类行为数据训练机器人，行业进入“Scaling Law”时代，零样本导航、端到端技能学习、高压线运维等场景快速落地，标志着通用机器人从实验室走向产业临界点。

具身智能人形机器人导航大模型 Scaling Law 字节火山引擎

2025-10-26

Transformer架构反思与后注意力时代

“Attention”作者公开呼吁告别Transformer，叠加NeurIPS高分论文用判别式监督重塑推理LLM，凸显社区对Scaling Law边际效应的担忧，后Transformer架构与训练策略成为下一波核心竞争点。

Transformer 架构创新推理LLM 判别式监督 Scaling Law

2025-07-06

下一代模型与推理突破

Grok 4、Meta新Scaling Law、集成20+算法的因果智能体等集中曝光，显示大模型在推理深度、效率优化及多算法融合上的最新突破，预示2025下半年将进入“强推理+多智能体”新阶段，对科研、医疗、金融等高价值场景带来颠覆潜力。

Grok4 ScalingLaw 因果智能体推理突破多算法融合

# scaling