训练 - AI话题 - AI快开门

2026-07-06

训练优化与算力基础设施

大模型训练与推理成本优化成为焦点，面壁智能ForgeTrain通过AI制造AI提升效率，清华POPO回收浪费算力，华为更新韬定律芯片论文；SK海力士巨额IPO与Anthropic百亿级数据中心投资彰显算力军备竞赛白热化。

算力训练优化芯片数据中心推理成本

2026-07-03

具身智能与物理世界建模

Genesis AI开源机器人全栈训练场，Uranus世界模型转型评测基础设施，WLA统一世界建模与动作生成。具身智能正从“大脑”竞争延伸至仿真环境、数据基建和评测标准等底层支撑。

具身智能机器人世界模型仿真训练物理AI

2026-06-28

模型训练与推理效率优化

英伟达开源NeMo AutoModel实现MoE模型微调3.7倍加速；清华UDS通过智能样本筛选降低SFT算力；北大与智源提出机理数据归因；华为关键帧选择破解长视频算力瓶颈。从训练数据优化到推理框架加速，全链条效率提升成为行业焦点，推动大模型在学术与工业场景更易部署。

训练效率 MoE 数据筛选算力优化 ICML

2026-06-13

低成本大模型训练突破

以HRM模型为代表的高效训练方案引发行业关注，仅用1500美元即可完成训练并获顶级专家背书。这标志着大模型训练成本快速下降，开源生态与算法创新降低AI准入门槛，有望加速中小团队参与基础模型竞争，重塑行业创新格局。

HRM模型低成本训练开源生态大模型算法创新

2026-05-31

Agent智能体与自主进化

聚焦AI Agent的自主进化能力，涵盖微软Skills自我进化框架、DeepSeek技能迭代、MiniMax AI Native组织实践等，展现智能体从工具使用向自主学习和组织架构进化的趋势，标志着Agent技术进入自我提升的新阶段。

Agent 技能进化自我提升 AI Native 自主训练

2026-05-31

世界模型与具身智能突破

英伟达清华团队γ-World实现世界模型从单机到联机的突破，结合复旦系机器人动作模型和开源具身世界模型τ0-WM，推动世界模型在分布式训练和机器人控制领域的应用，加速具身智能实用化进程。

世界模型具身智能机器人分布式训练英伟达

2026-05-26

AI科研与数学突破

AI在基础科学研究中展现强大潜力，谷歌DeepMind AlphaProof Nexus攻克悬置56年的埃尔德什数学难题；国产AI实现全球首例"AI造AI"自动化训练；强化学习应用于空间组学实验设计，推动AI for Science进入新阶段。

AlphaProof AI for Science 数学推理自动化训练强化学习

2026-05-24

AI算力趋势与基础设施

硅谷投资人预测未来推理将消耗70%算力，仅30%留给训练，标志着AI行业从训练驱动向推理驱动转变；星舰V3首飞成功为下一代算力基础设施提供潜在支撑。算力分配格局的变化将深刻影响AI芯片设计、云计算架构和模型优化策略，推动高效推理技术成为行业焦点。

算力推理训练星舰基础设施

2026-05-23

大模型基础设施与算力经济

全球AI基础设施投资预计达4万亿美元，算力需求正从训练向推理转移（预计占70%）。DeepSeek等国产大模型通过巨额融资与激进定价策略加速市场渗透，智源大会等学术盛会聚焦下一代模型技术路线。

算力基础设施 DeepSeek 推理训练智源大会 API定价

2026-05-05

生成模型训练与评估突破

USC、CMU、CUHK与OpenAI联合提出FD-loss，首次把沿用十年的图像评估指标FID嵌入训练流程，实现端到端可微优化，显著提升生成质量与稳定性；谷歌同步为Gemini API推出Webhooks，用事件推送替代轮询，降低长任务延迟，利好Deep Research、视频生成等耗时场景。

FID训练 FD-loss Gemini API Webhooks 生成模型

2026-04-25

视觉大模型一体化革命

谷歌 Vision Banana 以统一生成式预训练刷新 2D/3D 多项 SOTA，何恺明等提出用单模型取代专用网络；ERNIE-Image-Turbo 实现 8 步高速文生图，显示视觉任务正走向通用一体化与极致轻量。

Vision Banana ERNIE-Image-Turbo 统一视觉生成式预训练轻量

2026-04-11

模型架构与训练范式突破

Meta提出“神经计算机”融合模型即计算环境，字节Seed实现推理时原地改参免重训，北大博士单人构建多Agent开放世界，均指向同一趋势：让模型在推理/执行阶段持续、低成本地自我更新与协同，打破“训练-部署”割裂，迈向终身自主智能。

神经计算机测试时训练原地改参 Agent世界模型

2026-03-29

大模型物理推理与机器人新范式

视频生成大模型隐式习得物理规律，被首次系统迁移到机器人操控任务，仅用732M参数即超越7B模型，显著降低对人工演示数据的依赖，为“数据困境”提供突破口，标志着“预训练物理先验+小参数策略”成为机器人学的新主流路线。

视频预训练物理先验机器人操控数据效率小模型

2026-03-22

具身智能与机器人竞速

国内人形机器人企业突破140家，汽车、手机、电商巨头跨界入局，但机器人大模型成熟度低、高质量训练数据匮乏制约“能走”到“会思考”。谁能率先突破数据与模型瓶颈，将定义下一代具身智能标准。

人形机器人具身智能大模型训练数据跨界竞争

2026-03-19

AI版权与数据治理风暴

苹果、Meta等巨头因训练数据含盗版书籍与内部AI泄露敏感信息接连被告与自查；ICML一次性拒稿497篇“AI审稿”论文，学术与工业界同步提高数据合规、模型安全与版权门槛，AI治理进入高压周期。

训练数据侵权 AI泄露学术诚信数据合规版权治理

2026-03-15

底层架构与评测革新

哈工深提出模长感知线性注意力，显存直降92.3%；MIT新算法挑战“后训练RL已死”共识；CVPR 2026论文用视觉Token变化量无损加速VLM 1.87倍；arXiv宣布脱离康奈尔独立并招聘CEO，底层算法、评测与知识分发体系同步洗牌。

线性注意力后训练RL arXiv VLM加速评测基准

2026-03-08

多模态与高效推理创新

Yann LeCun、谢赛宁联合强调多模态预训练是后LLM时代主路径；Parallel-Probe破解无效并行，推理提速35.8%；30B参数REDSearcher以低成本实现深度搜索Agent，高效能与多模态并进。

多模态预训练并行推理 REDSearcher 高效推理 LeCun

2026-01-20

AI版权诉讼风暴

英伟达被曝主动接触盗版网站安娜档案馆，企图获取500TB电子书训练模型，遭作家集体诉讼。该案成为“AI训练数据是否构成合理使用”的里程碑事件，或重塑全球数据获取规则与模型合规成本。

英伟达盗版数据版权诉讼 AI训练安娜档案馆

2026-01-09

端侧与本地AI算力崛起

戴尔推出桌面超级计算机GB10，可在本地跑70亿参数模型；摩尔线程升级SimuMax分布式训练仿真平台，摩尔线程与戴尔共同推动“云-边-端”协同，缓解GPU内存瓶颈，让中小开发者摆脱昂贵云依赖，进入普惠AI时代。

端侧AI 本地算力 GB10 SimuMax 分布式训练

2026-01-08

模型评测与后训练新范式

LMArena以众包盲测获1.5亿美元融资，估值17亿美元；潞晨云8元跑通强化学习全流程，后训练进入“按Token计费”时代。评测即流量入口，低成本RLHF成为新基础设施，降低初创公司追赶门槛。

LMArena 模型评测后训练强化学习 Token计费

# 训练