扩散LLM - AI话题 - AI快开门

2025-04-20

清华提出光滑策略迭代SPI提升对抗强化学习收敛速度；UCLA-Meta发布d1框架用类GRPO强化学习优化扩散LLM推理；AETHER开源首个融合重建-预测-规划的生成式世界模型，三大新框架同步推进决策智能与仿真能力边界。

2025-04-05

DeepSeek联合清华提出新奖励模型推理方法提升可扩展性，7B扩散LLM性能对标671B DeepSeek V3，显示国产大模型在架构创新与参数效率上的快速追赶，为行业提供更低成本、高可用的基座模型选择。

# 扩散LLM