AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
扩散LLM
相关话题
2025-04-20
强化学习与生成式世界模型新框架
清华提出光滑策略迭代SPI提升对抗强化学习收敛速度;UCLA-Meta发布d1框架用类GRPO强化学习优化扩散LLM推理;AETHER开源首个融合重建-预测-规划的生成式世界模型,三大新框架同步推进决策智能与仿真能力边界。
强化学习
世界模型
扩散LLM
策略迭代
仿真
2025-04-05
国产大模型技术突破
DeepSeek联合清华提出新奖励模型推理方法提升可扩展性,7B扩散LLM性能对标671B DeepSeek V3,显示国产大模型在架构创新与参数效率上的快速追赶,为行业提供更低成本、高可用的基座模型选择。
DeepSeek
扩散LLM
模型效率
国产大模型