AI快开门

发现最好的AI工具

← 返回列表

2025-02-24 AI 话题

RSS
📊 6 个话题 📰 34 条新闻

月之暗面开源改进版Muon优化器,算力需求较AdamW锐减48%,已被用于DeepSeek架构新模型;华为诺亚提出高效稀疏注意力ESA,进一步降低长文本训练与推理成本,国产大模型进入“低成本、高效率”新阶段。