2025-06-19
模型效率与数据优化
谷歌DataRater自动筛除75%低质数据,弗吉尼亚理工LensLLM选型框架降本90%,普林斯顿&Meta线性注意力机制提速15倍,共同指向“更少数据、更低算力、更高性能”的新训练范式。
2025-05-16
模型架构与训练效率突破
DeepSeek-V3 论文公开低成本训练细节,MiniMax Speech-02 登顶 TTS 榜单,字节 Seed 提出 AttentionInfluence 数据筛选,港科大-vivo PreSelect 提升数据效率 10 倍,共同推高大模型性能天花板并降低算力门槛。