AI快开门

发现最好的AI工具

2024-04-21

模型架构与训练效率突破

谷歌提出带反馈注意力的新型Transformer,实现工作记忆;Megalodon用0.5天训练15亿参数模型支持无限长文本;状态空间模型与组合世界模型COMBO也亮相。系列创新在计算效率、长上下文与多智能体协作上展现新思路。