AI快开门

发现最好的AI工具

2024-06-04

大模型架构革新

Mamba-2、DCFormer等新架构在训练效率与性能上挑战Transformer;Meta多token训练将推理提速3倍,上下文学习研究探索无需微调的新范式,推动大模型底层技术进入新一轮迭代。