AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
动态注意力
相关话题
2024-06-18
小模型高效化与推理优化
微软Phi-3、DCFormer、MCTSr-8B、TransNAR等研究通过动态注意力、算法推理大脑、蒙特卡洛搜索等机制,在参数量<10B情况下逼近甚至超越GPT-4奥数与推理表现,为端侧部署、低成本AGI提供新范式。
小模型
推理优化
动态注意力
Phi-3
Transformer