AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
多轮对话加速
相关话题
2024-01-08
大模型推理与架构优化
聚焦2024年初大模型在推理速度、上下文长度、参数效率等核心瓶颈上的突破,涵盖LoRA压缩、RAG召回、多轮对话加速、上下文扩展四行代码等方案,为端侧部署与企业降本提供关键支撑。
大模型推理
LoRA
上下文扩展
RAG
多轮对话加速