2024-11-02
模型后训练技术突破
Meta CGPO、字节HybridFlow、上海AI Lab MIA-DPO等框架集中开源,解决RLHF奖励欺骗、多图像对齐、训练部署效率等痛点,推动大模型从“预训练”进入“后训练”精细化时代,显著降低推理成本并提升多任务性能。
2024-11-01
端侧小模型崛起
苹果、Meta、 Mistral 等巨头加速推进 SLM(小语言模型),在笔记本与手机端实现数十亿参数本地运行,HybridFlow、MobileLLM 等开源工具将训练速度提升 20 倍,边缘 AI 进入实用爆发期。