AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
模型蒸馏
相关话题
2025-02-01
DeepSeek冲击波
DeepSeek-R1以低成本高性能震撼全球,引发OpenAI融资反击、硅谷巨头“打不过就加入”、中美数据安全摩擦,标志中国大模型首次在技术、商业与地缘三线同时产生连锁冲击。
DeepSeek
OpenAI
中美竞争
模型蒸馏
低成本训练
2025-01-22
模型蒸馏与评测反思
中科院、北大等研究指出除Claude、Gemini、豆包外,多数主流模型存在“过度蒸馏”,性能反而下降;人大清华提出Search-o1框架,用自主搜索缓解推理模型知识幻觉,推动评测方法升级。
模型蒸馏
Search-o1
评测
幻觉
知识困境