AI快开门

发现最好的AI工具

2025-01-22

模型蒸馏与评测反思

中科院、北大等研究指出除Claude、Gemini、豆包外,多数主流模型存在“过度蒸馏”,性能反而下降;人大清华提出Search-o1框架,用自主搜索缓解推理模型知识幻觉,推动评测方法升级。
2025-01-19

搜索增强推理模型新框架

清华人大联合发布Search-o1,让大模型在推理链中主动调用搜索引擎,实时补齐知识缺口,在博士级科学问答等11项评测拿下10项SOTA,整体表现超人类专家。该框架为“慢思考”大模型补全知识幻觉短板提供通用方案,有望重塑科研、代码、医疗等严肃场景应用。