2024-06-09
大模型幻觉与量化难题破解
DeepMind首次解耦LLM认知与偶然不确定性,显著降低幻觉;ETH&北航提出Q-BERT量化微调新范式,解决量化后性能退化,为可信、低成本部署大模型提供关键技术支撑。
2024-05-27
Transformer架构再进化
DCFormer、OmniGlue、傅立叶微调等多项ICML 2024研究提出对Transformer注意力、微调与匹配模块的创新改造,显著降低算力或提升泛化,为下一代大模型降本增效提供新路径。