AI快开门

发现最好的AI工具

2024-06-09

大模型幻觉与量化难题破解

DeepMind首次解耦LLM认知与偶然不确定性,显著降低幻觉;ETH&北航提出Q-BERT量化微调新范式,解决量化后性能退化,为可信、低成本部署大模型提供关键技术支撑。
2024-05-27

Transformer架构再进化

DCFormer、OmniGlue、傅立叶微调等多项ICML 2024研究提出对Transformer注意力、微调与匹配模块的创新改造,显著降低算力或提升泛化,为下一代大模型降本增效提供新路径。
2024-05-18

顶级会议与前沿研究

ACL2024、ICML2024、WWW2024等顶会密集放榜,南大、复旦、清华等国内团队多篇论文入选,主题涵盖多智能体通信、动态算法、大模型鲁棒性,彰显中国NLP与机器学习国际影响力。