AI快开门

发现最好的AI工具

2026-01-04

Scaling Law受挑战与架构创新

DeepSeek提出流形约束超连接(mHC)改造残差连接、KAN作者再发檄文反思暴力堆参数,显示行业开始探索不依赖纯规模扩张的新架构,有望降低训练成本并提升可解释性。