2025-01-30 AI话题 - AI快开门

DeepSeek生态冲击波

DeepSeek-R1及其底层优化细节持续发酵：绕过CUDA、FP4训练、R1-Zero纯强化学习等创新，被视作对英伟达生态与OpenAI o1的直接挑战，引发市值震荡、硅谷围剿与国产模型效率革命讨论，成为2025开年最具冲击力的技术事件。

ETH Zurich等机构提出“推理语言模型（RLM）”统一蓝图，系统拆解o1、o3、DeepSeek-V3的强推理机制，指出其是迈向AGI的关键里程碑，为行业提供可复制的方法论，降低复杂问题求解门槛。

谷歌Med-PaLM 2在MedQA等医学基准上达到专家级表现，通过领域微调与推理策略升级，显著缩小与大模型在真实临床场景中的差距，加速AI医生落地进程。

微软首发FP4训练框架，在保持BF16精度的同时将显存与能耗减半，为大模型训练成本下降提供可扩展路径，利好国产卡与边缘算力部署。

普渡大学深度学习模型实现5Å全原子RMSD精度，首次在Nature子刊展示RNA三级结构预测接近实验水平，为靶向药物与RNA疫苗设计打开新空间。

TeleAI在ICLR 2025提出好奇心驱动的探索对齐方法，让8B模型在多项任务上超越70B，展示小模型通过强化探索机制实现越级性能的新思路。