AI快开门

发现最好的AI工具

← 返回列表

2025-01-30 AI 话题

RSS
📊 6 个话题 📰 5 条新闻

DeepSeek-R1及其底层优化细节持续发酵:绕过CUDA、FP4训练、R1-Zero纯强化学习等创新,被视作对英伟达生态与OpenAI o1的直接挑战,引发市值震荡、硅谷围剿与国产模型效率革命讨论,成为2025开年最具冲击力的技术事件。


ETH Zurich等机构提出“推理语言模型(RLM)”统一蓝图,系统拆解o1、o3、DeepSeek-V3的强推理机制,指出其是迈向AGI的关键里程碑,为行业提供可复制的方法论,降低复杂问题求解门槛。


谷歌Med-PaLM 2在MedQA等医学基准上达到专家级表现,通过领域微调与推理策略升级,显著缩小与大模型在真实临床场景中的差距,加速AI医生落地进程。


微软首发FP4训练框架,在保持BF16精度的同时将显存与能耗减半,为大模型训练成本下降提供可扩展路径,利好国产卡与边缘算力部署。


普渡大学深度学习模型实现5Å全原子RMSD精度,首次在Nature子刊展示RNA三级结构预测接近实验水平,为靶向药物与RNA疫苗设计打开新空间。


TeleAI在ICLR 2025提出好奇心驱动的探索对齐方法,让8B模型在多项任务上超越70B,展示小模型通过强化探索机制实现越级性能的新思路。