AI快开门

发现最好的AI工具

2025-05-25

推理模型新范式

强化学习让模型仅凭图像即可进行复杂推理与场景规划,打破“语言中心”范式,为机器人、自动驾驶等视觉主导任务提供新路径,有望重塑多模态智能体架构。
2025-02-12

模型架构与推理成本突破

字节跳动UltraMem架构将大模型推理成本降83%,UC伯克利4500美元复现DeepSeek-R1并超越o1-preview,普林斯顿-北大提出层次化RL新范式,清华开源4090单卡满血推理方案,低成本、高效率成为2025模型创新关键词。
2024-12-14

小模型逆袭与大模型效率战

微软 Phi-4(14B)数学击败 GPT-4o,Cohere 推出可跑低端设备的 Command R7B,显示“小模型+数据/训练算法创新”正在挑战“唯参数论”。效率竞赛降低算力门槛,利好端侧部署与中小企业,可能重塑云端订阅商业模式。
2024-04-08

大模型效率与训练新范式

从矩阵内核重写、神经压缩文本训练到零样本检测,多条研究同时指向“让大模型更快、更省、更安全”。谷歌DeepMind、斯坦福、清华等团队提出ReFT、压缩训练、Fast-DetectGPT等方案,推理速度最高提升5倍,检测速度提升340倍,为落地成本和可信应用扫清障碍。