2025-02-01 AI话题 - AI快开门

DeepSeek冲击波

DeepSeek-R1以低成本高性能震撼全球，引发OpenAI融资反击、硅谷巨头“打不过就加入”、中美数据安全摩擦，标志中国大模型首次在技术、商业与地缘三线同时产生连锁冲击。

DeepSeek-R1-Zero纯RL无需人类标注，OpenAI即将发布满血o3，北大解构CoT概率树，显示“推理即搜索”的新范式正在取代提示工程，降低数据门槛并刷新性能天花板。

多项研究指出顶级模型普遍依赖蒸馏，DeepSeek绕过CUDA直写PTX优化，谷歌、北大等提出新协作或概率框架，暗示“算力+CUDA”护城河松动，训练与推理成本有望再降一个量级。

美方指控DeepSeek“偷窃”数据并发动网络攻击，Anthropic CEO呼吁收紧芯片出口，五角大楼启动90天军事AI计划，显示技术领先已升级为国家安全议题，供应链与数据主权博弈加剧。

19岁华人团队获百万美元押注AI Agent，谷歌CoA实现长文本性能翻倍，UIUC-阿里开源手机多能体，框架、应用与资本同步涌入，2025被业内视为“智能体元年”。

微软首发FP4训练框架效果对标BF16，谷歌、阿里、华为云等同步优化推理服务，表明在摩尔定律放缓背景下，算法-硬件协同正成为大模型降本增效的新主线。