AI快开门

发现最好的AI工具

← 返回列表

2025-02-01 AI 话题

RSS
📊 6 个话题 📰 4 条新闻

DeepSeek-R1以低成本高性能震撼全球,引发OpenAI融资反击、硅谷巨头“打不过就加入”、中美数据安全摩擦,标志中国大模型首次在技术、商业与地缘三线同时产生连锁冲击。


DeepSeek-R1-Zero纯RL无需人类标注,OpenAI即将发布满血o3,北大解构CoT概率树,显示“推理即搜索”的新范式正在取代提示工程,降低数据门槛并刷新性能天花板。


多项研究指出顶级模型普遍依赖蒸馏,DeepSeek绕过CUDA直写PTX优化,谷歌、北大等提出新协作或概率框架,暗示“算力+CUDA”护城河松动,训练与推理成本有望再降一个量级。


美方指控DeepSeek“偷窃”数据并发动网络攻击,Anthropic CEO呼吁收紧芯片出口,五角大楼启动90天军事AI计划,显示技术领先已升级为国家安全议题,供应链与数据主权博弈加剧。


19岁华人团队获百万美元押注AI Agent,谷歌CoA实现长文本性能翻倍,UIUC-阿里开源手机多能体,框架、应用与资本同步涌入,2025被业内视为“智能体元年”。


微软首发FP4训练框架效果对标BF16,谷歌、阿里、华为云等同步优化推理服务,表明在摩尔定律放缓背景下,算法-硬件协同正成为大模型降本增效的新主线。