← 返回列表

AI行业新闻简报 2025.03.15 周六

📊 7 个话题 📰 28 条新闻 🕐 2025-03-15 05:30

【概览】

何恺明、LeCun团队用9行代码拆掉LayerNorm,长文本与推理链同步提速,开启大模型底层效率新范式;Open-Sora 2.0以20万美元复现百万美元级视频生成,训练成本骤降10倍,AIGC“平民化”全面提速。

01 | 大模型架构革新

LayerNorm被宣告“可选”——刘壮、何恺明与Yann LeCun联手提出无归一化Transformer,仅用9行代码替换LayerNorm,训练速度更快、下游任务不降反升;同期SCoT动态推理链可随问题复杂度自动调节思考深度,TokenSwift无损长文本生成提速3倍,超长上下文与复杂推理进入“秒回”时代。

02 | 开源视频生成大爆发

Open-Sora 2.0以11B参数、224张A100、20万美元总成本完成训练,在公开评测中逼近闭源SOTA,训练预算压缩90%;字节同日上线AI音效模型SeedFoley,一键补齐大片级声效,视频AIGC“画面+声音”全链路开源,内容创作门槛被彻底打穿。

03 | AI安全与合规监管

国家网信办印发《人工智能生成合成内容标识办法》,要求所有AI产出“显著标识”;上海AI Lab推出DeepSeek“防弹衣”内生安全框架,在几乎不损失性能的前提下拒绝有害请求;OpenAI公开呼吁美国联邦政府加强顶层监管,全球AI治理从“倡议”进入“落地”窗口期。

04 | 端侧与消费级AI

苹果M3 Ultra芯片在15万元级台式机上跑满血DeepSeek-R1,端侧推理进入“家用”时代;Windows记事本内测“选中即摘要”,Android Studio Gemini支持上传UI草图一键生成Compose代码,大模型能力正被系统级应用“拆包”成人人可用的轻功能。

05 | AI+垂直行业落地

崂山实验室“问海”大模型把海洋环境预报效率提升3000倍,预测一次仅需数秒;AI“小青”24小时筛查青光眼,守护2600万潜在患者;清华大学开源AI制药平台“Autopilot”将实验设计、分子生成与湿实验闭环,科研工作者可一键进入“自动驾驶”模式,大模型在专业场景开始解决“生死时速”级痛点。

06 | 具身智能与机器人

谷歌把“思维链”搬进机器人,折纸、系鞋带等精细操作实现“零样本”泛化;国产人形机器人3.99万元起售并完成全球首次一镜到底连续空翻,优必选“天工行者”29.9万元切入科研市场,通用机器人进入“低价放量+技能跃迁”并行阶段。

07 | 资本与政策动态

智谱华章再获5亿元融资,拟打造城市级大模型空间;软银豪掷千亿日元改造夏普旧厂,与OpenAI共建AI智能体数据中心;北京新增34款已登记生成式AI服务,小米AI搜索、Monica等在列,资本与政策双轮驱动持续升温。

【展望】

当“无归一化”拆掉算力枷锁、开源视频把成本打到1/10,基础模型正进入“更快、更长、更便宜”的新周期;与此同时,合规红线、端侧落地与行业大模型纵深推进,让技术、商业与监管三线并行。接下来,架构效率竞赛将加速向多模态、具身智能延伸,而谁能率先在成本、安全与可控性之间找到平衡,谁就能占据下一个落地黄金窗口。

× 公众号二维码

扫码关注公众号获取每日简报