【概览】OpenAI连发o3-mini、“博士级超级智能体”与细胞重编程模型GPT-4b micro,将AI推理与长寿研究推向新高度;国内豆包、MiniMax、商汤同日扎堆上新多模态模型,AIGC月活破亿,中美技术竞速进入白热化。资本与产品双线爆发,安全与治理议题同步升温。
01 | OpenAI o3系列与博士级Agent
OpenAI将在数周内推出轻量推理模型o3-mini,并同步发布具备“博士级”自主科研能力的超级智能体,后者可直接阅读文献、设计实验、分析数据,目标把新药发现周期缩短一半。公司还低调上线专注长寿研究的GPT-4b micro,首次让AI参与蛋白质重编程,宣称可延长人类健康寿命10年,显示其同时押注通用智能与生物医学两大赛道。
02 | 国产大模型密集上新
豆包、阶跃星辰、MiniMax、商汤在48小时内连发五款模型,覆盖端到端语音、文学写作与实时图像生成,中文多模态能力集体逼近GPT-4V水平。豆包实时语音大模型支持情绪对话,MiniMax海螺语音上线全球首个T2A-01-Turbo,商汤融合大模型交互版免费开放商用,直接引爆C端:第三方数据显示AIGC应用月活已破亿,豆包独占过半。
03 | AI生物与长寿突破
GPT-4b micro与Retro Biosciences、清华丁胜实验室联合训练,可一次性生成数千条去衰老蛋白变体,实验显示使成纤维细胞“逆龄”10年。该模型已用于优化Yamanaka因子组合,将重编程效率提升约50倍,标志着AI首次直接参与抗衰老科学发现,并获奥特曼个人追加投资。
04 | AI编程工具竞争升温
字节跳动发布中文AI IDE“Trae”,内置Doubao-1.5-pro,代码补全与重构效果对标Cursor;Cursor同日宣布完成1.05亿美元B轮,估值破10亿美元。DeepSeek开源新模型在HumanEval得分与o1持平,支持128k上下文,开发者调侃“今年只剩Tab键”。
05 | 具身智能与机器人生态
Physical Intelligence发布机器人动作Tokenizer,把多模态动作数据压缩为离散Token,训练速度提升5倍,已在双臂折叠衣物任务中验证。英伟达在北京峰会上给出人形机器人五年落地路线图:仿真-合成数据-边缘计算“三台计算机”协同,把50年研发周期压缩到5年。
06 | AI安全与幻觉治理
MIT与DeepMind发现视觉语言模型对否定表达“零理解”,导致幻觉频发;淘天团队提出跨模态对齐框架,在COCO基准上将物体幻觉率从23%降至7%。与此同时,ChatGPT API被曝存在DDoS放大漏洞,攻击者可利用流式回复发起放大倍率15倍的反射攻击,OpenAI已推送速率限制补丁。
07 | AI创意生成升级
美图WHEE AI海报支持一键生成可商用中文海报,内置千款字体与自动排版;Krea升级为FLUX实时生成,拼贴组合延迟低于100毫秒;Runway推出Frames图像模型,可输出电影级色调与景深,AIGC创意工具正式进入“秒级可用”阶段。
08 | AI治理与伦理风险
AGI“智能诅咒”论引发热议:一旦AI让少数人获得超额认知优势,财富与权力或呈指数级集中;AI基准组织因未及时披露OpenAI 500万美元资助遭社区批评,透明度再成焦点。微软科学家公开自述“AI疲劳症”,呼吁行业放缓传播节奏、回归理性评估。
【展望】博士级Agent与长寿模型的出现,预示AI正从“工具”跃升为“科研合伙人”;国产多模态集体爆发则让中文场景进入零门槛创作时代。随着资本疯狂加码编程、具身智能与创意工具,技术迭代周期将被进一步压缩,幻觉治理、安全漏洞与伦理透明度将成为决定产品能否规模落地的下一道关隘。