2026-05-26

大模型与Agent技术突破

涵盖国内外大模型最新进展,包括阿里Qwen3.7-Max编程能力登顶、OpenAI GPT-5.6超长上下文、Anthropic Mythos模型、昆仑万维SkyClaw Agent等,展现基础模型能力跃升与智能体生态繁荣。
2026-05-11

AI for Math 突破临界点

谷歌DeepMind AI数学家48%正确率破解60年未解难题,浙大校友AI框架刷新32年拉姆齐数下界,GPT-5.5 Pro两小时输出博士级证明,显示AI在抽象推理、形式化证明环节已越过“辅助”阶段,成为基础科研的共创者。
2026-05-06

模型迭代与商用提速

OpenAI连发GPT-5.5Instant并上线ChatGPT广告平台,谷歌将推Ultra Lite订阅,豆包公布68-500元三档付费,标志着头部模型进入“性能微迭代+商业化收割”双轨并行阶段,AI to B收入开始兑现。
2026-04-27

编程模型并入主流通用模型

OpenAI宣布独立Codex终结,能力全面并入GPT-5.5,开发者无需再调用专用编程分支;同期美联储报告显示AI工具已致初级程序员招聘增速腰斩,标志着“通用大模型+提示工程”正式替代“专用代码模型”,行业人才结构面临重塑。
2026-04-26

国产大模型性能突破

DeepSeek-V4、GPT-5.5同日发布,实测性能对标甚至超越国际旗舰;百万token开源、长文本能力跃升,标志国产大模型从参数堆叠走向综合效率与工程落地,重塑全球竞争格局。
2026-04-25

OpenAI 发布 GPT-5.5 进入 Agent 原生时代

GPT-5.5 以“最强旗舰+Agent 原生”定位全榜第一,强调任务执行与电脑操作,被产业用户高度依赖;同期 OpenAI 高层宫斗纪录片式曝光,凸显 AI 巨头治理与稳定性风险。
2026-04-24

GPT-5.5开启智能体时代

OpenAI发布GPT-5.5,能效提升50倍,支持自主规划与多工具调用,Codex同步上线;英伟达全员强制使用,微软、Meta跟进整合,标志模型从“问答”走向“执行”,推动企业级智能体落地。
2026-03-08

GPT-5.4颠覆白领工作

OpenAI发布GPT-5.4,支持百万级上下文与原生Computer Use,可端到端操作Excel等桌面应用,直接替代咨询、投行、律所等复杂白领流程,标志AI从“助手”跃升为“自主执行者”,引发5.7万科技岗位震荡。
2026-03-07

原生多模态大一统模型

OpenAI GPT-5.4与商汤NEO-unify先后实现“一个模型”同时完成理解、生成、操控电脑等任务,彻底砍掉视觉编码器/VAE,标志多模态架构从拼接走向原生统一,奠定通用智能体新基座。
2026-03-06

GPT-5.4 大一统模型

OpenAI 发布 GPT-5.4 系列,实现推理、编程与智能体工作流统一,百万 Token 窗口、原生操控电脑、Thinking 透明推理,标志个人 AI 员工时代正式到来,全球开发者生态迅速跟进。
2026-03-04

模型迭代与性价比之战

谷歌Gemini 3.1 Flash-Lite、OpenAI GPT-5.3 Instant与GPT-5.4泄露同期登场,MiniMax 2.5凭极致性价比全球调用量第一,国产模型包揽前三,显示大模型竞争从参数规模转向“速度+成本+体验”多维比拼,价格战一触即发。
2026-02-25

编程模型军备赛

OpenAI、阿里云、Anthropic 同期祭出旗舰级编程大模型/平台:GPT-5.3-Codex 全面开放 API 并集成推理能力;阿里云 Coding Plan 以 7.9 元低价打包 Qwen3.5、GLM-5 等四大开源模型,支持一键切换;Anthropic 升级 Claude Code 远程控制与企业插件,实现跨 Excel、PPT 的无缝办公。三方在代码生成、工程理解、成本与生态三维度正面交锋,标志 AI 辅助开发进入“模型+场景+价格”多维竞争阶段,将直接重塑开发者生产力与软件外包市场格局。
2026-02-15

顶级模型迭代与科学发现

GPT-4o正式下架、GPT-5.2一行公式改写粒子物理教科书、蚂蚁开源万亿参数Ring-2.5-1T达IMO金牌水平,标志大模型进入“后训练+科学推理”新阶段,AI开始直接产出人类算力无法完成的科学结论。
2026-02-14

AI编程进入“秒级”时代

OpenAI GPT-5.3-Codex-Spark、谷歌Gemini 3 Deep Think、MiniMax M2.5等模型刷新代码生成速度与质量纪录,每秒千token、Elo超3450,开发者手写代码比例骤降,AI正重构软件工程范式。
2026-02-07

AI编程与算子自动生成

GPT-5.3-Codex、Claude插件等模型把代码生成推向“零人工”时代;KernelGen+FlagTree实现82%算子AI暴力直出,CUDA护城河被撬动。编程从“手搓”走向“口述”,软件供给侧面临重构。
2026-02-06

编程模型军备竞赛

OpenAI与Anthropic两周内连发GPT-5.3-Codex、Claude Opus 4.6,SWE-Bench破50%+、上下文破百万token,开启“AI同事”自动编程时代;性能跃迁令软件股巨震,SaaS商业模式面临颠覆。
2026-01-19

AI科研与数学突破

GPT-5.2 Pro独立完成45年未解的埃尔德什数论猜想,清华&芝大Nature论文揭示AI使科学家提前1.37年晋升,显示大模型在数学、科研方法论与学术生态中的颠覆性作用,AI正从辅助工具升级为“独立发现者”。
2026-01-15

AI编程范式颠覆

GPT-5.2、Claude Cowork等模型在复杂长程编程任务中展现“自主编码”能力,10天完成传统2个月工作量,硅谷掀起“无程序员”浪潮,标志软件工程从人类主导转向AI自治,行业生产关系面临重构。
2025-12-21

2025大模型技术拐点

Karpathy、卡帕西等权威连续发声:o3、GPT-5、RLVR等标志大模型进入‘物理可验证’新阶段,Scaling Law仍在生效,行业潜力仅释放<10%,预示科研与产业应用同步爆发。
2025-12-19

多模态大模型爆发

2025年底,GPT-5.2-Codex、Gemini 3 Flash、苹果UniGen 1.5、字节Seedance 1.5 Pro等旗舰模型密集发布,统一支持文本、图像、视频、音频、代码的多模态理解与生成,推理速度、上下文长度及工具调用能力再破上限,标志着通用人工智能进入“原生多模态”时代,为下一代应用奠定新基座。