2026-03-21

大模型长文本与注意力优化

DeepSeek、清华&智谱团队提出IndexCache等方案,将稀疏注意力prefill阶段提速1.8倍,破解超长上下文O(L²)瓶颈,为大模型落地200K+Token场景铺平道路。
2026-03-15

超长上下文重塑编程

Claude一夜把上下文扩至100万token,可一次性吞下整个代码库,引爆“新编程范式”讨论;Cursor随即发布CursorBench,指出旧基准与真实智能体工作流严重脱节,Claude Haiku得分从73.3暴跌至29.4,预示编程AI进入“长记忆+多步推理”新赛场。
2026-03-08

GPT-5.4颠覆白领工作

OpenAI发布GPT-5.4,支持百万级上下文与原生Computer Use,可端到端操作Excel等桌面应用,直接替代咨询、投行、律所等复杂白领流程,标志AI从“助手”跃升为“自主执行者”,引发5.7万科技岗位震荡。
2026-03-03

多模态大模型升级潮

DeepSeek V4、GPT-5.4、Qwen3.5 等国内外旗舰模型密集迭代,同步加码多模态、长上下文与边缘轻量化,标志大模型进入“全能、低价、可落地”新阶段,直接决定下游应用爆发速度与生态格局。
2026-01-11

Agent落地方法论:上下文工程

Manus、Cursor等明星Agent团队把“上下文工程”视为初创公司最高ROI路径:用通用大模型+精细Prompt即可快速迭代,无需过早微调或自研模型,既降本又保持升级弹性,正成为2025年Agent创业的技术共识与竞争壁垒。
2025-12-02

多模态大模型井喷

谷歌Gemini 3、阿里Z-Image、字节Vidi2、华为扩散语言模型等密集发布,文本-图像-视频-音频统一架构成为主流,推理成本骤降、上下文突破32K,标志生成式AI进入“原生多模态”新阶段,直接重塑内容生产、搜索与终端交互体验。
2025-11-10

多模态大模型升级战

Grok支持文本生成带音效视频、Grok 4上下文扩至200万token,谷歌Veo-3可生成逼真手术视频,百度小度AI眼镜落地,多模态能力从实验室走向消费级与专业场景,开启“空间超感知”新范式。
2025-11-01

Transformer架构再突破

月之暗面开源Kimi Linear注意力,首次在同等训练下超越全注意力,长文KV缓存降75%、推理加速6倍;上海AI Lab混合扩散语言模型SDAR突破6600 tgs。新机制冲击传统Transformer垄断,为长上下文、实时交互与端侧部署打开全新可能。
2025-10-26

大模型推理与系统优化

NVIDIA联合港大、MIT推出Fast-dLLM v2,端到端吞吐提升2.5倍;同时上下文敏感框架解决位置偏差,显示大模型系统层创新仍是落地关键,硬件-算法协同优化空间巨大。
2025-10-16

多模态大模型军备赛

谷歌Veo 3.1、字节豆包1.6、OpenAI Sora2、通义千问记忆版集中升级,视频生成时长、音频同步、上下文记忆成为竞速焦点,标志生成式AI进入“长时长+多模态+个性化”新阶段,直接决定流量入口与商业变现场景的重新洗牌。
2025-10-12

AI数学与科研范式突破

GPT-5 Pro在11分钟内完成陶哲轩三年未解的微分几何证明,华盛顿大学LLMc以LLM语义理解实现超越ZIP的无损压缩,斯坦福ACE框架用上下文自我进化替代微调,显示大模型在数学、压缩、自适应等科研核心环节的范式级能力跃迁。
2025-09-08

超大规模模型突破

阿里Qwen3-Max-Preview突破万亿参数,微软14B小模型以强化学习逼近671B巨模型,Meta、字节等同步刷新长上下文与多模态极限,标志大模型进入“参数+算法”双轨竞争,算力效率与智能密度同步跃升。
2025-09-07

多模态视频理解突破

快手开源Keye-VL 1.5,以128k上下文、0.1秒级定位刷新Video-MME榜单,SceneSplat把3D高斯与语言对齐,表明视频-3D-语言统一模型正快速逼近商用门槛。
2025-08-21

超长上下文开源模型大战

字节跳动开源Seed-OSS-36B,512K上下文长度刷新纪录,性能对标DeepSeek;MIT提出TIM架构理论上实现“无限”推理长度,国产Avengers-Pro路由系统以19%成本逼近Gemini-2.5-Pro。超长上下文与高效推理成为开源社区新赛点,直接降低开发者门槛,加速长文档、代码、多模态应用落地。
2025-08-14

多模态大模型与Agent框架爆发

字节、商汤、Anthropic、微软等密集发布多模态训练框架、超长上下文模型及Agent强化学习平台,标志通用AI向“感知-决策-执行”一体化跃迁,为下游机器人、游戏、办公等场景提供统一技术基座。
2025-07-20

长上下文与Agent工程实践

MiniMax闭门会强调“长上下文是Agent的Game Changer”,Manus分享基于前沿模型构建上下文工程的经验,显示利用大模型上下文学习快速搭建智能体已成为行业新范式。
2025-07-09

多模态小模型爆发

Hugging Face、阿里、腾讯、字节等密集发布3B-4B参数多模态小模型,支持128K上下文、链式推理、按需搜索等能力,在端侧与实时场景逼近大模型效果,开启“小而强”新范式。
2025-07-01

超大模型新王争霸

Gemini 2.5 Pro、百度文心4.5系列等旗舰模型密集开源或升级,百万级长上下文、MoE架构与多模态能力成为竞逐焦点,直接重塑开发范式与商业落地门槛。
2025-06-17

开源代码大模型爆发

月之暗面Kimi-Dev-72B、MiniMax-M1等国产大模型相继开源,在代码修复、超长上下文推理等基准刷新SOTA,低成本(53万美元)与1M token窗口成为亮点,标志国内开源力量跻身全球第一梯队,加速开发者生态与行业落地。
2025-05-16

超长记忆与上下文协议

Supermemory、OpenMemory MCP 等工具打破模型“健忘”与工具孤岛,实现跨会话、跨应用的长久记忆共享;MCP 协议开源生态快速壮大,为 AI 工作流奠定统一上下文基础,被视为个人与开发者效率的下一跳。