2026-04-28
国产大模型价格战升级
DeepSeek-V4 连续两轮降价,输入/输出费用最低至原价 2.5 折并叠加缓存 1 折,带动国产模型 API 进入“厘时代”。降价+开源+长上下文策略,显著降低开发者与企业的长文本、编程、Agent 应用成本,有望复制去年“千模大战”的流量红利并加速场景落地。
2026-04-24
DeepSeek-V4开源震撼发布
DeepSeek-V4以1M超长上下文、1.6T/285B双版本开源,性能对标顶级闭源模型,寒武纪、华为云、腾讯云等首日完成原生适配,定价低至1元/百万token,掀起开源大模型普惠浪潮,直接冲击港股大模型概念股。
2026-04-22
长上下文与模型效率突破
DeepSeek API升级至百万Token上下文,蚂蚁百灵发布104B参数却仅激活7.4B的Ling-2.6-flash,兼顾性能与成本,显示国产大模型在“长记忆”与“高效推理”两端同步取得关键进展,为复杂任务落地扫清障碍。
2026-03-21
大模型长文本与注意力优化
DeepSeek、清华&智谱团队提出IndexCache等方案,将稀疏注意力prefill阶段提速1.8倍,破解超长上下文O(L²)瓶颈,为大模型落地200K+Token场景铺平道路。
2026-03-08
GPT-5.4颠覆白领工作
OpenAI发布GPT-5.4,支持百万级上下文与原生Computer Use,可端到端操作Excel等桌面应用,直接替代咨询、投行、律所等复杂白领流程,标志AI从“助手”跃升为“自主执行者”,引发5.7万科技岗位震荡。
2026-03-03
多模态大模型升级潮
DeepSeek V4、GPT-5.4、Qwen3.5 等国内外旗舰模型密集迭代,同步加码多模态、长上下文与边缘轻量化,标志大模型进入“全能、低价、可落地”新阶段,直接决定下游应用爆发速度与生态格局。
2025-11-01
Transformer架构再突破
月之暗面开源Kimi Linear注意力,首次在同等训练下超越全注意力,长文KV缓存降75%、推理加速6倍;上海AI Lab混合扩散语言模型SDAR突破6600 tgs。新机制冲击传统Transformer垄断,为长上下文、实时交互与端侧部署打开全新可能。
2025-10-16
多模态大模型军备赛
谷歌Veo 3.1、字节豆包1.6、OpenAI Sora2、通义千问记忆版集中升级,视频生成时长、音频同步、上下文记忆成为竞速焦点,标志生成式AI进入“长时长+多模态+个性化”新阶段,直接决定流量入口与商业变现场景的重新洗牌。
2025-09-08
超大规模模型突破
阿里Qwen3-Max-Preview突破万亿参数,微软14B小模型以强化学习逼近671B巨模型,Meta、字节等同步刷新长上下文与多模态极限,标志大模型进入“参数+算法”双轨竞争,算力效率与智能密度同步跃升。
2025-08-21
超长上下文开源模型大战
字节跳动开源Seed-OSS-36B,512K上下文长度刷新纪录,性能对标DeepSeek;MIT提出TIM架构理论上实现“无限”推理长度,国产Avengers-Pro路由系统以19%成本逼近Gemini-2.5-Pro。超长上下文与高效推理成为开源社区新赛点,直接降低开发者门槛,加速长文档、代码、多模态应用落地。
2025-07-20
长上下文与Agent工程实践
MiniMax闭门会强调“长上下文是Agent的Game Changer”,Manus分享基于前沿模型构建上下文工程的经验,显示利用大模型上下文学习快速搭建智能体已成为行业新范式。
2025-07-01
超大模型新王争霸
Gemini 2.5 Pro、百度文心4.5系列等旗舰模型密集开源或升级,百万级长上下文、MoE架构与多模态能力成为竞逐焦点,直接重塑开发范式与商业落地门槛。
2025-06-17
开源代码大模型爆发
月之暗面Kimi-Dev-72B、MiniMax-M1等国产大模型相继开源,在代码修复、超长上下文推理等基准刷新SOTA,低成本(53万美元)与1M token窗口成为亮点,标志国内开源力量跻身全球第一梯队,加速开发者生态与行业落地。
2025-05-02
超长上下文与高效推理突破
英伟达与UIUC把Llama上下文扩至400万token创SOTA;微软Phi-4系列以小参数量逼近GPT-4o推理表现;LoRA冗余研究称可剪枝95%参数不降性能,推动端侧与低成本部署。
2025-04-15
GPT-4.1系列模型发布
OpenAI正式推出GPT-4.1/4.1-mini/4.1-nano,上下文长度统一扩展到1M tokens,编码与多模态能力全面超越GPT-4o,价格更低,已被Cursor、Windsurf等主流工具第一时间集成,并配套发布官方提示工程指南,标志着大模型进入“长上下文+高性价比”新阶段。
2025-01-21
多模态长上下文技术突破
谷歌Titans、月之暗面k1.5、清华VideoChat-Flash等模型将上下文推至200万Token,长视频处理提速100倍,多模态统一架构逼近Next-Token Prediction终极范式。
2025-01-18
国产大模型技术突破
MiniMax-01、书生·浦语3.0、DeepSeek-V3等国产大模型通过线性注意力、数据框架优化、MoE等创新,实现长上下文、高效训练与性能对标国际顶尖模型,标志着国产大模型进入第一梯队。
2025-01-16
国产大模型技术突破
阿里、MiniMax、智谱、讯飞等密集发布数学推理、长上下文、多模态新模型,7B量级即可对标GPT-4o,显示国产大模型在数据效率、架构创新与国产算力适配上的集体跃升,为自主生态奠定技术底座。
2025-01-15
多模态长上下文突破
谷歌Titans、清华&港大团队、MiniMax-01等先后打破Transformer记忆瓶颈,实现百万级Token视觉理解与语音处理;商汤“日日新”原生融合模型统一图文视频,推动世界模型新方向。