2026-05-31

大模型效率与推理优化

针对大模型部署成本高、推理效率低的问题,MIT注意力匹配技术实现内存暴降50倍,抽象符号替代思维链压缩成本11倍,以及数据质量优化策略,为模型轻量化部署和高效推理提供关键技术路径。
2026-05-16

多模态模型效率与架构创新

聚焦模型效率优化与架构创新,MetaCompress实现多轮VQA场景90% Token压缩率且精度不掉,解决视觉Token算力爆炸问题;JEPA世界模型极简复现助力理解自监督表征学习。技术突破为端侧部署与长序列建模提供新思路,平衡性能与计算成本。
2026-05-09

企业效率型裁员潮

Cloudflare、甲骨文等巨头借AI自动化裁员数千人,Cloudflare收入仍创新高,显示“AI替代”已从生产环节扩散至运营、安全、客服全链路,引发就业市场与ESG争议。
2026-05-01

行业格局与资本信号

Anthropic估值冲900亿,国产生数科技黑马登顶双榜,清华团队10万元“肝”出105 SOTA,显示资本与科研双轮驱动下,AI创企与高校团队正以更低成本、更高效率刷新榜单与估值。
2026-04-26

AI科学发现新范式

SimpleTES以“试错-反馈-进化”闭环横扫21项科学难题,ICLR’26 Balanced Thinking在提升10%精度同时推理长度降35%,显示AI科研正从静态大模型转向动态迭代机制,加速科学发现。
2026-04-22

长上下文与模型效率突破

DeepSeek API升级至百万Token上下文,蚂蚁百灵发布104B参数却仅激活7.4B的Ling-2.6-flash,兼顾性能与成本,显示国产大模型在“长记忆”与“高效推理”两端同步取得关键进展,为复杂任务落地扫清障碍。
2026-04-13

终端智能体爆发:荣耀YOYO Claw引领

荣耀发布预制“龙虾”AI智能体YOYO Claw,出厂内置23子Agent,Token消耗降50%,首次落地MagicBook并开放豆包手机深度整合。终端侧Agent从“语音助手”进化为“系统级自动化引擎”,标志手机、PC进入“免安装、免提示”的原生智能体时代。
2026-03-29

大模型物理推理与机器人新范式

视频生成大模型隐式习得物理规律,被首次系统迁移到机器人操控任务,仅用732M参数即超越7B模型,显著降低对人工演示数据的依赖,为“数据困境”提供突破口,标志着“预训练物理先验+小参数策略”成为机器人学的新主流路线。
2026-03-29

AI for EDA与芯片生产力

论芯发布AI协议阅读工具,读文档速度提升25倍并自动发现respin级缺陷,率先将大模型引入EDA产线,显著缩短芯片迭代周期,预示AI正从设计辅助走向“全产线自主优化”,可能成为国产半导体突围的关键加速器。
2026-03-18

后Scaling时代模型效率革命

OpenAI、MiniMax、月之暗面等密集发布轻量化或自迭代模型,标志行业从堆算力转向拼Token效率与自我进化,降低门槛并加速落地。
2026-03-09

小模型逆袭大模型

阿里通义千问Qwen3.5-4B仅用2%参数(40亿)在第三方评测中打平甚至超越千亿级GPT-4o,开启“以小博大”新范式;BOSS直聘3B模型海外病毒式传播,性能对标32B;UniPat AI开源30B科研模型硬刚Gemini、Claude,48小时GitHub揽星9.5k。参数效率革命降低本地部署成本,为端侧和中小企业带来普惠AI能力。
2026-02-25

企业级 AI 渗透提速

普华永道与 Anthropic 联手推出金融、医疗高监管行业插件;摩根大通拟用 200 亿美元预算把运营岗转为 AI 创收岗;Salesforce 报告显示九成销售团队已部署或计划两年内上线 AI 智能体。咨询、金融、销售三大板块同时出现“AI 替代+岗位迁移”信号,意味着大模型正从辅助工具升级为核心业务系统。企业若成功重构流程,有望释放巨额效率红利;反之,数据合规与人才转型风险将同步放大。
2026-02-07

模型效率与架构创新

小米MiMo混合稀疏注意力减负KV-Cache 80%,DeepMind“算力矿场”暴力搜出超越ReLU的新激活函数,人大附中邓明扬提出单步生成的漂移模型。架构微创新正带来大模型效率跃迁。
2026-01-29

AI编程生产力革命

Gemini 3.5 Snow Bunny、Kimi K2.5、Claude等模型实现一次性生成数千行可运行代码,支持录屏复现、自动浏览,开发者效率提升10倍以上,软件工程进入“单人团队”时代。
2026-01-06

AI编程颠覆开发者生态

Midjourney创始人假期用AI编程Agent完成十年代码量,马斯克惊呼“奇点已至”;Stack Overflow提问量跌破18年前首月水平,AI替代社区问答;Claude Code等Agent工具引发“再见程序员”讨论,软件开发从手工编码迈向自然语言驱动。
2025-11-29

AI重塑科研范式

AlphaFold计划融合大模型,AI智能体驱动药物发现闭环,LLM显著提升医生研究效率,显示AI正从工具升级为科研“副驾驶”,加速生命科学、医学等领域知识发现。
2025-11-18

国产模型低成本突围

微博Vibe Thinker以7800美元后训练成本、15亿参数在数学等任务上超越DeepSeek R1;国产Kimi K2接入Perplexity,显示中国团队凭数据与工程优化实现“小参数、高性能”的低成本突围,冲击海外大模型性价比格局。
2025-11-12

模型效率与训练范式之争

NeurIPS满分论文质疑RLVR,阿里、清华、月之暗面用异步PPO、图像压缩、低成本H800训练证明“数据工程+基座”优于堆算力,开源社区加速复现o1级推理。
2025-11-10

AI重塑职场与内容生态

英国1/4大企业因AI裁员、好莱坞动物演员被数字替身下岗、AI绘本与PPT一键生成,内容创作与劳动力市场同步被重构,效率提升伴随职业替代,社会对话与再培训需求迫切。
2025-11-02

长文本高效处理突破

南理工等高校联合提出VIST框架,用“视觉中心化”思路把长文本当图像压缩,内存占用降50%、token用量减56%,在NeurIPS 2025获选。该方法为长文档理解、法律/医疗文本处理等高价值场景提供可扩展、低成本的全新技术路线。