2026-01-05
开源大模型井喷
中国电信开源千亿参数MoE模型TeleChat3,实现国产万卡全栈训练;月之暗面新模型Kiwi-do现身竞技场;清华DragMesh、字节SeedFold等论文级成果集中放出。中国开源模型在参数规模、多模态与3D交互上集体突破,加速技术普惠与生态竞争。
2025-11-12
多模态与长文本理解突破
MMCTAgent支持小时级视频推理,清华&智谱Glyph压缩图像文本,DeepSeek-OCR极致Token效率,多模态RAG框架UltraRAG 2.1用YAML即可搭系统,长上下文战争进入“视觉+结构化”阶段。
2025-11-06
AI+行业应用规模化
钉钉AI表格成双11品牌运营引擎,Pinterest开源视觉推荐降本10倍,昕诺飞PIKE-RAG让客服准确率升12%。模型能力下沉到垂直场景,开始兑现降本增效,商业化进入“算账”阶段。
2025-10-14
多模态与RAG效率突破
Meta超级智能实验室REFRAG框架将RAG推理速度提升30倍,苹果FS-DFM长文本写作效率提高128倍,谢赛宁团队提出RAE有望替代VAE成为DiT新基石。核心架构创新显著降低推理与训练成本,为大模型规模化落地扫清性能瓶颈。
2025-07-20
实时视频生成与交互新体验
Decart发布零延迟、无限时长视频生成模型MirageLSD,支持直播场景即时风格转换与沉浸式交互,为实时内容创作、游戏及元宇宙应用打开新空间。
2025-07-01
多模态RAG与文档智能
港大RAG-Anything、RAGFlow等框架统一图文表公式,夸克生成千万份志愿报告,复杂格式理解能力跃升,推动企业知识库与搜索体验升级。
2025-06-21
RAG与向量检索效率突破
浙大与阿里团队开源PSP方法,仅改两行代码即可将RAG向量检索效率提升30%,已验证支持文搜文、图搜图、文搜图及十亿级推荐召回,为大规模知识库落地扫清性能瓶颈。
2025-06-16
AI智能体与RAG落地潮
GPTs、RAGFlow、Observer AI等Agent与增强检索方案集中发布,企业可零代码搭建“深度文档理解+自动操作”的数字员工,标志着大模型从对话玩具走向生产力工具,2025年有望成为AI Agent规模化商用元年。
2025-05-09
AI深度研究产品竞速
国内外大厂集中升级“深度研究”类AI搜索:OpenAI o4-mini强化微调上线,夸克将推“深度搜索Pro”对标DeepResearch,ChatGPT新增GitHub连接器实现代码级RAG,秘塔AI上线“讲题”功能,Genspark AI Sheets把表格分析对话化,标志AI从问答走向自主科研与数据分析,降低专业信息获取门槛。
2025-04-26
AI Agent产品化加速
OpenAI发布o3工具调用版并更新Agent评估指南,李飞飞/DeepSeek前员工开源RAGEN框架复现R1深度思考Agent,欧莱雅、WBCD等豪掷奖金办黑客松,标志2025成Agent规模化落地元年。
2025-04-21
大模型推理与幻觉治理
OpenAI o3/o4-mini在代码推理刷新纪录的同时,幻觉率飙升至33%,引发RL过度优化质疑;清华Hyper-RAG以超图增强知识关联,显著降低幻觉。行业共识:推理性能与可信度需同步提升,RAG、搜索-推理协同及原生1bit轻量化成为新方向,将决定大模型在医疗、法律等高可靠场景的落地速度。
2025-03-15
AI for Science加速落地
中科大团队发布多智能体机器人化学家,可自主完成实验全流程;清华开源AI制药平台OpenBioMed;南大MedRAG诊断准确率提升11%。大模型正从「读论文」走向「做实验」,科研自动化进入Autopilot时代,显著缩短研发周期。
2025-02-22
AI视频超长理解突破
港大联合百度推出VideoRAG,可在单张RTX 3090上实时理解数百小时长视频;清华Migician实现任意数量图片间的跨图定位;复旦发布视频扩散模型综述,覆盖300+文献,为长视频与多图场景理解提供新范式。
2025-02-02
国产RAG与生态工具
清华THUNLP联合多家团队开源UltraRAG,实现“零纠结”一键适配知识库的检索增强框架;同时硅基流动与华为合作推出全国产化DeepSeek API,白菜价且零门槛部署。国产链条从模型层快速下沉至工具与基础设施层,降低中小企业落地门槛,有望催生本土应用爆发。
2025-01-29
RAG技术再进化
清华开源RAG框架与行业实践显示,检索增强生成已成为大模型落地刚需,可显著提升回答准确性、时效性与态度鲜明度,降低幻觉,推动AI在知识密集型场景快速部署。
2025-01-24
边缘轻量AI与端侧落地
Hugging Face推出SmolVLM、MiniRAG等1-2B级小模型,在手机、车载、玩具等终端实现300倍体积压缩、75%存储节省,仍保持90%以上性能;JetBrains Junie、跃问App等原生IDE/创意工具集成,显示“小模型+端侧”正成为AI普惠新路径,降低云成本与隐私风险。
2024-11-22
AI安全与评估体系
国产模型在LiveBench指令跟随榜跃居全球第五、中文SimpleQA真实性基准发布、RAG四级难度分类法出炉,显示行业正构建更细粒度、更难“作弊”的评测体系,为模型落地提供可信度量尺。
2024-11-04
AI+机器人通用控制突破
Physical Intelligence 3B参数π0模型实现单一模型对7种机器人形态的通用家务控制,Meta发布Sparsh触觉编码器让机器人获得“人类级”灵巧操作,MIT新训练框架简化复杂任务求解,港大LightRAG用图结构提升机器人知识检索效率,显示“通用机器人大脑”正从实验室走向家庭与工厂。
2024-11-03
大模型推理效率突破
中科大提出Ada-KV自适应缓存压缩,微软清华借降噪思路升级注意力,RAG引入块状注意力,显著降低延迟与显存,为千亿级模型落地铺平道路。