RAG - AI话题 - AI快开门

2026-06-17

AI硬件与空间计算设备

Snap发布2195美元AR眼镜SPECS，VITURE联合英伟达推出工业级AI眼镜Helix，高通发布Snapdragon START计划加速个人AI设备上市。苹果iPadOS 27强化生产力，AI硬件从消费级到工业级全面开花，空间计算与端侧AI生态加速成熟。

AR眼镜 AI硬件空间计算 Snapdragon 端侧AI

2026-01-05

开源大模型井喷

中国电信开源千亿参数MoE模型TeleChat3，实现国产万卡全栈训练；月之暗面新模型Kiwi-do现身竞技场；清华DragMesh、字节SeedFold等论文级成果集中放出。中国开源模型在参数规模、多模态与3D交互上集体突破，加速技术普惠与生态竞争。

开源大模型 TeleChat3 Kiwi-do DragMesh SeedFold

2025-11-12

多模态与长文本理解突破

MMCTAgent支持小时级视频推理，清华&智谱Glyph压缩图像文本，DeepSeek-OCR极致Token效率，多模态RAG框架UltraRAG 2.1用YAML即可搭系统，长上下文战争进入“视觉+结构化”阶段。

多模态长文本 RAG 视频理解 OCR

2025-11-06

AI+行业应用规模化

钉钉AI表格成双11品牌运营引擎，Pinterest开源视觉推荐降本10倍，昕诺飞PIKE-RAG让客服准确率升12%。模型能力下沉到垂直场景，开始兑现降本增效，商业化进入“算账”阶段。

行业AI 降本增效 RAG 视觉推荐商业化

2025-10-14

多模态与RAG效率突破

Meta超级智能实验室REFRAG框架将RAG推理速度提升30倍，苹果FS-DFM长文本写作效率提高128倍，谢赛宁团队提出RAE有望替代VAE成为DiT新基石。核心架构创新显著降低推理与训练成本，为大模型规模化落地扫清性能瓶颈。

RAG REFRAG FS-DFM RAE 效率

2025-07-20

实时视频生成与交互新体验

Decart发布零延迟、无限时长视频生成模型MirageLSD，支持直播场景即时风格转换与沉浸式交互，为实时内容创作、游戏及元宇宙应用打开新空间。

实时视频生成零延迟 MirageLSD 直播交互

2025-07-01

多模态RAG与文档智能

港大RAG-Anything、RAGFlow等框架统一图文表公式，夸克生成千万份志愿报告，复杂格式理解能力跃升，推动企业知识库与搜索体验升级。

多模态RAG RAGFlow 知识图谱文档理解夸克

2025-06-21

RAG与向量检索效率突破

浙大与阿里团队开源PSP方法，仅改两行代码即可将RAG向量检索效率提升30%，已验证支持文搜文、图搜图、文搜图及十亿级推荐召回，为大规模知识库落地扫清性能瓶颈。

RAG 向量检索 PSP 效率优化开源

2025-06-16

AI智能体与RAG落地潮

GPTs、RAGFlow、Observer AI等Agent与增强检索方案集中发布，企业可零代码搭建“深度文档理解+自动操作”的数字员工，标志着大模型从对话玩具走向生产力工具，2025年有望成为AI Agent规模化商用元年。

AI Agent RAGFlow Observer AI 文档理解自动化

2025-05-09

AI深度研究产品竞速

国内外大厂集中升级“深度研究”类AI搜索：OpenAI o4-mini强化微调上线，夸克将推“深度搜索Pro”对标DeepResearch，ChatGPT新增GitHub连接器实现代码级RAG，秘塔AI上线“讲题”功能，Genspark AI Sheets把表格分析对话化，标志AI从问答走向自主科研与数据分析，降低专业信息获取门槛。

深度研究 AI搜索代码RAG 数据分析 ChatGPT

2025-04-26

AI Agent产品化加速

OpenAI发布o3工具调用版并更新Agent评估指南，李飞飞/DeepSeek前员工开源RAGEN框架复现R1深度思考Agent，欧莱雅、WBCD等豪掷奖金办黑客松，标志2025成Agent规模化落地元年。

AI Agent OpenAI o3 RAGEN 黑客松工具调用

2025-04-21

大模型推理与幻觉治理

OpenAI o3/o4-mini在代码推理刷新纪录的同时，幻觉率飙升至33%，引发RL过度优化质疑；清华Hyper-RAG以超图增强知识关联，显著降低幻觉。行业共识：推理性能与可信度需同步提升，RAG、搜索-推理协同及原生1bit轻量化成为新方向，将决定大模型在医疗、法律等高可靠场景的落地速度。

大模型幻觉 Hyper-RAG o3模型 RAG 1bit模型

2025-03-15

AI for Science加速落地

中科大团队发布多智能体机器人化学家，可自主完成实验全流程；清华开源AI制药平台OpenBioMed；南大MedRAG诊断准确率提升11%。大模型正从「读论文」走向「做实验」，科研自动化进入Autopilot时代，显著缩短研发周期。

AI化学家 OpenBioMed MedRAG 科研自动化 AI制药

2025-02-22

AI视频超长理解突破

港大联合百度推出VideoRAG，可在单张RTX 3090上实时理解数百小时长视频；清华Migician实现任意数量图片间的跨图定位；复旦发布视频扩散模型综述，覆盖300+文献，为长视频与多图场景理解提供新范式。

VideoRAG Migician 长视频多图定位视频扩散

2025-02-02

国产RAG与生态工具

清华THUNLP联合多家团队开源UltraRAG，实现“零纠结”一键适配知识库的检索增强框架；同时硅基流动与华为合作推出全国产化DeepSeek API，白菜价且零门槛部署。国产链条从模型层快速下沉至工具与基础设施层，降低中小企业落地门槛，有望催生本土应用爆发。

UltraRAG 国产化知识库 API 零门槛

2025-01-29

RAG技术再进化

清华开源RAG框架与行业实践显示，检索增强生成已成为大模型落地刚需，可显著提升回答准确性、时效性与态度鲜明度，降低幻觉，推动AI在知识密集型场景快速部署。

RAG 清华检索增强落地

2025-01-24

边缘轻量AI与端侧落地

Hugging Face推出SmolVLM、MiniRAG等1-2B级小模型，在手机、车载、玩具等终端实现300倍体积压缩、75%存储节省，仍保持90%以上性能；JetBrains Junie、跃问App等原生IDE/创意工具集成，显示“小模型+端侧”正成为AI普惠新路径，降低云成本与隐私风险。

小模型边缘计算端侧AI 轻量RAG

2024-11-22

AI安全与评估体系

国产模型在LiveBench指令跟随榜跃居全球第五、中文SimpleQA真实性基准发布、RAG四级难度分类法出炉，显示行业正构建更细粒度、更难“作弊”的评测体系，为模型落地提供可信度量尺。

模型评估中文基准指令跟随 RAG 安全性

2024-11-04

AI+机器人通用控制突破

Physical Intelligence 3B参数π0模型实现单一模型对7种机器人形态的通用家务控制，Meta发布Sparsh触觉编码器让机器人获得“人类级”灵巧操作，MIT新训练框架简化复杂任务求解，港大LightRAG用图结构提升机器人知识检索效率，显示“通用机器人大脑”正从实验室走向家庭与工厂。

通用机器人 π0模型触觉感知图RAG 家务自动化

2024-11-03

大模型推理效率突破

中科大提出Ada-KV自适应缓存压缩，微软清华借降噪思路升级注意力，RAG引入块状注意力，显著降低延迟与显存，为千亿级模型落地铺平道路。

KV缓存注意力机制推理加速 RAG

# RAG