2025-11-13
国产模型垂直场景突破
东北大学开源60语种NiuTrans.LMT、Reverie推出印地语语音识别超越Deepgram、清华LimiX-2M 2M参数表格理解极限模型、阿里0.6B简历解析神器等,显示国产大模型在低资源语言、文档理解、招聘等垂直场景实现参数高效、成本极低的SOTA性能,加速行业渗透。
2025-07-01
多模态RAG与文档智能
港大RAG-Anything、RAGFlow等框架统一图文表公式,夸克生成千万份志愿报告,复杂格式理解能力跃升,推动企业知识库与搜索体验升级。
2025-06-16
AI智能体与RAG落地潮
GPTs、RAGFlow、Observer AI等Agent与增强检索方案集中发布,企业可零代码搭建“深度文档理解+自动操作”的数字员工,标志着大模型从对话玩具走向生产力工具,2025年有望成为AI Agent规模化商用元年。
2025-03-07
多模态文档与视频理解突破
Mistral OCR API号称全球最强,千页7元即可解析;腾讯混元开源图生视频模型,Runway上线首帧风格迁移;智源BGE-VL、IDEA DINO-XSeek在图文检索、自然语言目标检测刷新SOTA,多模态能力正从“看得清”走向“看得懂”。