2026-06-02

大模型技术突破与多模态演进

国内外大模型技术持续突破,百度发布PaddleOCR-VL-1.6刷新文档解析SOTA,阿里推出Qwen3.7-Plus多模态智能体模型,MiniMax M3提升推理效率,字节开源Bernini视频编辑框架。英伟达联合清华发布Gamma-World多智能体世界模型,推动多模态大模型向复杂场景理解迈进。
2025-10-18

轻量化模型与端侧OCR

百度0.9B PaddleOCR-VL横扫4项SOTA并登顶Hugging Face,证明“小模型+多模态”在文档解析场景已可替代大模型,实现PC级本地部署。端侧轻量化趋势将降低开发者门槛,推动OCR、文档理解在政企、教育、金融场景快速渗透。