2025-09-07
多模态视频理解突破
快手开源Keye-VL 1.5,以128k上下文、0.1秒级定位刷新Video-MME榜单,SceneSplat把3D高斯与语言对齐,表明视频-3D-语言统一模型正快速逼近商用门槛。
2024-06-23
前沿算法与效率突破
南大&旷视提出无需人工或 GPT-4 标注的无监督对齐范式,显著降低视觉大模型训练成本;清华&哈佛 LangSplat 将 3D 语义高斯泼溅提速 199 倍;何恺明 MIT 首秀聚焦 AI 生成新框架。多项算法创新在 CVPR、ICML 等顶会亮相,为大模型降本增效提供底层技术支撑。