2026-06-26

多模态与视觉生成技术突破

多模态大模型与3D视觉技术取得关键进展。NVIDIA提出PiD像素扩散架构实现4K生成,Mistral OCR4支持170种语言识别,影石开源UniSHARP突破单目3DGS难题,谷歌Gemini获得Computer use能力。这些进展推动AI在图像、视频及终端交互领域边界持续拓展。
2024-12-12

资本持续加码AI垂直场景

Anybotics、RapidCanvas、Enveda等获高额融资,涵盖四足机器人、AI编码、AI制药等细分赛道,表明资本正从通用模型转向能快速商业落地的垂直场景与硬件。
2024-02-25

因果与可解释AI升温

从NeurIPS spotlight的高斯部分信息分解到BAAI因果涌现读书会,因果推断正成为大模型可解释、鲁棒与科学计算的新支点。学界尝试用因果结构先验改进学习范式,工业界则关注其在医疗、决策等高 stakes 场景下的可靠性,2024年因果+AI进入“范式初探”到“落地验证”过渡期。