2026-06-26
多模态与视觉生成技术突破
多模态大模型与3D视觉技术取得关键进展。NVIDIA提出PiD像素扩散架构实现4K生成,Mistral OCR4支持170种语言识别,影石开源UniSHARP突破单目3DGS难题,谷歌Gemini获得Computer use能力。这些进展推动AI在图像、视频及终端交互领域边界持续拓展。
2024-12-12
资本持续加码AI垂直场景
Anybotics、RapidCanvas、Enveda等获高额融资,涵盖四足机器人、AI编码、AI制药等细分赛道,表明资本正从通用模型转向能快速商业落地的垂直场景与硬件。