2024-12-19
多模态与物理仿真突破
Genesis Project、BlueQubit、PaliGemma2等新品发布,4D生成式物理引擎、量子+AI、视觉语言多模态能力显著提升,为机器人、XR内容创作提供高保真训练与交互环境。
2024-05-18
视觉-语言与开源生态
Google开源PaliGemma多分辨率VLM家族,HuggingFace发布视觉大模型训练 cookbook,腾讯光子开源ID-Animator实现照片+文字生成定制视频,降低多模态门槛并丰富开源工具链。