2025-06-16
多模态大模型技术突破
蚂蚁Ming-Omni、字节Seaweed APT2、腾讯混元3D 2.1等开源或发布,实现语音-视觉-动作一体化生成;哈佛BRIDGE、哈工大EFFIVLM-BENCH等新基准同步推出,推动多模态理解与生成的标准化和可评测进程。
2024-11-08
AI视频生成全面提速
Meta AdaCache、快手可灵、智谱CogVideoX v1.5、字节Seaweed等密集发布,4K/60帧、10秒短片、角色一致性、手机端APP齐落地,标志着AI视频生成进入“可用、可玩、可商用”阶段,内容创作门槛被进一步击穿。