AI快开门

发现最好的AI工具

2025-10-17

多模态大模型突破

李飞飞团队RTFM实现单卡实时3D世界生成,谷歌Gemini 3.0 Pro、百度PaddleOCR-VL等刷新OCR与推理纪录,开源LLaVA-OneVision-1.5登顶多模态榜单,显示视觉-语言-动作统一模型正快速走向实用化,为下一代交互与内容生产奠定基础。
2024-12-11

视频生成大模型爆发

OpenAI Sora正式开放,Adobe-MIT CausVid实现1.3秒首帧延迟,字节Infinity、智源See3D、快手可灵、MiniMax海螺等国产模型同台竞技,标志着AI视频生成进入实时、高分辨率、3D化的新阶段,内容创作与影视工业面临重塑。