AI快开门

发现最好的AI工具

2025-08-26

超长语音与视频生成突破

微软开源VibeVoice系列TTS模型,支持90分钟多人对话级中文合成;谷歌Imagen 4登陆Gemini API;港大&可灵提出“记忆检索”实现长视频一致性;GPT-5视频Agent一句话生成商业广告,多模态生成进入“长时高清”新阶段。