微软发布记录 - AI快开门

模型系列（1）

发布日期	公司	模型名称	系列	类型	特性
2026-04-14	微软	MAI-Image-2-Efficient	-		MAI-Image-2的升级版本，高效低成本
2026-03-29	微软	VibeVoice-ASR-7B	-		语音转文本模型，能一次性处理长达60分钟的音频文件，直接输出结构化转录结果
2026-03-29	微软	VibeVoice-TTS-1.5B	-		文本转语音模型，单次生成长达90分钟的连续音频，支持最多4个不同说话人进行自然对话模拟
2026-03-29	微软	VibeVoice-Realtime-0.5B	-		专注实时场景，支持流式文本输入，首音频输出延迟约300毫秒，还能生成约10分钟的长篇语音
2026-03-19	微软	MAI-Image-2	-		微软第二代图像生成模型，在权威评测榜单 LMArena 中跃升至全球第三位
2026-03-04	微软	Phi-4-Reasoning-Vision-15B	Phi	主流	开源小型多模态模型，具备高分辨率的视觉感知能力，进行深度推理
2026-01-22	微软	TRELLIS.2	-		开源3D生成模型，3秒生成高分辨率的全纹理资产
2026-01-22	微软	Rho-alpha	-		实现自然语言与机器人控制信号的直接转换，支持复杂的双手协同操作
2025-12-05	微软	VibeVoice 0.5B	-		0.5B参数300毫秒实时开口
2025-10-14	微软	MAI-Image-1	-		微软首款自研图像生成模型
2025-10-10	微软	UserLM-8b	-		陪练伙伴，多轮对话
2025-09-05	微软	GPT-realtime	-		语音转语音模型，更逼真语音与多模态输入
2025-08-29	微软	MAI-Voice-1	-		微软首款自研语音大模型
2025-06-24	微软	Mu	-		小参数模型，性能比肩 Phi-3.5-mini
2025-02-26	微软	Phi-4-mini	Phi	主流	迷你模型，专注于文本处理任务，参数量380M
2025-02-26	微软	Phi-4-multimodal	Phi	主流	多模态与迷你模型
2024-12-12	微软	Phi-4	Phi	主流	14B稠密，主打STEM & 推理
2024-08-21	微软	Phi-3.5-vision	Phi	主流	轻量级多模态开源模型
2024-04-23	微软	Phi-3	Phi	主流	3.8B–14B四档参数，128k上下文，端侧友好，全部开源
2023-12-14	微软	Phi-2	Phi	主流	2.7B参数达到25B级性能，开源
2023-06-20	微软	Phi-1	Phi	主流	1.3B参数

AI快开门

发现AI的无限可能

微软 21 个模型

模型系列（1）