← 返回模型历史
微软 21 个模型
模型系列(1)
| 发布日期 | 公司 | 模型名称 | 系列 | 类型 | 特性 |
|---|---|---|---|---|---|
| 2026-04-14 | 微软 | MAI-Image-2-Efficient | - | MAI-Image-2的升级版本,高效低成本 | |
| 2026-03-29 | 微软 | VibeVoice-ASR-7B | - | 语音转文本模型,能一次性处理长达60分钟的音频文件,直接输出结构化转录结果 | |
| 2026-03-29 | 微软 | VibeVoice-TTS-1.5B | - | 文本转语音模型,单次生成长达90分钟的连续音频,支持最多4个不同说话人进行自然对话模拟 | |
| 2026-03-29 | 微软 | VibeVoice-Realtime-0.5B | - | 专注实时场景,支持流式文本输入,首音频输出延迟约300毫秒,还能生成约10分钟的长篇语音 | |
| 2026-03-19 | 微软 | MAI-Image-2 | - | 微软第二代图像生成模型,在权威评测榜单 LMArena 中跃升至全球第三位 | |
| 2026-03-04 | 微软 | Phi-4-Reasoning-Vision-15B | Phi | 主流 | 开源小型多模态模型,具备高分辨率的视觉感知能力,进行深度推理 |
| 2026-01-22 | 微软 | TRELLIS.2 | - | 开源3D生成模型,3秒生成高分辨率的全纹理资产 | |
| 2026-01-22 | 微软 | Rho-alpha | - | 实现自然语言与机器人控制信号的直接转换,支持复杂的双手协同操作 | |
| 2025-12-05 | 微软 | VibeVoice 0.5B | - | 0.5B参数300毫秒实时开口 | |
| 2025-10-14 | 微软 | MAI-Image-1 | - | 微软首款自研图像生成模型 | |
| 2025-10-10 | 微软 | UserLM-8b | - | 陪练伙伴,多轮对话 | |
| 2025-09-05 | 微软 | GPT-realtime | - | 语音转语音模型,更逼真语音与多模态输入 | |
| 2025-08-29 | 微软 | MAI-Voice-1 | - | 微软首款自研语音大模型 | |
| 2025-06-24 | 微软 | Mu | - | 小参数模型,性能比肩 Phi-3.5-mini | |
| 2025-02-26 | 微软 | Phi-4-mini | Phi | 主流 | 迷你模型,专注于文本处理任务,参数量380M |
| 2025-02-26 | 微软 | Phi-4-multimodal | Phi | 主流 | 多模态与迷你模型 |
| 2024-12-12 | 微软 | Phi-4 | Phi | 主流 | 14B稠密,主打STEM & 推理 |
| 2024-08-21 | 微软 | Phi-3.5-vision | Phi | 主流 | 轻量级多模态开源模型 |
| 2024-04-23 | 微软 | Phi-3 | Phi | 主流 | 3.8B–14B四档参数,128k上下文,端侧友好,全部开源 |
| 2023-12-14 | 微软 | Phi-2 | Phi | 主流 | 2.7B参数达到25B级性能,开源 |
| 2023-06-20 | 微软 | Phi-1 | Phi | 主流 | 1.3B参数 |