← 返回模型历史

微软 21 个模型

模型系列(1)

发布日期 公司 模型名称 系列 类型 特性
2026-04-14 微软 MAI-Image-2-Efficient - MAI-Image-2的升级版本,高效低成本
2026-03-29 微软 VibeVoice-ASR-7B - 语音转文本模型,能一次性处理长达60分钟的音频文件,直接输出结构化转录结果
2026-03-29 微软 VibeVoice-TTS-1.5B - 文本转语音模型,单次生成长达90分钟的连续音频,支持最多4个不同说话人进行自然对话模拟
2026-03-29 微软 VibeVoice-Realtime-0.5B - 专注实时场景,支持流式文本输入,首音频输出延迟约300毫秒,还能生成约10分钟的长篇语音
2026-03-19 微软 MAI-Image-2 - 微软第二代图像生成模型,在权威评测榜单 LMArena 中跃升至全球第三位
2026-03-04 微软 Phi-4-Reasoning-Vision-15B Phi 主流 开源小型多模态模型,具备高分辨率的视觉感知能力,进行深度推理
2026-01-22 微软 TRELLIS.2 - 开源3D生成模型,3秒生成高分辨率的全纹理资产
2026-01-22 微软 Rho-alpha - 实现自然语言与机器人控制信号的直接转换,支持复杂的双手协同操作
2025-12-05 微软 VibeVoice 0.5B - 0.5B参数300毫秒实时开口
2025-10-14 微软 MAI-Image-1 - 微软首款自研图像生成模型
2025-10-10 微软 UserLM-8b - 陪练伙伴,多轮对话
2025-09-05 微软 GPT-realtime - 语音转语音模型,更逼真语音与多模态输入
2025-08-29 微软 MAI-Voice-1 - 微软首款自研语音大模型
2025-06-24 微软 Mu - 小参数模型,性能比肩 Phi-3.5-mini
2025-02-26 微软 Phi-4-mini Phi 主流 迷你模型,专注于文本处理任务,参数量380M
2025-02-26 微软 Phi-4-multimodal Phi 主流 多模态与迷你模型
2024-12-12 微软 Phi-4 Phi 主流 14B稠密,主打STEM & 推理
2024-08-21 微软 Phi-3.5-vision Phi 主流 轻量级多模态开源模型
2024-04-23 微软 Phi-3 Phi 主流 3.8B–14B四档参数,128k上下文,端侧友好,全部开源
2023-12-14 微软 Phi-2 Phi 主流 2.7B参数达到25B级性能,开源
2023-06-20 微软 Phi-1 Phi 主流 1.3B参数