发布日期 公司 模型名称 系列 类型 特性
2026-04-16 腾讯 HunyuanWorld-2.0 - 主流 3D 世界模型,自动生成、重建和模拟3D 世界。能够与现有游戏工作流无缝衔接
2026-04-15 月之暗面 Kimi-K2.6-code-preview Kimi 主流 专为 AI 编程优化的万亿参数大模型,比肩 Sonnet4.6
2026-04-15 Google Gemini 3.1 Flash TTS Gemini 主流 最强TTS模型,支持近 70 种语言。支持通过提示词直接调控语音的情感、节奏和风格
2026-04-10 智谱AI GLM-5.1 GLM 主流 全球首个能实现“8小时连续工作”的开源模型,代码能力登顶
2026-04-10 MiniMax MiniMax-Music-2.6 MiniMax 主流 延迟骤降、精准控制、声学质感;上线Cover与 AI Agent 技能
2026-04-09 字节跳动 Seeduplex - 主流 原生全双工语音大模型,豆包端到端语音模型的重大升级,实现了“边听边说”的同步处理框架,从底层架构上释放了语音交互的自然感
2026-04-09 Meta Muse Spark - 主流 作为 Llama4的接班人,多模态与逻辑推理性能飞跃
2026-04-09 阿里 HappyHorse-1.0 - 主流 登顶AI视频榜,Elo积分力压Seedance2.0
2026-04-08 爱诗科技 PixVerse C1 PixVerse 主流 首个面向影视行业的专业大模型,15 秒 1080P 音画同步
2026-04-08 小米 OmniVoice - 主流 开源 TTS 模型,支持超过600种语言,在中英文及多语言基准测试中多项关键指标达到 SOTA,词错误率(WER)仅为0.84%
2026-04-08 Anthropic Claude Mythos Claude 主流 被誉为“史上最强”的 AI 模型,输出价格高达 125美元/百万 Token
2026-04-03 阿里通义 Wan2.7 Wan 主流 视频编辑、视频续写与动作模仿三大核心功能,几句话搞定视频编辑和动作续写
2026-04-03 美团 LongCat-Next LongCat 主流 开源原生多模态大模型,视觉语音实现底层统一
2026-04-03 Google Gemma 4 Gemma 主流 专为高级推理与智能体工作流设计,实现业界领先的“单位参数智能水平”
2026-04-02 智谱AI GLM-5V-Turbo GLM 主流 专为视觉编程打造的多模态 Coding 基座模型,原生多模态感知,上下文扩展至 200k。从“草图”到“成品”的秒级跨越
2026-04-02 阿里通义 Qwen3.6-Plus Qwen 主流 百万级上下文,全面适配 Agent 框架;从“看懂设计稿”到“一键生成网页”
2026-04-01 阿里通义 Wan2.7-Image Wan 主流 图像生成与编辑统一模型,打破 AI 生成图像中常见的“千篇一律”感
2026-03-31 Google Veo 3.1 Lite Veo 主流 成本低至每秒0.05美元,算力与画质的精密平衡,720P 成为高性价比首选
2026-03-30 阿里通义 Qwen3.5-Omni Qwen 主流 215项 SOTA 狂揽,全模态性能跨越式超越 Gemini
2026-03-25 Google Gemini 3.1 Flash Lite Gemini 主流 凭借极高的推理效率,能够实现几乎“实时”的网页渲染,将 AI 从简单的文本交互推向了动态 UI 构建的前沿
2026-03-20 阿里通义 Qwen3.5-Max-Preview Qwen 主流 刷新国产模型的得分纪录,在多维度评测中实现了对比海外顶尖模型GPT5.4、Claude4.5及Grok4.1的性能超越
2026-03-19 小米 MiMo-V2-Pro - 主流 面向智能体时代的旗舰模型,具备极强的任务拆解与自主执行能力
2026-03-19 Anthropic Claude Sonnet 4.6 Claude 主流 从模型提供商向“智能体平台”转型;编程能力飞跃:在代码一致性、指令遵循以及“计算机使用”(Computer Use)技能方面表现出更高精度
2026-03-19 Cursor Composer 2 - 主流 性能硬刚 GPT 与 Claude,成本降幅高达90%
2026-03-18 小米 MiMo-V2-Omni - 主流 全模态基座,实现了文本、视觉与音频的原生融合
↓ 向下滚动加载更多内容