2025-12-02
多模态大模型井喷
谷歌Gemini 3、阿里Z-Image、字节Vidi2、华为扩散语言模型等密集发布,文本-图像-视频-音频统一架构成为主流,推理成本骤降、上下文突破32K,标志生成式AI进入“原生多模态”新阶段,直接重塑内容生产、搜索与终端交互体验。
2025-10-21
语音克隆普惠化
Fish Audio S1将克隆门槛降至10秒音频、价格仅为ElevenLabs 1/6,开启“声音平权”;同时Poe上线模型排行榜,语音与文本模型同台竞技,加速C端声音经济爆发。
2025-08-27
超高效推理与架构革新
NVIDIA Jet-Nemotron、谷歌Gemini 2.5 Flash Image、华为云384超节点等集中发布,通过FP4/FP8混合精度、后NAS架构、超节点Scale-Up把推理成本砍90%以上,吞吐提升数十倍,标志大模型进入“低价高并发”时代,将直接重塑云厂商定价、AI应用商业模式与边缘部署格局。
2025-08-27
多模态创意与AIGC普惠
谷歌“nano banana”单图3毛钱、字节Waver 1.0、百度MuseSteamer 2.0、美图全能修复等把视频、图像、动画生成成本打到消费级;腾讯VISVISE让游戏动画效率提升8倍。AIGC进入“平价创意”阶段,将冲击传统设计、广告与短视频产业链。
2025-08-25
视频/多模态生成门槛骤降
阿里Vivid-VR、百度“蒸汽机2.0”、苹果SlowFast-LLaVA、南大MMPL等模型实现秒级长视频、多人有声镜头、老片修复一键完成,成本降至1.4元/5秒,UGC创作者的“导演权”被彻底 democratize。
2025-06-11
字节豆包大模型全家桶
字节跳动密集发布豆包1.6大模型、Seedance 1.0视频生成、语音播客/实时语音模型及火山引擎MCP服务,成本骤降、日调用量已超16.4万亿tokens,市占率46%,同步升级AI IDE产品TRAE月活破百万,形成从基础模型到开发工具的全栈生态,宣告国内大模型进入规模化落地新阶段。
2025-03-04
国产开源模型爆发
智谱CogView4、MiniMax Image-01、豆包SuperGPQA、Wan2.1 GP等国产模型密集开源,覆盖文生图、视频、多模态推理,成本降至1/10,中文原生支持成为亮点,显著降低开发者门槛并加速应用落地。
2025-02-11
DeepSeek生态爆发
国产大模型DeepSeek-R1在超算、运营商、手机、音乐、搜索、教育等场景集中落地,开源数据与API同步放出,标志中国大模型首次形成端到端生态闭环,成本骤降90%以上引发全球重估AI算力需求。