2026-05-09

实时语音模型升级

阶跃星辰StepAudio 2.5 Realtime、OpenAI GPT-Realtime系列同日亮相,均将GPT-5级推理注入端到端语音,支持同传、情感副语言与低延迟API,成本砍至每分钟0.25元,开启“语音即服务”价格战。
2025-12-14

视觉通才与统一架构

港中文&美团开源OneThinker,用强化学习统一图像视频10类任务,在31项基准零样本跃升;谷歌同时推进AI同传耳机与AI浏览器,把多模态能力嵌入消费级硬件。视觉模型走向“一模型多任务”,降低开发碎片化,加速AR/VR、自动驾驶与智能眼镜落地。