2025-05-30
大模型推理与效率突破
华为、DeepSeek、斯坦福等接连发布推理加速、长思维链涌现、低延迟内核等新技术,显著降低算力消耗并提升准确率,标志着后训练优化成为大模型落地关键路径,为端侧部署与实时交互打开空间。
2024-11-05
语音/音频大模型爆发
Fish Audio、Hertz-dev 等开源低延迟语音克隆与对话模型集中发布,120 ms 级端到端会话成为新标杆,将重塑客服、社交、游戏配音等实时交互场景,推动“可对话 AI”生态快速成熟。