低延迟 - AI话题 - AI快开门

2026-05-08

OpenAI三连发GPT-Realtime系列，首次把GPT-5级推理、同声传译、超低延迟语音转录合一，翻译与客服成本被“砍穿地板”，多语言交互进入“自然打断”时代，将重塑呼叫中心、国际会议与移动应用。

2025-05-30

华为、DeepSeek、斯坦福等接连发布推理加速、长思维链涌现、低延迟内核等新技术，显著降低算力消耗并提升准确率，标志着后训练优化成为大模型落地关键路径，为端侧部署与实时交互打开空间。

2024-11-05

Fish Audio、Hertz-dev 等开源低延迟语音克隆与对话模型集中发布，120 ms 级端到端会话成为新标杆，将重塑客服、社交、游戏配音等实时交互场景，推动“可对话 AI”生态快速成熟。

2024-01-04

MobileVLM可在骁龙888手机实时运行，MIT-普林斯顿-CMU把LLM用于聚变数据即时决策，显示大模型正向“小型化、低延迟、现场部署”演进，为自动驾驶、工业控制等实时场景打开新空间。

# 低延迟