2024-09-07
语音与声学通用大模型进展
国内首个端到端通用语音大模型「心辰Lingo」发布,支持多场景自然对话;MMS Zero-shot实现跨语言零样本语音识别,声学大模型正突破数据稀缺瓶颈,为低资源语言与实时交互应用提供新基座。
2024-03-31
OpenAI语音克隆突破
OpenAI正式公开隐藏一年多的Voice Engine,仅凭15秒音频即可跨语言克隆人声,已用于HeyGen及APP版ChatGPT语音对话,同时展示帮助失语者“重获声音”的公益场景,标志AI语音合成进入高保真、低门槛时代。