语音克隆 - AI话题

2026-05-09

AI硬件与终端创新

苹果拟2030年推出全息iPhone，年内先发布AI摄像头AirPods Pro；千问AI眼镜实现空间3D显示与主动叫车；小米OmniVoice支持600+语言语音克隆，终端AI竞赛从“软件”走向“穿戴+全息”。

全息iPhone AI眼镜语音克隆终端创新空间计算

2025-12-20

语音与伦理合规技术

语音克隆滥用风险加剧，研究者推出“语音同意验证机制”开源方案，确保用户知情授权；同时AI产品面临认知偏差、落地断层、体验割裂三大痛点，产业界呼吁构建可信交互标准，推动技术健康发展。

语音克隆伦理合规用户体验可信AI 同意验证

2025-10-21

语音克隆普惠化

Fish Audio S1将克隆门槛降至10秒音频、价格仅为ElevenLabs 1/6，开启“声音平权”；同时Poe上线模型排行榜，语音与文本模型同台竞技，加速C端声音经济爆发。

语音克隆 Fish Audio 成本骤降 Poe排行榜

2025-02-18

开源多模态狂飙

阶跃星辰、昆仑万维、腾讯混元等集中开源视频、语音、全模态大模型，国产单卡80秒生成短剧，降低创作门槛，推动AIGC进入“人人可用”阶段。

开源多模态视频生成语音克隆 AIGC

2024-11-05

语音/音频大模型爆发

Fish Audio、Hertz-dev 等开源低延迟语音克隆与对话模型集中发布，120 ms 级端到端会话成为新标杆，将重塑客服、社交、游戏配音等实时交互场景，推动“可对话 AI”生态快速成熟。

语音克隆实时对话开源模型低延迟 AI音频

2024-11-01

多模态生成大爆发

Suno 上线 AI 歌手克隆，D-ID 推出全身虚拟头像，Recraft v3 生图模型刷新 SOTA，Blendbox 支持图层级实时编辑，X-to-Voice 一键把推特变语音形象，多模态 AIGC 进入细粒度、可控制新阶段。

多模态 AIGC 虚拟人生图模型语音克隆

2024-10-20

开源大模型与数据基建

LLM360开源15万亿Token级训练全流程，Meta被批“污染开源”，国内F5-TTS零样本语音克隆开源，显示社区正用极致透明对抗封闭巨头，降低行业复现与再训练门槛，重塑开源生态话语权。

开源大模型数据透明语音克隆 LLM360 Meta

2024-08-15

伦理、版权与人才焦虑

Nature曝光学术出版商高价出售论文喂AI却未告知作者，美国演员工会达成AI语音克隆授权协议，超七成IT人担忧被AI工具取代，提示行业亟需建立数据授权、劳动替代与收益分配的新规则。

数据版权 AI取代伦理治理语音克隆学术出版

2024-04-15

语音克隆逼近真人

NaturalSpeech 3实现3秒零样本高保真语音克隆并可控情绪，国内高校联合微软突破，将重塑配音、客服、虚拟人等行业语音生产流程。

语音克隆零样本 NaturalSpeech 情绪控制微软

2024-03-31

OpenAI语音克隆突破

OpenAI正式公开隐藏一年多的Voice Engine，仅凭15秒音频即可跨语言克隆人声，已用于HeyGen及APP版ChatGPT语音对话，同时展示帮助失语者“重获声音”的公益场景，标志AI语音合成进入高保真、低门槛时代。

Voice Engine 语音克隆 OpenAI 跨语言失语者

2024-01-24

消费级AI硬件热潮与翻车

Rabbit R1五天卖5万台、苹果Vision Pro周末销18万台，但实测响应慢、生态短板遭吐槽；ElevenLabs凭1分钟语音克隆晋升独角兽，显示消费AI硬件“爆款易、口碑难”，供应链与体验优化仍是鸿沟。

AI硬件 Rabbit R1 Vision Pro 语音克隆 ElevenLabs

AI快开门

发现AI的无限可能

# 语音克隆