虽然这些工具在内容创建和可访问性方面提供了合法用途,但它们也引起了对隐私和安全的严重担忧。以下是当前可用的关键语音克隆应用程序,以及其功能和潜在风险的证据。
1.十一实验室

点击展开
虽然这些工具在内容创建和可访问性方面提供了合法用途,但它们也引起了对隐私和安全的严重担忧。
ElevenLabs 是语音克隆行业最著名的参与者,提供消费级和专业级语音合成功能。
证据:多个来源证实了 ElevenLabs 的广泛采用。研究表明它被用于教育应用,一位消息人士指出“过去几个月,像 11labs 提供的语音克隆技术经常成为头条新闻。“安全研究人员已经记录了它在网络犯罪中的使用,SoSafe 报告称”他们现在正在使用 ElevenLabs 等平台来增强他们的网络犯罪策略。研究中记录的个人测试表明,用户可以使用以下命令创建语音克隆只是 5 分钟的音频样本。
ElevenLabs 的可访问性和质量使其成为合法用户和不良行为者的首选工具。该平台要求用户同意声明他们已同意的条款“上传和克隆这些语音样本的所有必要权利或同意,“但执法主要依靠自我报告。
用户应该意识到,任何公开的声音音频都可能被用来在此平台上创建克隆。考虑限制您公开分享的高质量录音的数量。
2. 描述

点击展开
Descript 提供语音克隆作为其综合视频和音频编辑套件的一部分,将该技术集成到现有的创意工作流程中。
证据: 根据详细的比较评论、Descript 与其他主要平台一起进行了测试,并获得了评估者的积极评价。审查指出“创造我的第一个声音需要一个学习曲线”但赞扬了它与编辑工具的集成。
Descript 与专业编辑工作流程的集成意味着语音克隆成为内容创建的常规部分,有可能使该技术正常化。该平台的编辑功能可以让创建复杂的深度伪造内容变得更加容易。
内容创作者在使用语音克隆技术时应实施明确的披露政策,并考虑对合成内容加水印。
3.播放.ht

点击展开
Play.ht 将自己定位为具有语音克隆功能的专业文本转语音平台,瞄准商业和内容创建市场。
证据:测试记录在研究显示 Play.ht 的结果好坏参半,评估人员注意到节奏和发音问题。然而,它仍然被列入可行的选择之列。
专业定位和商业许可可能会降低企业采用语音克隆技术的障碍。该平台对商业用例的关注可以加速主流接受度。
组织应围绕声音克隆的使用制定明确的政策,并确保声音可能被克隆的个人的适当同意。
4.语音.ai

点击展开
Voice.ai 将自己定位为免费的语音克隆软件,宣传创建自定义语音的能力“听起来和你或其他人一模一样。”
证据: 平台的官网声称用户“只需上传高质量的音频样本,我们的系统就会生成个性化的语音模型”。
“免费”语音克隆的营销可能会吸引那些不完全理解其含义的用户。该平台承诺克隆“任何其他人”的声音,这引发了人们对同意的道德担忧。
用户应仔细阅读服务条款并了解平台保留哪些音频数据。
5. 语音化

点击展开
Speechify 推广快速语音克隆功能、广告”30秒免费AI语音克隆!无需注册。”
证据: 平台的营销材料索赔那 ”借助 Speechify Studio 的尖端人工智能生成语音技术,您的声音克隆将在几秒钟内即可使用!据报道,用户只需要录制 20 秒的录音即可创建克隆。
极低的进入门槛(30 秒,无需注册)可能使该平台特别容易被滥用。快速设置过程可能无法为用户提供足够的时间来考虑道德影响。
向验证流程最少的平台提供语音样本时要谨慎。
如果您喜欢本指南,请关注我们以获取更多信息。
6.人工智能语音克隆(Google Play)

点击展开
该移动应用程序专门针对 Android 用户,提供由 ElevenLabs 技术支持的语音克隆功能。
证据: 这将其描述为“一款创新的语音生成应用程序,可让您利用 ElevenLabs 先进的人工智能技术的力量来重新创建您的朋友、家人,甚至您的偶像的声音!”该应用程序强调“您所需要做的就是提供所需声音的样本。”
移动可访问性使语音克隆更加方便,并且更有可能冲动使用。特别鼓励克隆“朋友、家人,甚至你的偶像”的营销语言表明对同意问题的考虑不够充分。
避免下载明确鼓励未经同意克隆他人声音的应用程序。
7.克隆人工智能(iOS)

点击展开
Clony AI 在 Apple App Store 上架,将语音和面部克隆功能结合在一个移动应用程序中。
证据:应用商店评论显示用户出于情感目的使用它,一位评论者表示:“我听到了我朋友的声音,而我所掌握的关于他的音频却很少……他在 15 岁时就自杀了,所以听到他的声音有奇怪的帮助。”该应用程序包括“语音转语音”功能。
移动应用程序中语音和面部克隆的结合显着增强了 Deepfake 功能。情感用例可能会模糊死者同意的道德界限。
在使用声音克隆技术重现死者的声音之前,请考虑心理和伦理影响。
8. 默夫

点击展开
Murf 宣传语音克隆功能,但据报道限制通过销售咨询而不是直接注册进行访问。
证据: 研究表明 Murf 宣传免费语音克隆,“但注册后,该功能隐藏在‘与销售人员交谈’按钮后面。”这表明了一种更受控制的语音克隆访问方法。
销售门控访问可以更好地筛选用户,但也可以表明针对具有潜在更广泛用例的商业客户。
Murf 销售团队接触的组织应仔细评估预期用例并建立适当的治理策略。
9.沃特斯

点击展开
VEED 将语音克隆集成到其更广泛的视频编辑平台中,使其成为标准内容创建工作流程的一部分。
证据:VEED出现在测试比较中免费的语音克隆工具。该平台将语音克隆定位为标准功能而不是专业服务。
融入主流视频编辑使语音克隆技术正常化,并可能导致在没有充分考虑影响的情况下随意使用的情况增加。
10. 代表

点击展开
Respeecher 瞄准专业市场,特别是娱乐和媒体制作领域。
证据:Respeecher 的技术用于合成《曼达洛人》中年轻卢克·天行者的声音,如该公司案例研究中所述。
专业级工具可能会产生更有说服力的克隆,并可用于大规模内容制作。行业采用可能会为合成语音的使用树立先例。
媒体专业人士应在使用专业语音克隆工具时建立披露和同意的行业标准。

点击展开
该研究揭示了语音克隆技术迅速民主化的前景,从研究实验室转向消费者应用。由于平台只需要 20-30 秒的音频,并且有些平台提供“免注册”访问,因此创建语音克隆的障碍实际上已经消失。
安全专家警告说,这种可访问性会产生新的攻击媒介,记录在案的数百万美元诈骗案使用克隆声音。这联邦贸易委员会表达了担忧关于语音克隆技术,以及研究表明,四分之一的人经历过或认识经历过声音克隆攻击的人。
随着这些工具的不断发展,用户必须平衡语音克隆技术的合法优势与其带来的隐私和安全风险。关键是了解哪些平台可以访问您的语音数据,并实施适当的保护措施以防止滥用。
如果您喜欢本指南,请关注我们以获取更多信息。
