亲身体验 Microsoft Copilot 的新音频 AI,听起来比 ChatGPT 更个性化
继推出具有AI功能的屏幕分析工具Copilot Vision之后,微软又有一款新产品正在测试中。 Windows 最新测试了 Copilot Audio Expressions,这是一种 AI 语音生成工具,可以为您的脚本生成类似人类的音频输出,甚至可以根据您的意愿进行创意控制。
该工具可在 Copilot Labs 官方网站上进行测试,您可以在其中试用该工具。它有两种模式,感性的和故事,有近十几种声音和风格选择。 Windows 最新版对该功能的工作原理进行了深入分析,尝试了不同的语音和语气选项,该工具非常擅长它的功能。但它只提供英语作为主要语言。
首先,我们从一个虚拟脚本开始,讲述一个繁忙的火车站的场景。我们将脚本输入提示字段,添加一行脚本来指定语音风格。

我们选择了表情作为模式选项橡木声音和叙述风格。该工具很快就生成了音频,我们可以使用集成的网络播放器来播放该音频。

表情模式每个音频剪辑最多生成 59 秒。我们期望一种简化的旁白,即人工智能语音大声朗读文本。令人惊讶的是,音频剪辑擅自使用了所提供的脚本,并添加了一些片段,重新措辞了句子,使其听起来更有吸引力。它为已经很好的脚本片段添加了微小但有用的细节。
我们喜欢这样一个事实:您无需登录即可下载音频文件,并且它使用MP3格式。因此,在任何设备或播放器上播放都不会出现问题。副驾驶音频表达给我们留下了深刻的印象表情具有精细控制的模式,但我们想探索故事模式也。
另请阅读:Windows 11 的内置 Copilot Vision 可以看到您的屏幕,现在可以在任何地方免费使用(动手操作)
使用故事模式生成引人入胜的故事
接下来,我们选择了故事自动选择声音和风格并且不提供调整选项的模式。您可以通过提示指定您想要的内容,但我们采用了基本提示“讲述一只猫潜伏在阴影中以填充猎物的故事”。
这次,该工具炮制了一个 90 秒的故事,讲述一个人讲述一只猫寻找猎物的故事。它既有叙述者的声音(美国口音),也有猫的英国口音(是的,猫在这个故事中说话,表达它的饥饿)。两者完美同步,听起来像是一种协作,而不是平淡的人工智能声音。

您可以查看两个音频片段以检查输出质量。
我们发现它不愧为人工智能音频生成工具,您可以用它来创建音频剪辑。尝试使用该工具副驾驶实验室网站。
支持独立博客
WL通讯
WL通讯!
掌握最新的 Windows、IT 和 AI 更新。受到 50,000 多名订阅者的信赖。
姓名电子邮件免费加入
