根据Microsoft在3月4日的官方公告,最近,Azure认知服务中的语音服务的一部分-自定义神经语音-文本到语音功能已全面启动。
此功能将允许用户使用Microsoft开拓性的神经文本语音转换模型为应用程序创建高度逼真的,类似人的自定义声音。
因为创建的声音非常逼真,所以Microsoft限制了访问权限,以便用户可以负责任地使用此技术。
微软表示:“作为微软对负责任的人工智能的承诺的一部分,我们设计和发布自定义神经语音的目的是保护个人和社会的权利,促进透明的人机交互,并抵制有害的深层伪装和误导性内容。
因此,我们限制了自定义神经语音的访问和使用。
“要创建自定义语音,您只需录制音频并将其作为培训数据上传。
Azure语音服务将为您的录制创建独特的语音调整。
自定义神经语音的声音逼真自然,可以代表品牌,允许用户以自然的方式与应用程序交互。
Microsoft强调,以下客户已经在使用此最新的TTS功能。
AT& T /华纳兄弟公司:他们最近在德克萨斯州达拉斯的AT& T体验店推出了首个创意和互动体验,客户可以在这里直接与Bugs Bunny交谈。
渐进式:使用标志性渐进式保险发言人Flo的声音,创建了Flo聊天机器人,以简化客户咨询过程并提供个性化的体验。
Duolingo:为了使学习新语言变得切实可行和适用,Duolingo使用课程来创建各种风格的声音。