什么是 Amazon Polly?
Amazon Polly 是亚马逊网络服务(AWS)提供的一项基于云的服务,可将文本转换为逼真的语音。它使开发人员能够创建会说话的应用程序,从而开发出全新类别的语音功能产品。Polly 使用先进的深度学习技术来合成像人声一样的语音,提供数十种语言和多种语音个性选择。
主要特点
- 高品质语音: 提供多种听起来自然的声音,包括神经文本转语音(NTTS)声音,以获得最高的质量和表现力。
- 广泛的语言支持: 支持数十种语言和方言,使其适用于全球应用程序。
- 实时流式传输: 音频可以实时流式传输,从而在交互式应用程序中实现即时播放。
- 定制和控制: 使用语音合成标记语言(SSML),可以控制语音的各个方面,如发音、音量、音高和语速。
- 成本效益高: 采用按需付费模式,仅按您转换为语音的字符数收费。
使用案例
- 内容可访问性: 使文章、书籍和网站等数字内容对有视力障碍或阅读困难的人士可用。
- 电子学习和教育: 创建教育材料的音频版本,并在学习应用程序中提供语音反馈。
- 电话和IVR: 为自动客户服务电话系统提供听起来自然的语音提示。
- 物联网设备: 为智能设备赋予声音,从厨房电器到公共广播系统。
- 游戏和动画: 为游戏和动画内容生成角色对话和旁白。
入门指南
要开始使用 Amazon Polly,您可以使用 AWS 命令行界面(CLI)。首先,请确保您的 AWS CLI 已配置必要的权限。
这个简单的“Hello World”示例从字符串合成文本并将其另存为 MP3 文件。
```bash
从文本字符串合成语音并将其保存到文件
aws polly synthesize-speech
–output-format mp3
–voice-id Joanna
–text “Hello, world! This is a test of Amazon Polly.”
hello_world.mp3
然后您可以播放生成的音频文件
例如,在 Linux 上:
play hello_world.mp3
在 macOS 上:
afplay hello_world.mp3
此命令使用 Joanna 语音说出“Hello, world! This is a test of Amazon Polly.”,并将生成的音频保存到 hello_world.mp3。
定价
Amazon Polly 遵循按需付费的定价模式。没有前期成本或最低费用。您只需根据转换为语音的文本字符数量付费。该服务包含一个慷慨的免费套餐,每月可免费处理数百万个字符,使开发人员可以轻松开始构建和测试应用程序。