AssemblyAI API 是什么?
AssemblyAI 提供了一个强大的 API,它提供了用于转录和理解语音的顶尖 AI 模型。它允许开发人员轻松地将音频和视频文件转换为文本,并通过情感分析、说话人分离和内容审核等功能获得更深入的见解。它旨在构建依赖语音数据的各种应用程序。
主要功能
- 高精度转录: 利用先进的深度学习模型,为预录制和实时流式音频提供高度准确的转录。
- 说话人分离: 在单个音频流中识别和标记不同的说话人,使对话易于跟踪。
- 情感分析: 分析转录的文本以确定语音的情感基调(积极、消极、中性)。
- PII 编辑: 自动检测和编辑转录中的敏感个人身份信息(PII),以确保隐私和合规性。
- 实体检测: 从音频内容中识别和提取关键实体,如姓名、日期、地点和组织。
- 摘要: 提供长音频文件的摘要性总结,突出最重要的信息。
使用案例
- 会议转录: 自动转录虚拟会议、访谈和电话会议,以创建可搜索的记录和行动项目。
- 呼叫中心分析: 分析客户支持电话以跟踪情感、识别趋势并提高座席绩效。
- 媒体内容分析: 转录播客、视频和广播以创建字幕,并实现内容搜索。
- 语音控制应用: 构建语音激活助手、听写软件和其他免提用户界面。
入门指南
开始使用 AssemblyAI 非常简单。首先,您需要从 AssemblyAI 网站获取免费的 API 密钥。
这是一个使用 Python SDK 从 URL 转录音频文件的简单“Hello World”示例:
```python import assemblyai as aai
你的 API 密钥
aai.settings.api_key = “你的API密钥”
要转录的音频文件的 URL
FILE_URL = “https://storage.googleapis.com/aai-web-samples/espn-bears.m4a”
创建一个转录器对象
transcriber = aai.Transcriber()
开始转录
transcript = transcriber.transcribe(FILE_URL)
if transcript.status == aai.TranscriptStatus.error: print(transcript.error) else: print(transcript.text)
示例输出:
“It’s a different kind of season for the Bears, a different kind of team…”
定价
AssemblyAI 采用免费增值、按需付费的定价模式。它为开发者提供了一个慷慨的免费套餐,其中包括大量的预录制和流式转录小时数。超出免费套餐后,定价基于每小时处理的音频量。情感分析和 PII 编辑等高级功能作为附加组件提供,并有其自己的定价结构。还为大规模部署提供定制的企业计划。