Что такое AssemblyAI API?
AssemblyAI предлагает мощный API, который предоставляет передовые модели ИИ для транскрипции и понимания речи. Он позволяет разработчикам легко преобразовывать аудио- и видеофайлы в текст и получать более глубокие знания с помощью таких функций, как анализ настроений, диаризация дикторов и модерация контента. Он предназначен для создания широкого спектра приложений, основанных на голосовых данных.
Ключевые особенности
- Высокоточная транскрипция: Использует передовые модели глубокого обучения для обеспечения высокоточных транскрипций как для предварительно записанного, так и для потокового аудио в реальном времени.
- Диаризация дикторов: Идентифицирует и помечает разных дикторов в одном аудиопотоке, что упрощает отслеживание разговоров.
- Анализ настроений: Анализирует транскрибированный текст для определения эмоционального тона (положительный, отрицательный, нейтральный) речи.
- Редактирование PII: Автоматически обнаруживает и редактирует конфиденциальную личную информацию (PII) из транскрипций для обеспечения конфиденциальности и соответствия требованиям.
- Обнаружение сущностей: Идентифицирует и извлекает ключевые сущности, такие как имена, даты, местоположения и организации, из аудиоконтента.
- Суммаризация: Предоставляет абстрактные резюме длинных аудиофайлов, выделяя самую важную информацию.
Сценарии использования
- Транскрипция встреч: Автоматически транскрибируйте виртуальные встречи, интервью и конференц-звонки для создания доступных для поиска записей и планов действий.
- Аналитика колл-центров: Анализируйте звонки в службу поддержки для отслеживания настроений, выявления тенденций и повышения производительности агентов.
- Анализ медиаконтента: Транскрибируйте подкасты, видео и трансляции для создания субтитров и обеспечения поиска по контенту.
- Приложения с голосовым управлением: Создавайте голосовых помощников, программное обеспечение для диктовки и другие пользовательские интерфейсы без помощи рук.
Начало работы
Начать работу с AssemblyAI просто. Сначала вам нужно получить бесплатный ключ API на веб-сайте AssemblyAI.
Вот простой пример “Hello World” с использованием Python SDK для транскрипции аудиофайла по URL:
```python import assemblyai as aai
Ваш ключ API
aai.settings.api_key = “ВАШ_API_КЛЮЧ”
URL аудиофайла для транскрипции
FILE_URL = “https://storage.googleapis.com/aai-web-samples/espn-bears.m4a”
Создайте объект транскрибатора
transcriber = aai.Transcriber()
Начните транскрипцию
transcript = transcriber.transcribe(FILE_URL)
if transcript.status == aai.TranscriptStatus.error: print(transcript.error) else: print(transcript.text)
Пример вывода:
“It’s a different kind of season for the Bears, a different kind of team…”
Цены
AssemblyAI работает по модели ценообразования freemium с оплатой по мере использования. Он предлагает щедрый бесплатный уровень для разработчиков, который включает значительное количество часов как для предварительно записанной, так и для потоковой транскрипции. Сверх бесплатного уровня цены основаны на объеме обработанного аудио в час. Расширенные функции, такие как анализ настроений и редактирование PII, доступны в качестве дополнений со своими собственными структурами цен. Также доступны индивидуальные корпоративные планы для крупномасштабных развертываний.