Qu’est-ce que l’API AssemblyAI ?

AssemblyAI propose une API puissante qui fournit des modèles d’IA de pointe pour la transcription et la compréhension de la parole. Elle permet aux développeurs de convertir facilement des fichiers audio et vidéo en texte, et d’obtenir des informations plus approfondies grâce à des fonctionnalités telles que l’analyse des sentiments, la diarisation du locuteur et la modération de contenu. Elle est conçue pour créer une large gamme d’applications basées sur les données vocales.

Fonctionnalités Clés

Transcription de Haute Précision : Utilise des modèles d’apprentissage profond avancés pour fournir des transcriptions très précises pour l’audio pré-enregistré et en temps réel.
Diarisation du Locuteur : Identifie et étiquette les différents locuteurs dans un seul flux audio, facilitant le suivi des conversations.
Analyse des Sentiments : Analyse le texte transcrit pour déterminer le ton émotionnel (positif, négatif, neutre) de la parole.
Rédaction des PII : Détecte et rédige automatiquement les informations personnelles identifiables (PII) sensibles des transcriptions pour garantir la confidentialité et la conformité.
Détection d’Entités : Identifie et extrait des entités clés telles que les noms, les dates, les lieux et les organisations du contenu audio.
Résumé : Fournit des résumés abstractifs de longs fichiers audio, en soulignant les informations les plus importantes.

Cas d’Utilisation

Transcription de Réunions : Transcrivez automatiquement les réunions virtuelles, les entretiens et les conférences téléphoniques pour créer des archives consultables et des plans d’action.
Analyse de Centre d’Appels : Analysez les appels du support client pour suivre les sentiments, identifier les tendances et améliorer les performances des agents.
Analyse de Contenu Média : Transcrivez des podcasts, des vidéos et des émissions pour créer des légendes, des sous-titres et permettre la recherche de contenu.
Applications à Commande Vocale : Créez des assistants à commande vocale, des logiciels de dictée et d’autres interfaces utilisateur mains libres.

Pour Commencer

Démarrer avec AssemblyAI est simple. Vous devez d’abord obtenir une clé API gratuite sur le site web d’AssemblyAI.

Voici un exemple simple de type “Hello World” utilisant le SDK Python pour transcrire un fichier audio à partir d’une URL :

```python import assemblyai as aai

Votre clé API

aai.settings.api_key = “VOTRE_CLÉ_API”

URL du fichier audio à transcrire

FILE_URL = “https://storage.googleapis.com/aai-web-samples/espn-bears.m4a”

Créez un objet transcripteur

transcriber = aai.Transcriber()

Lancez la transcription

transcript = transcriber.transcribe(FILE_URL)

if transcript.status == aai.TranscriptStatus.error: print(transcript.error) else: print(transcript.text)

Sortie d’exemple :

“It’s a different kind of season for the Bears, a different kind of team…”

Tarification

AssemblyAI fonctionne sur un modèle de tarification freemium, paiement à l’utilisation. Il offre un niveau gratuit généreux pour que les développeurs puissent commencer, qui inclut un nombre important d’heures pour la transcription pré-enregistrée et en streaming. Au-delà du niveau gratuit, la tarification est basée sur le volume d’audio traité par heure. Les fonctionnalités avancées comme l’analyse des sentiments et la rédaction des PII sont disponibles en tant que modules complémentaires avec leurs propres structures de prix. Des plans d’entreprise personnalisés sont également disponibles pour les déploiements à grande échelle.

AssemblyAI API