ما هي واجهة برمجة تطبيقات AssemblyAI؟
تقدم AssemblyAI واجهة برمجة تطبيقات قوية توفر أحدث نماذج الذكاء الاصطناعي لتفريغ وفهم الكلام. تتيح للمطورين تحويل الملفات الصوتية والمرئية بسهولة إلى نص، والحصول على رؤى أعمق من خلال ميزات مثل تحليل المشاعر، وتمييز المتحدثين، والإشراف على المحتوى. وهي مصممة لبناء مجموعة واسعة من التطبيقات التي تعتمد على البيانات الصوتية.
الميزات الرئيسية
- تفريغ عالي الدقة: تستخدم نماذج تعلم عميق متقدمة لتوفير تفريغات دقيقة للغاية لكل من الصوت المسجل مسبقًا والبث المباشر.
- تمييز المتحدثين: تحدد وتصنف المتحدثين المختلفين في بث صوتي واحد، مما يسهل متابعة المحادثات.
- تحليل المشاعر: تحلل النص المفرغ لتحديد النبرة العاطفية (إيجابية، سلبية، محايدة) للكلام.
- تنقيح المعلومات الشخصية التعريفية (PII): تكتشف وتنقيح تلقائيًا المعلومات الشخصية التعريفية الحساسة من التفريغات لضمان الخصوصية والامتثال.
- اكتشاف الكيانات: تحدد وتستخرج الكيانات الرئيسية مثل الأسماء والتواريخ والمواقع والمؤسسات من المحتوى الصوتي.
- التلخيص: توفر ملخصات تجريدية للملفات الصوتية الطويلة، مع تسليط الضوء على أهم المعلومات.
حالات الاستخدام
- تفريغ الاجتماعات: تفريغ الاجتماعات الافتراضية والمقابلات والمكالمات الجماعية تلقائيًا لإنشاء سجلات قابلة للبحث وعناصر عمل.
- تحليلات مركز الاتصال: تحليل مكالمات دعم العملاء لتتبع المشاعر وتحديد الاتجاهات وتحسين أداء الوكلاء.
- تحليل محتوى الوسائط: تفريغ البودكاست ومقاطع الفيديو والبث لإنشاء تسميات توضيحية وترجمات وتمكين البحث في المحتوى.
- التطبيقات التي يتم التحكم فيها بالصوت: بناء مساعدين يتم تنشيطهم بالصوت وبرامج إملاء وواجهات مستخدم أخرى بدون استخدام اليدين.
البدء
البدء مع AssemblyAI أمر بسيط. أولاً، تحتاج إلى الحصول على مفتاح API مجاني من موقع AssemblyAI.
إليك مثال بسيط “أهلاً بالعالم” باستخدام Python SDK لتفريغ ملف صوتي من عنوان URL:
```python import assemblyai as aai
مفتاح API الخاص بك
aai.settings.api_key = “YOUR_API_KEY”
عنوان URL للملف الصوتي المراد تفريغه
FILE_URL = “https://storage.googleapis.com/aai-web-samples/espn-bears.m4a”
إنشاء كائن مفرغ
transcriber = aai.Transcriber()
بدء التفريغ
transcript = transcriber.transcribe(FILE_URL)
if transcript.status == aai.TranscriptStatus.error: print(transcript.error) else: print(transcript.text)
مثال على الإخراج:
“It’s a different kind of season for the Bears, a different kind of team…”
التسعير
تعمل AssemblyAI على نموذج تسعير مجاني (freemium) والدفع حسب الاستخدام. تقدم طبقة مجانية سخية للمطورين للبدء، والتي تتضمن عددًا كبيرًا من الساعات لكل من التفريغ المسجل مسبقًا والبث. بعد الطبقة المجانية، يعتمد التسعير على حجم الصوت المعالج في الساعة. تتوفر الميزات المتقدمة مثل تحليل المشاعر وتنقيح المعلومات الشخصية التعريفية كإضافات بهياكل تسعير خاصة بها. تتوفر أيضًا خطط مؤسسية مخصصة لعمليات النشر واسعة النطاق.