ما هو Yi-1.5؟
سلسلة Yi-1.5 هي مجموعة من نماذج اللغة الكبيرة مفتوحة المصدر من الجيل التالي تم تطويرها بواسطة 01.AI، وهي شركة أسسها الدكتور كاي-فو لي. تشتهر هذه النماذج بشكل خاص بأدائها القوي في اللغتين الإنجليزية والصينية، مما يجعلها الخيار الأفضل للتطبيقات ثنائية اللغة. في حين أن النماذج مفتوحة المصدر، إلا أنها متاحة أيضًا للنشر والاستدلال بسهولة عبر الخدمات السحابية مثل منصة الذكاء الاصطناعي (PAI) من علي بابا كلاود، مما يوفر حلاً قابلاً للتطوير لاستخدام الشركات.
الميزات الرئيسية
- أداء ثنائي اللغة استثنائي: تم تدريب نماذج Yi-1.5 مسبقًا على مجموعة بيانات متعددة اللغات عالية الجودة، مما يوفر نتائج متطورة في مهام اللغة الصينية والإنجليزية.
- أحجام نماذج متعددة: تتضمن السلسلة أحجامًا مختلفة، مثل نماذج بمعلمات 9B و 34B، مما يسمح للمطورين باختيار أفضل توازن بين الأداء والتكلفة الحسابية.
- نافذة سياق واسعة: مع نافذة سياق تبلغ 32 ألفًا، يمكن لـ Yi-1.5 معالجة وفهم المستندات الطويلة والمحادثات المعقدة وقواعد التعليمات البرمجية الواسعة في تمريرة واحدة.
- قدرات برمجة قوية: تُظهر النماذج قدرات رائعة في توليد الأكواد وإكمالها وشرحها عبر لغات برمجة مختلفة.
- مفتوح المصدر وصديق تجاريًا: تم إصدار سلسلة Yi بموجب ترخيص Apache 2.0، وهي متاحة للبحث الأكاديمي والاستخدام التجاري على حد سواء، مما يعزز التبني والابتكار على نطاق واسع.
حالات الاستخدام
- دعم العملاء متعدد اللغات: تشغيل روبوتات الدردشة والمساعدين الافتراضيين الذين يمكنهم التواصل بسلاسة مع العملاء باللغتين الإنجليزية والصينية.
- إنشاء المحتوى: توليد المقالات والملخصات والنصوص التسويقية للجماهير ثنائية اللغة.
- تطوير البرمجيات: مساعدة المطورين في توليد الأكواد وتصحيح الأخطاء والتوثيق.
- استرجاع المعلومات عبر اللغات: بناء أنظمة بحث وأسئلة وأجوبة يمكنها استخلاص المعلومات من مصادر بلغات مختلفة.
البدء
إليك مثال بسيط بأسلوب “Hello World” باستخدام مكتبة transformers لتشغيل نموذج الدردشة Yi-1.5 9B.
```python from transformers import AutoModelForCausalLM, AutoTokenizer
تحديد معرف النموذج
model_id = “01-ai/Yi-1.5-9B-Chat”
تحميل المُرمِّز والنموذج
tokenizer = AutoTokenizer.from_pretrained(model_id, use_fast=False) model = AutoModelForCausalLM.from_pretrained( model_id, device_map=”auto”, torch_dtype=’auto’ ).eval()
إعداد الرسائل لنموذج الدردشة
messages = [ {“role”: “user”, “content”: “مرحباً! هل يمكنك كتابة قصة قصيرة عن رائد فضاء يجد قطعة أثرية غامضة من الفضاء الخارجي؟”} ]
تنسيق الإدخال وتوليد استجابة
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors=’pt’) output_ids = model.generate(input_ids.to(‘cuda’), max_new_tokens=512) response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
print(response)
التسعير
نماذج Yi-1.5 هي في الأساس مفتوحة المصدر بموجب ترخيص Apache 2.0، مما يعني أنها مجانية للتنزيل والاستخدام للأغراض البحثية أو التجارية. ومع ذلك، يتطلب تشغيل هذه النماذج الكبيرة موارد حسابية كبيرة. للحصول على أداء وقابلية تطوير على مستوى المؤسسات دون إدارة البنية التحتية، يمكن الوصول إليها عبر نموذج مدفوع قائم على الاستخدام على منصات سحابية مثل Alibaba Cloud PAI.