Qu’est-ce que Yi-1.5 ?
La série Yi-1.5 est un ensemble de grands modèles de langage open-source de nouvelle génération développés par 01.AI, une société fondée par le Dr Kai-Fu Lee. Ces modèles sont particulièrement réputés pour leurs solides performances en anglais et en chinois, ce qui en fait un choix de premier ordre pour les applications bilingues. Bien que les modèles soient open-source, ils sont également disponibles pour un déploiement et une inférence faciles via des services cloud comme la Plateforme pour l’IA (PAI) d’Alibaba Cloud, offrant une solution évolutive pour les entreprises.
Fonctionnalités Clés
- Performance Bilingue Exceptionnelle : Les modèles Yi-1.5 sont pré-entraînés sur un corpus multilingue de haute qualité, offrant des résultats de pointe dans les tâches linguistiques en chinois et en anglais.
- Plusieurs Tailles de Modèles : La série comprend différentes tailles, telles que des modèles à 9B et 34B de paramètres, permettant aux développeurs de choisir le meilleur équilibre entre performance et coût de calcul.
- Grande Fenêtre de Contexte : Avec une fenêtre de contexte de 32K, Yi-1.5 peut traiter et comprendre de longs documents, des conversations complexes et des bases de code étendues en une seule fois.
- Fortes Capacités de Codage : Les modèles démontrent des capacités impressionnantes en matière de génération, de complétion et d’explication de code dans divers langages de programmation.
- Open Source et Commercialement Accessible : Publiée sous la licence Apache 2.0, la série Yi est disponible pour la recherche académique et l’utilisation commerciale, favorisant une adoption et une innovation généralisées.
Cas d’Usage
- Support Client Multilingue : Alimenter des chatbots et des assistants virtuels capables de communiquer de manière transparente avec les clients en anglais et en chinois.
- Création de Contenu : Générer des articles, des résumés et des textes marketing pour des audiences bilingues.
- Développement Logiciel : Aider les développeurs avec la génération de code, le débogage et la documentation.
- Recherche d’Information Interlingue : Construire des systèmes de recherche et de questions-réponses capables d’extraire des informations de sources dans différentes langues.
Pour Commencer
Voici un exemple simple de style “Hello World” utilisant la bibliothèque transformers pour exécuter le modèle de chat Yi-1.5 9B.
```python from transformers import AutoModelForCausalLM, AutoTokenizer
Définir l’ID du modèle
model_id = “01-ai/Yi-1.5-9B-Chat”
Charger le tokenizer et le modèle
tokenizer = AutoTokenizer.from_pretrained(model_id, use_fast=False) model = AutoModelForCausalLM.from_pretrained( model_id, device_map=”auto”, torch_dtype=’auto’ ).eval()
Préparer les messages pour le modèle de chat
messages = [ {“role”: “user”, “content”: “Bonjour ! Pouvez-vous écrire une courte histoire sur un astronaute qui trouve un mystérieux artefact extraterrestre ?”} ]
Formater l’entrée et générer une réponse
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors=’pt’) output_ids = model.generate(input_ids.to(‘cuda’), max_new_tokens=512) response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
print(response)
Tarification
Les modèles Yi-1.5 sont fondamentalement Open Source sous la licence Apache 2.0, ce qui signifie qu’ils sont gratuits à télécharger et à utiliser pour la recherche ou à des fins commerciales. Cependant, l’exécution de ces grands modèles nécessite des ressources de calcul importantes. Pour des performances et une évolutivité de niveau entreprise sans gérer l’infrastructure, ils sont accessibles via un modèle payant basé sur l’utilisation sur des plateformes cloud comme Alibaba Cloud PAI.