SqueezeBERT
Qu’est-ce que SqueezeBERT ?SqueezeBERT est un modèle de langage open-source conçu pour être une alternative très effi...
TinyLlama
Qu’est-ce que TinyLlama ?TinyLlama est un modèle de langage open-source et compact de 1,1 milliard de paramètres qui ...
Unsloth
Qu’est-ce que Unsloth ?Unsloth est une bibliothèque d’optimisation open-source conçue pour rendre l’affinage (fine-tu...
Zephyr
Qu’est-ce que Zephyr ?Zephyr est une série de modèles de langage très performants, affinés à partir des modèles de ba...
Modèles à Espace d'États (SSM)
Que sont les Modèles à Espace d’États (SSM) ?Les Modèles à Espace d’États (SSM) sont une classe d’architectures de ré...
Haystack
Qu’est-ce que Haystack ?Haystack est un puissant framework Python open-source développé par deepset pour construire d...
Diffusion Models
Que sont les Modèles de Diffusion ?Les Modèles de Diffusion sont une classe de modèles génératifs d’apprentissage pro...
Mixture of Experts (MoE)
Qu’est-ce que Mixture of Experts (MoE) ?Mixture of Experts (MoE) est une architecture de réseau de neurones conçue po...
Stable Diffusion
Qu’est-ce que Stable Diffusion ?Stable Diffusion est un modèle de deep learning texte-image publié en 2022. Il est pr...
Réseaux de Neurones sur Graphes (GNN)
Que sont les Réseaux de Neurones sur Graphes (GNN) ?Les Réseaux de Neurones sur Graphes (GNN) sont une classe puissan...
Modèles DeepSeek
Qu’est-ce que DeepSeek ?DeepSeek est une famille avancée de modèles d’IA développée par DeepSeek AI. La gamme compren...
Série Llama 3 (Meta AI)
Qu’est-ce que la Série Llama 3 (Meta AI) ?La Série Llama 3 est la nouvelle génération de grands modèles de langage (L...