¿Qué es Yi-1.5?
La serie Yi-1.5 es un conjunto de modelos de lenguaje grandes de código abierto de próxima generación desarrollados por 01.AI, una empresa fundada por el Dr. Kai-Fu Lee. Estos modelos son particularmente reconocidos por su sólido rendimiento tanto en inglés como en chino, lo que los convierte en una opción principal para aplicaciones bilingües. Aunque los modelos son de código abierto, también están disponibles para un fácil despliegue e inferencia a través de servicios en la nube como la Plataforma para IA (PAI) de Alibaba Cloud, proporcionando una solución escalable para uso empresarial.
Características Clave
- Rendimiento Bilingüe Excepcional: Los modelos Yi-1.5 están preentrenados en un corpus multilingüe de alta calidad, ofreciendo resultados de vanguardia en tareas de lenguaje tanto en chino como en inglés.
- Múltiples Tamaños de Modelo: La serie incluye varios tamaños, como modelos de 9B y 34B de parámetros, lo que permite a los desarrolladores elegir el mejor equilibrio entre rendimiento y costo computacional.
- Gran Ventana de Contexto: Con una ventana de contexto de 32K, Yi-1.5 puede procesar y comprender documentos largos, conversaciones complejas y extensas bases de código en una sola pasada.
- Sólidas Habilidades de Codificación: Los modelos demuestran capacidades impresionantes en la generación, completado y explicación de código en varios lenguajes de programación.
- Código Abierto y Amigable para el Comercio: Lanzada bajo la licencia Apache 2.0, la serie Yi está disponible tanto para investigación académica como para uso comercial, fomentando una amplia adopción e innovación.
Casos de Uso
- Soporte al Cliente Multilingüe: Potenciando chatbots y asistentes virtuales que pueden comunicarse sin problemas con los clientes tanto en inglés como en chino.
- Creación de Contenido: Generando artículos, resúmenes y textos de marketing para audiencias bilingües.
- Desarrollo de Software: Ayudando a los desarrolladores con la generación de código, depuración y documentación.
- Recuperación de Información Interlingüística: Construyendo sistemas de búsqueda y preguntas y respuestas que pueden extraer información de fuentes en diferentes idiomas.
Para Empezar
Aquí hay un ejemplo simple al estilo “Hola Mundo” usando la biblioteca transformers para ejecutar el modelo de chat Yi-1.5 9B.
```python from transformers import AutoModelForCausalLM, AutoTokenizer
Definir el ID del modelo
model_id = “01-ai/Yi-1.5-9B-Chat”
Cargar el tokenizador y el modelo
tokenizer = AutoTokenizer.from_pretrained(model_id, use_fast=False) model = AutoModelForCausalLM.from_pretrained( model_id, device_map=”auto”, torch_dtype=’auto’ ).eval()
Preparar los mensajes para el modelo de chat
messages = [ {“role”: “user”, “content”: “¡Hola! ¿Puedes escribir una historia corta sobre un astronauta que encuentra un misterioso artefacto alienígena?”} ]
Formatear la entrada y generar una respuesta
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors=’pt’) output_ids = model.generate(input_ids.to(‘cuda’), max_new_tokens=512) response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
print(response)
Precios
Los modelos Yi-1.5 son fundamentalmente de Código Abierto bajo la licencia Apache 2.0, lo que significa que son gratuitos para descargar y usar con fines de investigación o comerciales. Sin embargo, ejecutar estos grandes modelos requiere recursos computacionales significativos. Para un rendimiento y escalabilidad de nivel empresarial sin gestionar la infraestructura, se puede acceder a ellos a través de un modelo de pago basado en el uso en plataformas en la nube como Alibaba Cloud PAI.