La AWS AI League, lanzada por Amazon Web Services (AWS), ha llegado a la Asociación de Naciones del Sureste Asiático (ASEAN), reuniendo a estudiantes de Singapur, Indonesia, Malasia, Tailandia, Vietnam y Filipinas. Esta iniciativa busca introducir a jóvenes de diversos orígenes al emocionante mundo de la inteligencia artificial generativa, mediante un desafío práctico basado en juegos enfocado en la adaptación de modelos de lenguaje de gran tamaño (LLMs).
El campeonato dio inicio con una serie de tutoriales encabezados por el equipo de AWS y la comunidad Gen-C de aprendizaje en inteligencia artificial generativa. Los participantes tuvieron acceso a herramientas como Amazon SageMaker JumpStart y PartyRock, las cuales facilitan la adaptación de modelos y la generación de datos sintéticos. SageMaker JumpStart permitió operar el proceso de adaptación de los LLM en un entorno de nube, mientras que PartyRock ofreció un espacio interactivo para curar los datos utilizados en la adaptación de un modelo Llama 3.2 3B Instruct.
El objetivo principal del reto consistía en superar a un modelo de referencia de LLM más grande, mediante una evaluación basada en un cuestionario. Esto incitó a los competidores a trabajar en tres dominios centrales: modelos de base, inteligencia artificial responsable e ingeniería de prompts. Tras una ronda preliminar que incluyó un ranking abierto de los mejores modelos, los destacados avanzaron a la Gran Final Regional, celebrada en Singapur.
Blix D. Foryasen, campeón de la AWS AI League, habló sobre los desafíos y aprendizajes adquiridos, destacando que su éxito no sólo dependió de su destreza técnica, sino también de la colaboración y adaptación a diversas iteraciones del reto. Aunque comenzó tarde, Foryasen logró elaborar un conjunto de datos robusto y ajustar los hiperparámetros de manera selectiva, tomando inspiración en enfoques y trabajos académicos.
Un aspecto clave de su experiencia fue la generación de conjuntos de datos sintéticos mediante PartyRock, donde ajustó parámetros para garantizar la diversidad y calidad de los datos. Foryasen subrayó la importancia de priorizar la calidad por encima de la cantidad, haciendo hincapié en la recalibración de hiperparámetros a medida que aumentaba el tamaño de sus datos para evitar un rendimiento negativo.
Gracias a la colaboración con otros competidores, Foryasen incorporó estrategias avanzadas de ajuste, como el uso de LoRA, que le permitieron mejorar significativamente su modelo. Los conocimientos ganados no sólo le llevaron a la final, sino que también le ofrecieron valiosas lecciones sobre trabajo en equipo y adaptación continua en un campo tecnológico en rápida evolución.
La Gran Final no fue sólo el clímax de su esfuerzo personal, sino también un evento donde los campeones nacionales intercambiaron conocimientos y estrategias, resaltando la importancia de la comunidad en el aprendizaje y la innovación tecnológica.