Amazon ha lanzado una innovadora funcionalidad para su servicio SageMaker HyperPod, enfocada en optimizar la experiencia de los desarrolladores de inteligencia artificial (IA) y aprendizaje automático (ML). A partir de ahora, los clústeres de SageMaker HyperPod, que operan con Amazon Elastic Kubernetes Service (EKS), permiten la creación y gestión de entornos de desarrollo interactivos, como JupyterLab y Visual Studio Code, facilitando el ciclo de vida de los modelos de ML.
Además de esta innovación, Amazon ha introducido SageMaker Spaces, dotando a los desarrolladores de IA de la capacidad de gestionar entornos independientes para la ejecución de notebooks. Esta nueva opción permitirá a las organizaciones maximizar el uso de unidades de procesamiento gráfico (GPU), ejecutando tanto tareas interactivas como trabajos de entrenamiento en la misma infraestructura. Gracias al soporte para asignaciones fraccionadas de GPU, se mejorará la eficiencia de costos y se simplificará la gestión de múltiples entornos de desarrollo. Los científicos de datos podrán así concentrarse en la creación y despliegue de modelos de IA y ML.
Los administradores tendrán la capacidad de configurar los espacios para los clústeres, y los científicos de datos podrán conectarse a estos entornos. Se ha incluido la posibilidad de conectar directamente desde Visual Studio Code local a los espacios de HyperPod.
Para comenzar, los administradores deben instalar el complemento SageMaker Spaces desde la consola de SageMaker AI, con opciones de instalación rápida o personalizada disponibles. Una vez configurado el clúster, es posible crear espacios mediante la interfaz de línea de comandos de HyperPod o utilizando kubectl. Los usuarios pueden acceder a los espacios a través de una interfaz web segura o conectarse de manera remota desde Visual Studio Code.
La funcionalidad también permite crear plantillas para los espacios, estableciendo configuraciones predeterminadas que faciliten el trabajo de los científicos de datos. Asimismo, se ha mejorado la gestión de usuarios y colaboración, permitiendo espacios privados o públicos según las necesidades de privacidad y colaboración.
Esta integración busca incrementar la productividad de los científicos de datos y desarrolladores de IA, ofreciendo entornos de desarrollo gestionados que optimizan los recursos de computación y disminuyen el tiempo dedicado a configuraciones.