En 2025, Amazon SageMaker AI ha realizado mejoras significativas orientadas a optimizar el entrenamiento, ajuste y hospedaje de cargas de trabajo de inteligencia artificial generativa. Estas actualizaciones, junto a mejoras en la relación costo-rendimiento de los componentes de inferencia, han permitido que nuevos casos de uso puedan ser alojados en SageMaker AI.
Las mejoras más destacadas incluyen optimizaciones en observabilidad, personalización del modelo y hospedaje de modelos. Estas novedades ofrecen a las organizaciones una visibilidad más clara sobre el rendimiento y la salud de la infraestructura, facilitando el diagnóstico de problemas como la latencia y las ineficiencias en los recursos.
La observabilidad mejorada permite un seguimiento más detallado del uso de CPU, memoria y GPU, así como del rendimiento de las invocaciones, a niveles de instancia y contenedor. Estos avances ayudan a las empresas a diagnosticar problemas que antes podían pasar desapercibidos debido a la agregación de datos a nivel de punto final. Además, las actualizaciones continuas de los componentes de inferencia aseguran despliegues eficientes sin la necesidad de duplicar infraestructura, permitiendo implementaciones sin tiempos de inactividad.
En cuanto a la usabilidad, SageMaker AI ha introducido una personalización de modelos serverless que disminuye el tiempo de planificación de infraestructura. Esto se logra mediante la provisión automática de los recursos computacionales necesarios según el tamaño del modelo y los datos, permitiendo a los equipos centrarse en el ajuste de modelos sin los desafíos de gestión de infraestructura. Adicionalmente, la nueva capacidad de streaming bidireccional transforma las interacciones de inferencia de un formato transaccional a conversaciones continuas, resultando en aplicaciones en tiempo real más eficientes, como agentes de voz y transcripciones en vivo.
Otras características relevantes incluyen la compatibilidad con IPv6 y PrivateLink, que mejoran la conectividad y la seguridad de las implementaciones al permitir el acceso privado a los endpoints de SageMaker AI, sin necesidad de pasar por Internet público.
Estas innovaciones posicionan a SageMaker AI como una herramienta crucial para las organizaciones que buscan implementar soluciones de inteligencia artificial generativa de manera efectiva y segura. Con estas capacidades disponibles en diversas regiones, Amazon reafirma su compromiso de transformar cómo las empresas construyen y despliegan aplicaciones de inteligencia artificial a gran escala.