AWS ha anunciado una innovadora integración entre Amazon SageMaker Unified Studio y los buckets de Amazon S3, que permite a las organizaciones utilizar datos no estructurados para tareas de aprendizaje automático y análisis de datos de manera más eficiente. Esta nueva herramienta promete cambiar la manera en que las empresas manejan y procesan grandes volúmenes de información compleja.

En un ejercicio reciente, se mostró cómo esta integración permite ajustar el modelo Llama 3.2 11B Vision Instruct para responder preguntas visuales, al emplear imágenes y consultas al modelo. Por ejemplo, se demostró la capacidad del modelo para identificar la fecha de una transacción a partir de un recibo. El modelo base Llama 3.2 alcanzó un ANLS del 85,3% en el conjunto de datos DocVQA, aunque esta precisión puede no ser suficiente para ciertas aplicaciones que requieren mayor exactitud.

Para mejorar el rendimiento, se implementó un protocolo de ajuste fino utilizando conjuntos de datos de distintos tamaños (1,000, 5,000 y 10,000 imágenes) para medir el impacto del tamaño del conjunto de datos en la eficacia del modelo. El proceso completo, desde la ingesta de datos hasta la evaluación de métricas, se gestiona a través de Amazon SageMaker Unified Studio. Para ejecutar esta metodología, es necesario cumplir con requisitos previos como la creación de un dominio en SageMaker Unified Studio y la configuración de conexiones con los buckets de S3.

La arquitectura de la solución también permite una colaboración eficaz entre los equipos de datos, utilizando roles de acceso que facilitan la gestión de permisos. Utilizando MLflow, se monitorean detalladamente los experimentos, lo que posibilita observar mejoras en la precisión del modelo ajustado.

Los resultados preliminares han revelado que el modelo ajustado consiguió un ANLS del 90,2%, mostrando una mejora del 4,9% en comparación con el modelo base. Estos resultados validan la metodología, destacando el potencial de Amazon SageMaker Unified Studio para optimizar modelos de aprendizaje automático y mostrando un camino más claro desde los datos no estructurados hasta la implementación en producción.

Lo último

×