La contaminación del aire ha emergido como una de las crisis de salud ambiental más críticas en África, ocasionando diversas enfermedades en la población. A pesar del despliegue de sensores de calidad del aire por parte de organizaciones como sensors.AFRICA, se enfrenta un desafío significativo en la recopilación de datos debido a la inestabilidad eléctrica y problemas de conectividad, sobre todo en áreas de alto riesgo con mantenimiento limitado.
Estos vacíos en los datos de PM2.5, partículas nocivas para la salud, afectan el poder de análisis, generando estimaciones sesgadas y conclusiones erróneas, comprometiendo así la toma de decisiones basadas en evidencia. La falta de datos fiables dificulta el control de la contaminación y la evaluación de su impacto en la salud pública, además de complicar el cumplimiento normativo.
En respuesta, se ha adoptado Amazon SageMaker Canvas, una plataforma de aprendizaje automático de bajo y sin código, para prever niveles de PM2.5 a partir de datos incompletos. Esto es crucial, ya que estos contaminantes son responsables de millones de muertes prematuras relacionadas con enfermedades cardiovasculares y respiratorias.
La fortaleza de SageMaker Canvas reside en su manejo eficaz de datos incompletos, generando predicciones confiables a pesar de los huecos en la información. Esto permite que las redes de monitoreo de calidad del aire operen de manera continua, evitando interrupciones y lagunas costosas. De esta forma, los organismos medioambientales y de salud pública tienen acceso constante a información crucial, facilitando la emisión de alertas de contaminación y un análisis más completo de las tendencias a largo plazo.
La solución de imputación de datos que combina Amazon SageMaker AI, AWS Lambda y AWS Step Functions está diseñada para analistas medioambientales y autoridades de salud que necesitan datos fiables de PM2.5. Se basa en un conjunto de datos de 15 millones de registros obtenidos entre marzo y octubre de 2022 en Kenia y Nigeria, recopilados por 23 dispositivos en 15 ubicaciones diferentes.
Este enfoque no solo se centra en el análisis actual de los datos, sino también en una estrategia sistemática para identificar y llenar brechas de datos causadas por las limitaciones de los sensores y problemas de conectividad. Esta innovación es vital para mejorar la respuesta a los desafíos emergentes relacionados con la calidad del aire y apoyar decisiones oportunas en el ámbito de la salud pública.