Mejora la comprensión de videos con Amazon Bedrock: automatización de datos y detección de objetos abiertos

En el ámbito del análisis de video e imagen, muchas empresas enfrentan el desafío de detectar objetos que no formaban parte del conjunto de entrenamiento de un modelo específico. Este reto se amplifica en entornos dinámicos donde suelen aparecer objetos nuevos, desconocidos o definidos por el usuario. Por ejemplo, los editores de medios desean rastrear marcas emergentes en contenido creado por usuarios; los anunciantes necesitan analizar productos en videos de influencers; los minoristas buscan ofrecer búsquedas descriptivas flexibles; los vehículos autónomos deben reconocer escombros inesperados; y los sistemas de manufactura tienen que identificar defectos novedosos sin etiquetar previamente.

Los modelos tradicionales de detección de objetos (CSOD), limitados a categorías predefinidas, no son efectivos en estos escenarios, pues tienden a mal clasificar o ignorar objetos desconocidos. La detección de objetos de conjunto abierto (OSOD) permite a los modelos detectar tanto objetos conocidos como nuevos, incluidos aquellos no encontrados durante el entrenamiento. Admitiendo indicaciones flexibles y adaptándose a objetivos definidos en tiempo real sin reentrenamiento, OSOD combina el reconocimiento visual con la comprensión semántica, facilitando consultas amplias y adaptables.

Amazon Bedrock Data Automation, un servicio cloud de Amazon, mejora la extracción de conocimiento de contenido no estructurado como documentos, imágenes y videos. En la esfera del video, ofrece segmentación por capítulos, detección de texto y clasificación mediante taxonomías del IAB, además de la detección de objetos mediante OSOD. Las plantillas de video del servicio permiten detectar objetos a nivel de fotograma tras especificar texto con los objetos deseados, ofreciendo coordenadas y etiquetas con puntajes de confianza.

La posibilidad de personalizar la salida según las necesidades, como filtrar detecciones de alta confianza, abre múltiples posibilidades. Los anunciantes pueden evaluar la eficacia de estrategias de colocación de anuncios, realizar pruebas A/B y desarrollar estrategias de redimensionamiento inteligentes. En seguridad en el hogar, los sistemas pueden utilizar OSOD para mejorar la localización de objetos. También es posible definir etiquetas personalizadas y realizar búsquedas precisas a través de videos sin la necesidad de máscaras manuales.

La capacidad OSOD de Amazon Bedrock Data Automation mejora la extracción de conocimientos del contenido de video al combinar consultas flexibles con la localización precisa de objetos. Permite implementar flujos de trabajo avanzados y optimizar la comprensión de contenido en diversas industrias, reduciendo la intervención manual y la dependencia de esquemas predefinidos. Esto convierte al servicio en un recurso valioso para aplicaciones prácticas.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Lo último

×