Las organizaciones están experimentando una transformación en la manera en que gestionan los datos no estructurados gracias al Intelligent Document Processing (IDP). Esta innovadora técnica permite la extracción automática de información valiosa de documentos como facturas, contratos y reportes. Un enfoque destacado es el desarrollo de una solución de IDP que integra herramientas como el Strands SDK y Amazon Bedrock, ofreciendo capacidades avanzadas para el manejo de información compleja.
La solución se presenta a través de un cuaderno de Jupyter que permite a los usuarios cargar documentos empresariales multimodales y extraer información utilizando Bedrock Data Automation (BDA) como herramienta de análisis. En un caso práctico, este sistema recupera contexto relevante para distritos escolares de un informe nacional del Departamento de Educación de EE. UU.
Amazon Bedrock Data Automation se puede utilizar tanto como una función independiente como un parser para establecer bases de conocimiento que alimenten flujos de trabajo de generación de respuestas aumentadas por recuperación (RAG). Este sistema permite la obtención de valiosos insights a partir de contenido no estructurado, incluyendo documentos, imágenes, vídeos y audio. Así, los usuarios pueden construir flujos de trabajo automatizados de IDP y RAG de manera rápida y económica.
En el desarrollo de estos flujos de trabajo RAG, se hace uso del Amazon OpenSearch Service para almacenar las representaciones vectoriales de los documentos. Bedrock AgentCore, un servicio totalmente gestionado, facilita la creación y configuración de agentes autónomos para realizar tareas sin necesidad de gestionar la infraestructura subyacente ni escribir código personalizado.
El Strands Agents SDK representa un avance significativo en el desarrollo de agentes de inteligencia artificial, permitiendo a los desarrolladores crear agentes con comportamientos específicos a través de prompts y herramientas definidas. Este enfoque modelado minimiza la necesidad de código, lo que resulta en sistemas más complejos que colaboran eficientemente.
La implementación requiere seguir varios pasos, que incluyen la carga de documentos relevantes en Amazon S3, la creación de una base de conocimiento en Amazon Bedrock y el despliegue de un agente Strands para responder consultas de los usuarios.
En el ámbito de la seguridad, se implementan varias medidas de protección, como el manejo seguro de cargas de archivos y un control de acceso basado en roles mediante Identity and Access Management (IAM), para asegurar que la solución sea robusta en un entorno productivo.
Esta solución es especialmente útil para flujos de trabajo de procesamiento de documentos automatizados, análisis inteligente de grandes volúmenes de datos, sistemas de preguntas y respuestas basados en contenido documental y procesamiento de contenido multimodal.
Finalmente, el trabajo realizado pone de manifiesto las capacidades de Amazon Bedrock AgentCore para desarrollar aplicaciones de procesamiento de documentos inteligentes, destacando la importancia de la automatización de datos para mejorar la experiencia de los usuarios al interactuar con documentos complejos que contienen información visual, auditiva y textual.