Aplicación de modelos multimodales para la extracción de información clave de documentos

DirectorSacramento, Germán
Titulaciones
Grado en Ingeniería Tecnologías Industriales
Grado en Ingeniería Tecnologías y Servicios de Telecomunicación
Grado en Ingeniería Informática
Grado en Ingeniería Electrónica y Automática
Duracion4-8 meses
LugarHíbrido
Fecha Alta2024-10-04
Fecha Baja2025-10-04
ResumenOBJETIVOS Y DESCRIPCIÓN: El objetivo es estudiar varios modelos multimodales existentes en el mercado, tanto comerciales como open source, y su rendimiento para la extracción de información a partir de documentos e imágenes. Se pretender estudiar la viabilidad del uso de dichos modelos en una aplicación o flujo basada en IA que permita la extracción de metadatos de documentos en formato PDF o imágenes para alimentar una base de datos que pueda ser consultada con posterioridad. La viabilidad de la aplicación y la comparativa de rendimiento de los diferentes modelos se realizará en base a varios tipos de documentos en los que es necesario extraer diferentes tipos de metadatos en diferentes idiomas. Este TFG o TFM se enmarca dentro de la Cátedra Alimak Group de la Universidad de Zaragoza (https://catedras.unizar.es/catedra/catedra-alimak-group). El trabajo se desarrollará en modalidad híbrida, es decir, tanto en remoto como en las instalaciones de la empresa Avanti (https://es.avanti-online.com/). ACTIVIDADES: • Estudio y análisis de modelos multimodales • Desarrollo de scripts / aplicación para el procesamiento automático de documentos valorando diferentes alternativas para asegurar la mayor fiabilidad con los menores recursos posibles • Comparativa y validación de modelos • Prueba de concepto basada en un dataset de varios centenares de documentos: extracción de la información y almacenamiento en una base de datos. DOTACIÓN MENSUAL: 400-800 EUR/mes (20–40 h/semana), en función a la dedicación. Puedes encontrar más información en este enlace: https://webdiis.unizar.es/~julvez/TFEs_Alimak/2024-09%20AG019%20Aplicacion%20modelos%20multimodales%20extraccion%20informacion.pdf
Detalles/ContactoGermán Sacramento, german.sacramento@alimakgroup.com; Cristian Mahulea, cmahulea@unizar.es; Jorge Júlvez, julvez@unizar.es
Volver