Aplicación de modelos multimodales para la extracción de información clave de documentos

DirectorSacramento, Germán
Titulaciones
Máster Universitario en Ingeniería de Telecomunicación
Máster Universitario en Ingeniería Electrónica
Máster Universitario en Ingeniería Industrial
Máster Universitario en Ingeniería Informática
Duracion4-8 meses
LugarHíbrido
Fecha Alta2024-10-04
Fecha Baja2025-10-04
ResumenOBJETIVOS Y DESCRIPCIÓN: El objetivo es estudiar varios modelos multimodales existentes en el mercado, tanto comerciales como open source, y su rendimiento para la extracción de información a partir de documentos e imágenes. Se pretender estudiar la viabilidad del uso de dichos modelos en una aplicación o flujo basada en IA que permita la extracción de metadatos de documentos en formato PDF o imágenes para alimentar una base de datos que pueda ser consultada con posterioridad. La viabilidad de la aplicación y la comparativa de rendimiento de los diferentes modelos se realizará en base a varios tipos de documentos en los que es necesario extraer diferentes tipos de metadatos en diferentes idiomas. Este TFG o TFM se enmarca dentro de la Cátedra Alimak Group de la Universidad de Zaragoza (https://catedras.unizar.es/catedra/catedra-alimak-group). El trabajo se desarrollará en modalidad híbrida, es decir, tanto en remoto como en las instalaciones de la empresa Avanti (https://es.avanti-online.com/). ACTIVIDADES: • Estudio y análisis de modelos multimodales • Desarrollo de scripts / aplicación para el procesamiento automático de documentos valorando diferentes alternativas para asegurar la mayor fiabilidad con los menores recursos posibles • Comparativa y validación de modelos • Prueba de concepto basada en un dataset de varios centenares de documentos: extracción de la información y almacenamiento en una base de datos. DOTACIÓN MENSUAL: 400-800 EUR/mes (20–40 h/semana), en función a la dedicación. Puedes encontrar más información en este enlace: https://webdiis.unizar.es/~julvez/TFEs_Alimak/2024-09%20AG019%20Aplicacion%20modelos%20multimodales%20extraccion%20informacion.pdf
Detalles/ContactoGermán Sacramento, german.sacramento@alimakgroup.com; Cristian Mahulea, cmahulea@unizar.es; Jorge Júlvez, julvez@unizar.es
Volver