Resumen | En el contexto del proyecto NEAT-AMBIENCE (http://webdiis.unizar.es/~silarri/NEAT-AMBIENCE/) estamos desarrollando soluciones de gestión de datos para ayudar a la toma de decisiones ante diversos desafíos actuales. En este trabajo se colaborará con el proyecto NEAT-AMBIENCE, y en particular con un caso de uso de salud, abordando el estudio y desarrollo de técnicas eficientes de anonimización de datos médicos utilizando aproximaciones basadas en aprendizaje automático. Se pondrá el foco del trabajo no sólo en la precisión del sistema sino también en el rendimiento de la aproximación, ya que se pretende que pueda utilizarse a gran escala sobre grandes volúmenes de datos. Para resolver el problema de la escasa disponibilidad de conjuntos de datos etiquetados, requeridos para la construcción de modelos de aprendizaje, se considerará la posible utilización de técnicas de aprendizaje semi-supervisado así como la generación de datos sintéticos. Para el desarrollo de este trabajo, se partirá de un prototipo (http://webdiis.unizar.es/~silarri/prot/HealthDataAnonym/) desarrollado en NEAT-AMBIENCE con la colaboración de un TFG previo. El trabajo se desarrollará en colaboración con el Instituto Aragonés de Ciencias de la Salud, lo que permitirá el desarrollo de un trabajo más cercano a las necesidades reales y poder acceder a datos reales. |