Nuevos problemas en Minería de Datos: Solucioens con técnicas Soft Computing

Programa financiador: 
Ministerio de Economía y Competitividad
55.844,00 €
Referencia: 
TIN2012-33856
Investigador principal: 
del Jesus Díaz, Mª José
Fecha de inicio: 
01/01/2013
Fecha Fin: 
31/12/2015
Miembros participantes: 
González García, Pedro
Pérez Godoy, Mª Dolores
Rivera Rivas, Antonio Jesús
Descripción: 

En minería de datos se presentan continuamente nuevos retos que deben afrontar los algoritmos de extracción de conocimiento que se desarrollen. Entre ellos destacan los relacionados con nuevos tipos de problemas como clasificación multietiqueta, clases no balanceadas, extracción de reglas descriptivas a través de inducción supervisada (patrones emergentes o descubrimiento de subgrupos) o con el incremento de las posibilidades de éxito en el proceso de extracción de conocimiento a través de la mejora de la calidad de los datos a analizar, de la interpretabilidad de los resultados y de la escalabilidad de los algoritmos.

Las técnicas incluidas dentro del área de Soft Computing, como los sistemas difusos, redes neuronales, algoritmos evolutivos y la hibridación entre ellas, proporcionan herramientas potentes para la minería datos tanto para la representación del conocimiento a extraer como para el proceso de aprendizaje u optimización de los modelos de minería de datos.

Este proyecto se centra en el desarrollo de modelos de minería de datos basados en técnicas Soft Computing en nuevas áreas de minería de datos y para resolver algunos de los retos que se plantean tanto en ellas como en las áreas en las que el equipo del proyecto está desarrollando modelos de minería de datos en la actualidad.

El proyecto se plantea desde una doble perspectiva:

  1. Desde el punto de vista de las técnicas Soft Computing, desarrollaremos sistemas difusos evolutivos, redes neuronales de función de base radial, y combinación de modelos (ensembles y multiclasificadores).
  2. Utilizando este tipo de técnicas desarrollaremos métodos para afrontar algunos de los retos a los que se enfrenta la minería de datos:
    1. problemas de clasificación con clases no balanceadas.
    2. problemas con múltiples etiquetas
    3. extracción supervisada de reglas de descripción, en particular descubrimiento de patrones emergentes y subgrupos
    4. mejora de la calidad de datos, fundamentalmente desde el punto de vista de sesgo de datos y muestreo
    5. interpretabilidad de los modelos
    6. escalabilidad en algoritmos de minería de datos. Estas tres últimas líneas de trabajo se desarrollarán no sólo para las nuevas tareas de minería de datos sino también para aquellas en las que el equipo trabaja actualmente (clasificación, regresión y predicción de series temporales).

Para estos problemas desarrollaremos algoritmos basados en técnicas Soft Computing y se aplicarán, además de las áreas de aplicación en las que trabaja el equipo, en el área de medicina, en particular en diagnóstico psiquiátrico, a través del desarrollo de un prototipo.