Minería de Datos




Grupo de Facebook de Minería de Datos




Cuestionario de Preguntas:

Encuesta
Favor de tomar en cuenta las siguientes anotaciones para enviarme el formato ARFF.
2o. examen
Archivo de Weka, Actualizado 12/04/16 7:50AM


Antología:

Mining of Massive Datasets
Statistics: Data Mining
Introduction to Information Retrieval
15+ Datasets gratis para Data Mining
Minería de Datos y Extracción de Conocimiento de Bases de Datos
Libros sobre: Minería de Datos


Material Visual:

Introducción
KDD
Almacen de Datos
Reglas de Asociación
Árboles de Decisión
Naive Bayes
Redes Neuronales


Notas:

Notas de Minería de Datos


Programas de Ejemplo:

WEKA


Manual de Prácticas de Laboratorio:

Práctica 1

  1. Leer el arículo Predicción de pacientes diabéticos. Preprocesado para Minería de Datos
  2. ¿Qué técnicas de la minería fueron utilizadas?
  3. ¿Qué resultados (positivos o negativos) se obtuvieron?
  4. ¿Sirvieron las técnicas de minería para el objetivo planteado?

Práctica 2

  1. Investigar acerca de Business intelligence y realizar un mapa conceptual
  2. Tomar en cuenta los siguientes términos: Servicios Web, SAP, SOA, SOAP, BPM, BPEL, etc.

Práctica 3

  1. Investigar los 3 algoritmos de agrupamiento de datos.
  2. Elegir uno de ellos y explicar como lleva a cabo el agrupamiento, que tipo de datos utilliza y cuando se utiliza.

Práctica 4

  1. Investigar las herramientas: Weka, Rapid Miner, Orange, KNime, JHepWork, Data Mining Add-In for Excel.
  2. Realizar un cuadro comparativo de dichas herramientas, donde se mencione: cómo se lleva a cabo el proceso de minería, cómo se tiene que guardar la información, qué algoritmos tiene programados y cómo se presenta la salida.

Práctica 5

  1. Dada la siguiente tabla:
    Cliente Huevo Aceite Pańales Vino Leche Mantequilla Sodas
    1 si no no si no si si
    2 no si no no si no no
    3 no no si no si no no
    4 no si si no si no no
    5 si si no no no si no
    6 no no si no no no si
    7 si si no no si si si
  2. Crear al menos 5 reglas de asociación, donde mínimo 2 reglas tengan cobertura del 50% y una precisión del 50%

Práctica 6

  1. Investigar acerca de redes neuronales: antecedentes, elementos de las redes, características, implementación, tipos de redes y ventajas.
  2. Realizar un mapa conceptual con la información investigada.
  3. Investigar alguna herramienta que genere redes neuronales (de preferencia libre), y hacer un resumen de cómo trabaja y dar un ejemplo.

Práctica 7

  1. Del siguiente ejemplo realizar el árbol de decisión

Práctica 8

  1. Dada la siguiente tabla, encontrar al menos 3 reglas de asociación con soporte y confianza de al menos 40%
    No
    Contenido Canasta
    1 Brócoli, pimienta, maíz
    2 Espárragos, calabaza, maíz
    3 Maíz, tomates, fríjoles, calabazas
    4 Pimienta, maíz, tomates, fríjoles
    5 Espárragos, fríjoles, tomates
    6 Calabaza, espárragos, fríjoles, tomates
    7 Tomates, maíz
    8 Brócoli, tomates, pimienta
    9 Calabaza, espárragos, fríjoles
    10 Fríjoles, maíz
    11 Pimienta, brócoli, fríjoles, calabaza
    12 Espárragos, fríjoles, calabaza
    13 Calabaza, maíz, espárragos, fríjoles
    14 Maíz, pimienta, tomates, fríjoles, brócoli

  2. Aplicar en la tabla anterior el algoritmo a priori.

Práctica 9

  1. Utilizando Weka y la información del siguiente link realizar el ejemplo explicado en el mismo sitio
  2. Explicar los resultados
NOTA: El trabajo del laboratorio puede ser realizado en equipo.