Diplomado en Herramientas de Minería de Datos y Analítica Empresarial
Precio 57.600 $
Solicita información
Diplomado en Herramientas de Minería de Datos y Analítica Empresarial
Solicita información
Información del curso
Diplomado
Escolarizada
120 horas
Precio 57.600 $
Descripción
El Diplomado en Herramientas de Minería de Datos y Analítica Empresarial tiene por objetivo que los participantes adquieran las herramientas, técnicas, habilidades y conocimientos para elaborar modelos de analítica enfocados al ámbito empresarial.
Temario
Módulo 1: HERRAMIENTAS DE PROCESAMIENTO GENERAL DE DATOS
Objetivo: Se proporcionará a los participantes las herramientas básicas de programación para el tratamiento detallado de datos y para manejar arreglos, series y tramas de datos en Python. Con ello se establecerá una plataforma general para la adquisición y procesamiento de datos. Se analizarán los métodos generales para procesar tablas por medio de tramas de datos en pandas.
1. Programación en Python, NumPy, pandas y Matplotlib
2. Estructura de la trama de datos. Índices y columnas
3. Importación y exportación de datos. Codificación
4. Métodos de consolidación de información. Limpieza y transformación de datos
5. Selección de registros. Mutación de valores. Concatenación y fusión
6. Visualización de datos
7. Herramientas para el análisis exploratorio de datos. Funciones lambda
8. Generación de documentos con el resultado de las ejecuciones
Módulo 2: MODELOS SUPERVISADOS
Objetivo: En este módulo, los participantes comprenderán los fundamentos, hipótesis y finalidad de los métodos supervisados, la manera en que se establecen los objetivos de negocio en términos de la variable objetivo y las métricas con que se determina la bondad de ajuste de los modelos desarrollados. Para el caso de los clasificadores, se analizará el comportamiento de la puntuación de pertenencia del caso a cada una de las clases y su impacto en el negocio.
1. Introducción a la minería de datos. Modelos supervisados y modelos no supervisados
2. Clasificadores. Entropía e información. Información ganada
3. ROC y PRC. Concepto de puntuación de corte
4. Submuestras de entrenamiento y de prueba. Validación cruzada
5. Bayesiano ingenuo
6. CART
7. Regresión logística
8. Máquinas de soporte vectorial
9. Redes neuronales como clasificadores
10.KNN como clasificadores
11.Sobrecarga y compensación
12.Predictores. Objetivo
13.Modelos lineales. Correlación lineal
14.Regresión lineal
15.Modelos no lineales. Redes neuronales como predictores
16.Árboles para regresión
17.KNN como predictores
Módulo 3: MODELOS NO SUPERVISADOS Y TRANSFORMACIÓN DE DATOS
Objetivo: Los participantes conocerán los fundamentos y objetivos de los modelos de asociación y la manera en que se derivan y usan las reglas de asociación.
Se analizarán las métricas aplicables a estos modelos y sus implicaciones para el negocio. Se revisarán las principales técnicas para elaborar modelos de agrupamiento y se examinarán los criterios para formar el número adecuado de grupos.
Los participantes aprenderán a analizar con ayuda de los clasificadores el contenido de los grupos resultado de un agrupamiento dado y determinarán el impacto en el negocio.
1. Modelos de asociación. Algoritmos
2. Reglas obtenidas e interpretación
3. Métricas para la selección de combinaciones
4. Aplicación de los modelos de selección para relaciones entre elementos
5. Relación con grafos de elementos
6. Conglomerados o agrupamientos
7. Técnicas de dendrograma
8. Técnicas de Ward
9. KNN
10.Mapas autoorganizativos
11.Métricas para seleccionar el número de grupos
12.Componentes principales
13.Proyecciones
14.Estandarización
15.Logaritmos y exponenciales
16.Binarización y agrupamiento de valores por rango
Módulo 4: PROCESAMIENTO Y ANÁLISIS DE TEXTO
Objetivo: Los participantes analizarán los problemas que plantea la elaboración de modelos para tratamiento de texto. Se configurarán procesamientos para extraer información con el fin de analizar los textos y utilizar esta información con modelos supervisados y no supervisados. Se comprenderá la finalidad del análisis de textos en función del objetivo particular.
1. Captura de datos en páginas web
2. Captura de tweets
3. Corpus. Proceso general de detección de asociación de términos. Medidas de relevancia
4. Matriz de documentos y términos. Búsqueda de narrativas
5. Expresiones regulares para las narrativas
6. Variables indicadoras de narrativas para clasificadores, predictores, asociaciones o conglomerados. Puesta en producción de detección de narrativas en textos
Módulo 5: SISTEMAS DE RECOMENDACIÓN. USO DE HERRAMIENTAS EN LA NUBE
Objetivo: Los sistemas de recomendación constituyen actualmente una de las herramientas comerciales más importantes. Los participantes aprenderán a utilizar estos sistemas y a realizar modelos para este fin.
1. Sistemas de recomendación. Análisis de clientes y su comportamiento
2. Conformación de agrupamientos y asociación de ítems
3. Procesamiento en flujo
4. Ejemplos en R para proceso de datos
5. Bibliotecas equivalentes para modelos supervisados y no supervisados
6. Similitudes y diferencias entre pandas y tramas de datos en R
7. Datos en la nube y herramientas en nube
8. Prácticas con herramientas en nube para desarrollo de modelos
9. Avance y presentación del proyecto
Objetivo: Se proporcionará a los participantes las herramientas básicas de programación para el tratamiento detallado de datos y para manejar arreglos, series y tramas de datos en Python. Con ello se establecerá una plataforma general para la adquisición y procesamiento de datos. Se analizarán los métodos generales para procesar tablas por medio de tramas de datos en pandas.
1. Programación en Python, NumPy, pandas y Matplotlib
2. Estructura de la trama de datos. Índices y columnas
3. Importación y exportación de datos. Codificación
4. Métodos de consolidación de información. Limpieza y transformación de datos
5. Selección de registros. Mutación de valores. Concatenación y fusión
6. Visualización de datos
7. Herramientas para el análisis exploratorio de datos. Funciones lambda
8. Generación de documentos con el resultado de las ejecuciones
Módulo 2: MODELOS SUPERVISADOS
Objetivo: En este módulo, los participantes comprenderán los fundamentos, hipótesis y finalidad de los métodos supervisados, la manera en que se establecen los objetivos de negocio en términos de la variable objetivo y las métricas con que se determina la bondad de ajuste de los modelos desarrollados. Para el caso de los clasificadores, se analizará el comportamiento de la puntuación de pertenencia del caso a cada una de las clases y su impacto en el negocio.
1. Introducción a la minería de datos. Modelos supervisados y modelos no supervisados
2. Clasificadores. Entropía e información. Información ganada
3. ROC y PRC. Concepto de puntuación de corte
4. Submuestras de entrenamiento y de prueba. Validación cruzada
5. Bayesiano ingenuo
6. CART
7. Regresión logística
8. Máquinas de soporte vectorial
9. Redes neuronales como clasificadores
10.KNN como clasificadores
11.Sobrecarga y compensación
12.Predictores. Objetivo
13.Modelos lineales. Correlación lineal
14.Regresión lineal
15.Modelos no lineales. Redes neuronales como predictores
16.Árboles para regresión
17.KNN como predictores
Módulo 3: MODELOS NO SUPERVISADOS Y TRANSFORMACIÓN DE DATOS
Objetivo: Los participantes conocerán los fundamentos y objetivos de los modelos de asociación y la manera en que se derivan y usan las reglas de asociación.
Se analizarán las métricas aplicables a estos modelos y sus implicaciones para el negocio. Se revisarán las principales técnicas para elaborar modelos de agrupamiento y se examinarán los criterios para formar el número adecuado de grupos.
Los participantes aprenderán a analizar con ayuda de los clasificadores el contenido de los grupos resultado de un agrupamiento dado y determinarán el impacto en el negocio.
1. Modelos de asociación. Algoritmos
2. Reglas obtenidas e interpretación
3. Métricas para la selección de combinaciones
4. Aplicación de los modelos de selección para relaciones entre elementos
5. Relación con grafos de elementos
6. Conglomerados o agrupamientos
7. Técnicas de dendrograma
8. Técnicas de Ward
9. KNN
10.Mapas autoorganizativos
11.Métricas para seleccionar el número de grupos
12.Componentes principales
13.Proyecciones
14.Estandarización
15.Logaritmos y exponenciales
16.Binarización y agrupamiento de valores por rango
Módulo 4: PROCESAMIENTO Y ANÁLISIS DE TEXTO
Objetivo: Los participantes analizarán los problemas que plantea la elaboración de modelos para tratamiento de texto. Se configurarán procesamientos para extraer información con el fin de analizar los textos y utilizar esta información con modelos supervisados y no supervisados. Se comprenderá la finalidad del análisis de textos en función del objetivo particular.
1. Captura de datos en páginas web
2. Captura de tweets
3. Corpus. Proceso general de detección de asociación de términos. Medidas de relevancia
4. Matriz de documentos y términos. Búsqueda de narrativas
5. Expresiones regulares para las narrativas
6. Variables indicadoras de narrativas para clasificadores, predictores, asociaciones o conglomerados. Puesta en producción de detección de narrativas en textos
Módulo 5: SISTEMAS DE RECOMENDACIÓN. USO DE HERRAMIENTAS EN LA NUBE
Objetivo: Los sistemas de recomendación constituyen actualmente una de las herramientas comerciales más importantes. Los participantes aprenderán a utilizar estos sistemas y a realizar modelos para este fin.
1. Sistemas de recomendación. Análisis de clientes y su comportamiento
2. Conformación de agrupamientos y asociación de ítems
3. Procesamiento en flujo
4. Ejemplos en R para proceso de datos
5. Bibliotecas equivalentes para modelos supervisados y no supervisados
6. Similitudes y diferencias entre pandas y tramas de datos en R
7. Datos en la nube y herramientas en nube
8. Prácticas con herramientas en nube para desarrollo de modelos
9. Avance y presentación del proyecto
Requisitos
Los participantes deben saber ejecutar programas, manejar archivos y carpetas, comprimir y descomprimir archivos, consultar y bajar archivos en la red, manejar hojas electrónicas y tener nociones de bases de datos relacionales. Se requieren conocimientos básicos de álgebra, álgebra lineal, probabilidad y estadística.
Metodología
El programa se imparte en cinco módulos, en los que se exponen los temas y se llevan a cabo prácticas con tablas de volúmenes considerables de registros. El trabajo se realiza normalmente en computadora. Los participantes realizarán trabajos fuera de clase, para lo cual deben instalar en su computadora las herramientas de software para las prácticas y las tareas. Al concluir el módulo 4, los participantes formarán equipos para elaborar un proyecto y presentarlo como trabajo final del diplomado al terminar el módulo 5.
Idiomas en los que se imparte
Español
Duración
120 horas, 5 módulos.
Inicia: Consultar con el centro.
Objetivos
- Se analizan los modelos supervisados y los no supervisados, así como las técnicas de transformación de datos.
- Para el caso de los clasificadores, se realizan posprocesos a partir de la puntuación.
- Se determina la puntuación de corte para los casos en que existan utilidades y costos asociados a la decisión.
- Se utiliza Python como herramienta de procesamiento de datos y formación de modelos, además de herramientas de software abierto o gratuito con Python como soporte general.
- Se usa Weka por su versatilidad y facilidad para desarrollo rápido de prototipos y modelos.
- Se contempla la puesta en producción en Python y Weka y se analiza R como alternativa.
Título obtenido
Título de Diplomado, expedido por ITAM.
Promociones
Consultar con el centro
Precio
Precio 57.600 $
Costo de inscripción: 8,100.00 pesos m.n
Costo por módulo: 9,900.00 pesos m.n
Ventajas del curso
¿Te gustó este programa? ITAM puede llevarlo a Tu Empresa o diseñar alguno de acuerdo a las necesidades de Tu Organización.
Profesorado
Coordinador académico: M.I. Rafael Gregorio Gamboa Hirales.
Los programas se impartirán por profesores especializados en el área, es posible que no todos se muestren en este listado y haya cambios sin previo aviso.
Horario
Lunes de 19:00 a 22:00 h.
Miércoles de 19:00 a 22:00 h.
Diplomado en Herramientas de Minería de Datos y Analítica Empresarial
Instituto Tecnológico Autónomo de México (ITAM)
Campus y sedes: Instituto Tecnológico Autónomo de México (ITAM)
Sede - ITAM Instituto Tecnológico Autónomo de México
Río Hondo #1 Col. Progreso Tizapán
01080
Álvaro Obregón
(Distrito Federal)