Temario del curso
Introducción al Aprendizaje Automático (Machine Learning)
- Tipos de aprendizaje automático – supervisado vs no supervisado
- Del aprendizaje estadístico al aprendizaje automático
- El flujo de trabajo de minería de datos: comprensión del negocio, preparación de datos, modelado, despliegue
- Elección del algoritmo adecuado para la tarea
- Overfitting y el compromiso entre sesgo y varianza (bias-variance tradeoff)
Introducción a Python y Bibliotecas de Aprendizaje Automático
- Por qué usar lenguajes de programación para el aprendizaje automático
- Elección entre R y Python
- Curso intensivo de Python y Jupyter Notebooks
- Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Prueba y Evaluación de Algoritmos de Aprendizaje Automático
- Generalización, overfitting y validación del modelo
- Estrategias de evaluación: holdout, cross-validation, bootstrapping
- Métricas para regresión: ME, MSE, RMSE, MAPE
- Métricas para clasificación: precisión, matriz de confusión, clases desbalanceadas
- Visualización del rendimiento del modelo: curva de utilidad, curva ROC, curva de elevación (lift curve)
- Selección de modelos y búsqueda en cuadrícula para ajuste (grid search for tuning)
Preparación de Datos
- Importación y almacenamiento de datos en Python
- Análisis exploratorio y estadísticas descriptivas
- Manejo de valores faltantes y outliers
- Estandarización, normalización y transformación
- Recodificación de datos cualitativos y manipulación de datos con pandas
Algoritmos de Clasificación
- Clasificación binaria vs multiclase
- Regresión logística y funciones discriminantes
- Naïve Bayes, k-vecinos más cercanos (k-nearest neighbors)
- Árboles de decisión: CART, Bosques Aleatorios (Random Forests), Bagging, Boosting, XGBoost
- Máquinas de Vectores Soporte y núcleos (Support Vector Machines and kernels)
- Técnicas de aprendizaje en conjunto (ensemble learning techniques)
Regresión y Predicción Numérica
- Mínimos cuadrados y selección de variables
- Métodos de regularización: L1, L2
- Regresión polinomial y modelos no lineales
- Árboles de regresión y splines
Redes Neuronales
- Introducción a las redes neuronales y aprendizaje profundo (deep learning)
- Funciones de activación, capas y retropropagación (backpropagation)
- Perceptrones multicapa (Multilayer perceptrons - MLP)
- Uso de TensorFlow o PyTorch para modelado básico de redes neuronales
- Redes neuronales para clasificación y regresión
Pronóstico de Ventas y Análisis Predictivo
- Series temporales vs pronóstico basado en regresión
- Manejo de datos estacionales y tendencias (trend-based data)
- Construcción de un modelo de pronóstico de ventas utilizando técnicas de aprendizaje automático
- Evaluación de la precisión del pronóstico y la incertidumbre
- Interpretación e interpretación empresarial y comunicación de resultados
Aprendizaje No Supervisado (Unsupervised Learning)
- Técnicas de clustering: k-means, k-medoids, clustering jerárquico, SOMs (Self-Organizing Maps)
- Reducción de dimensionalidad: PCA, análisis factorial, SVD
- Escalamiento multidimensional (multidimensional scaling)
Minería de Texto (Text Mining)
- Preprocesamiento y tokenización de texto
- Bolsa de palabras, stemming y lematización (lemmatization)
- Análisis de sentimiento y frecuencia de palabras
- Visualización de datos de texto con nubes de palabras (word clouds)
Sistemas de Recomendación (Recommendation Systems)
- Filtrado colaborativo basado en usuarios y elementos (user-based and item-based collaborative filtering)
- Diseño y evaluación de motores de recomendación (recommendation engines)
Minería de Patrones de Asociación (Association Pattern Mining)
- Conjuntos de elementos frecuentes y algoritmo Apriori
- Análisis de cesta de compra y ratio de elevación (lift ratio)
Detección de Anomalías (Outlier Detection)
- Análisis de valores extremos (extreme value analysis)
- Métodos basados en distancia y densidad (distance-based and density-based methods)
- Detección de anomalías en datos de alta dimensión (high-dimensional data)
Estudio de Caso de Aprendizaje Automático (Machine Learning Case Study)
- Comprensión del problema empresarial
- Preprocesamiento de datos y ingeniería de características (feature engineering)
- Selección de modelos y ajuste de parámetros (parameter tuning)
- Evaluación y presentación de resultados (presentation of findings)
- Despliegue del modelo (deployment)
Resumen y Pasos Siguientes (Summary and Next Steps)
Requerimientos
- Conocimientos básicos de conceptos de aprendizaje automático, como el aprendizaje supervisado y no supervisado
- Familiaridad con la programación en Python (variables, bucles, funciones)
- Alguna experiencia con el manejo de datos usando bibliotecas como pandas o NumPy es útil, pero no es requerida
- No se espera ninguna experiencia previa con modelado avanzado o redes neuronales
Público objetivo
- Científicos de datos
- Analistas de negocios
- Ingenieros de software y profesionales técnicos que trabajan con datos
Testimonios (2)
Me gustó mucho el final donde tuvimos la oportunidad de experimentar con CHAT GPT. La sala no estaba muy bien preparada para esto; en lugar de una gran mesa, varias mesas pequeñas nos habrían permitido formar grupos pequeños y generar ideas de manera más efectiva.
Nola - Laramie County Community College
Curso - Artificial Intelligence (AI) Overview
Traducción Automática
Trabajando desde principios fundamentales de manera enfocada y pasando a aplicar estudios de caso en el mismo día
Maggie Webb - Department of Jobs, Regions, and Precincts
Curso - Artificial Neural Networks, Machine Learning, Deep Thinking
Traducción Automática