Programa del Curso
Introducción
Esta sección proporciona una introducción general de cuándo usar el "aprendizaje automático", qué se debe considerar y qué significa todo, incluidos los pros y los contras. Tipos de datos (estructurados / no estructurados / estáticos / transmitidos), validez / volumen de datos, análisis basados en datos vs impulsados por el usuario, modelos estadísticos frente a modelos de aprendizaje automático / desafíos del aprendizaje no supervisado, compensación de varianza de sesgo, iteración / evaluación, enfoques de validación cruzada, supervisados / no supervisados / refuerzo.
TEMAS PRINCIPALES
1. Comprender al Bayes ingenuo
- Conceptos básicos de los métodos bayesianos
- Probabilidad
- Probabilidad conjunta
- Probabilidad condicional con teorema de Bayes
- El ingenuo algoritmo de Bayes
- La ingenua clasificación de Bayes
- El estimador de Laplace
- Uso de características numéricas con Bayes ingenuo
2. Comprender los árboles de decisión
- Divide y vencerás
- El algoritmo del árbol de decisión C5.0
- Elegir el mejor split
- Poda del árbol de decisión
3. Comprender las redes neuronales
- De las neuronas biológicas a las artificiales
- Funciones de activación
- Topología de red
- El número de capas
- La dirección del viaje de información
- El número de nodos en cada capa
- Entrenamiento de redes neuronales con retropropagación
- Deep Learning
4. Comprender las máquinas de vectores de soporte
- Clasificación con hiperplanos
- Encontrar el margen máximo
- El caso de los datos linealmente separables
- El caso de los datos no separables linealmente
- Uso de núcleos para espacios no lineales
5. Comprensión de la agrupación en clústeres
- Agrupación en clústeres como tarea de aprendizaje automático
- El algoritmo k-means para la agrupación en clústeres
- Uso de la distancia para asignar y actualizar clústeres
- Elegir el número adecuado de clústeres
6. Medición del rendimiento para la clasificación
- Trabajar con datos de predicción de clasificación
- Una mirada más cercana a las matrices de confusión
- Uso de matrices de confusión para medir el rendimiento
- Más allá de la precisión: otras medidas de rendimiento
- La estadística kappa
- Sensibilidad y especificidad
- Precisión y recuperación
- La medida F
- Visualización de las compensaciones de rendimiento
- Curvas ROC
- Estimación del rendimiento futuro
- El método de retención
- Validación cruzada
- Bootstrap muestreo
7. Ajuste de los modelos de stock para un mejor rendimiento
- Uso de la intercalación para el ajuste automatizado de parámetros
- Creación de un modelo ajustado simple
- Personalización del proceso de ajuste
- Mejora del rendimiento del modelo con metaaprendizaje
- Entendiendo los conjuntos
- Embolsado
- Impulsar
- Bosques aleatorios
- Entrenamiento de bosques aleatorios
- Evaluación del rendimiento aleatorio del bosque
TEMAS MENORES
8. Comprender la clasificación utilizando los vecinos más cercanos
- El algoritmo kNN
- Cálculo de la distancia
- Elegir un k apropiado
- Preparación de datos para su uso con kNN
- ¿Por qué el algoritmo kNN es perezoso?
9. Comprender las reglas de clasificación
- Separa y conquista
- El algoritmo One Rule
- El algoritmo RIPPER
- Reglas de los árboles de decisión
10. Comprender la regresión
- Regresión lineal simple
- Estimación de mínimos cuadrados ordinarios
- Correlaciones
- Regresión lineal múltiple
11. Comprender los árboles de regresión y los árboles modelo
- Agregar regresión a los árboles
12. Comprender las reglas de asociación
- El algoritmo a priori para el aprendizaje de reglas de asociación
- Medición del interés de las reglas: apoyo y confianza
- Construir un conjunto de reglas con el principio de Apriori
Extras
- Spark/PySpark/MLlib y bandidos multiarmados
Testimonios (5)
Manteniéndolo corto y simple. Creación de intuición y modelos visuales alrededor de los conceptos (gráfico de árbol de decisión, ecuaciones lineales, cálculo y_pred manualmente para probar cómo funciona el modelo).
Nicolae - DB Global Technology
Curso - Machine Learning
Traducción Automática
Me ayudó a lograr mi objetivo de entender ML. Mucho respeto para Pablo por dar una introducción adecuada en este tema, ya que se hace evidente después de 3 días de entrenamiento lo vasto que es este tema. También he disfrutado MUCHO la idea de las máquinas virtuales que me has proporcionado, ¡que tenían muy buena latencia! Permitió a cada coursant hacer experimentos a su propio ritmo.
Silviu - DB Global Technology
Curso - Machine Learning
Traducción Automática
The way practical part, seeing the theory materializing into something practical is great.
Lisa Fekade - Vodacom
Curso - Machine Learning
It's just great that all material including the exercises is on the same page and then it gets updated on the fly. The solution is revealed at the end. Cool! Also, I do appreciate that Krzysztof took extra effort to understand our problems and suggested us possible techniques.
Attila Nagy - L M ERICSSON LIMITED
Curso - Machine Learning
I liked the lab exercises.