Temario del curso
Introducción al Aprendizaje por Refuerzo e IA Agéntica
- Toma de decisiones bajo incertidumbre y planificación secuencial
- Componentes clave del RL: agentes, entornos, estados y recompensas
- El papel del RL en sistemas de IA adaptativa y agéntica
Procesos de Decisión de Markov (MDPs)
- Definición formal y propiedades de los MDPs
- Funciones de valor, ecuaciones de Bellman y programación dinámica
- Evaluación, mejora e iteración de políticas
Aprendizaje por Refuerzo sin Modelo
- Aprendizaje Monte Carlo y Diferencia Temporal (TD)
- Q-learning y SARSA
- Práctica: implementación de métodos RL tabulares en Python
Aprendizaje por Refuerzo Profundo
- Combinación de redes neuronales con RL para aproximación de funciones
- Deep Q-Networks (DQN) y memoria de experiencia (experience replay)
- Arquitecturas Actor-Crítico y gradientes de políticas
- Práctica: entrenamiento de un agente utilizando DQN y PPO con Stable-Baselines3
Estrategias de Exploración y Moldeo de Recompensas
- Equilibrio entre exploración y explotación (épsilon-greedy, UCB, métodos de entropía)
- Diseño de funciones de recompensa y prevención de comportamientos no deseados
- Moldeo de recompensas y aprendizaje por currículo
Temas Avanzados en RL y Toma de Decisiones
- Aprendizaje por refuerzo multi-agente y estrategias cooperativas
- Aprendizaje por refuerzo jerárquico y marco de opciones (options framework)
- RL fuera de línea (offline RL) y aprendizaje por imitación para despliegues más seguros
Entornos de Simulación y Evaluación
- Uso de OpenAI Gym y entornos personalizados
- Espacios de acción continuos vs. discretos
- Métricas para el rendimiento del agente, estabilidad y eficiencia de muestras
Integración del RL en Sistemas de IA Agéntica
- Combinación de razonamiento y RL en arquitecturas híbridas de agentes
- Integración del aprendizaje por refuerzo con agentes que utilizan herramientas
- Consideraciones operativas para el escalado y despliegue
Proyecto Final
- Diseño e implementación de un agente de aprendizaje por refuerzo para una tarea simulada
- Análisis del rendimiento durante el entrenamiento y optimización de hiperparámetros
- Demostración de comportamiento adaptativo y toma de decisiones en un contexto agéntico
Resumen y Próximos Pasos
Requerimientos
- Dominio avanzado de la programación en Python
- Sólida comprensión de los conceptos de aprendizaje automático y aprendizaje profundo
- Familiaridad con álgebra lineal, probabilidad y métodos básicos de optimización
Audiencia Objetivo
- Ingenieros de aprendizaje por refuerzo e investigadores de IA aplicada
- Desarrolladores de robótica y automatización
- Equipos de ingeniería que trabajan en sistemas de IA adaptativa y agéntica
Testimonios (3)
El instructor es paciente y muy útil. Conoce bien el tema.
CLIFFORD TABARES - Universal Leaf Philippines, Inc.
Curso - Agentic AI for Business Automation: Use Cases & Integration
Traducción Automática
Buena mezcla de conocimiento y práctica
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Agentic AI for Enterprise Applications
Traducción Automática
La mezcla de teoría y práctica, así como de perspectivas de alto y bajo nivel
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Autonomous Decision-Making with Agentic AI
Traducción Automática