Contacta con nosotros

Temario del curso

Introducción al Aprendizaje por Refuerzo e IA Agéntica

  • Toma de decisiones bajo incertidumbre y planificación secuencial
  • Componentes clave del RL: agentes, entornos, estados y recompensas
  • El papel del RL en sistemas de IA adaptativa y agéntica

Procesos de Decisión de Markov (MDPs)

  • Definición formal y propiedades de los MDPs
  • Funciones de valor, ecuaciones de Bellman y programación dinámica
  • Evaluación, mejora e iteración de políticas

Aprendizaje por Refuerzo sin Modelo

  • Aprendizaje Monte Carlo y Diferencia Temporal (TD)
  • Q-learning y SARSA
  • Práctica: implementación de métodos RL tabulares en Python

Aprendizaje por Refuerzo Profundo

  • Combinación de redes neuronales con RL para aproximación de funciones
  • Deep Q-Networks (DQN) y memoria de experiencia (experience replay)
  • Arquitecturas Actor-Crítico y gradientes de políticas
  • Práctica: entrenamiento de un agente utilizando DQN y PPO con Stable-Baselines3

Estrategias de Exploración y Moldeo de Recompensas

  • Equilibrio entre exploración y explotación (épsilon-greedy, UCB, métodos de entropía)
  • Diseño de funciones de recompensa y prevención de comportamientos no deseados
  • Moldeo de recompensas y aprendizaje por currículo

Temas Avanzados en RL y Toma de Decisiones

  • Aprendizaje por refuerzo multi-agente y estrategias cooperativas
  • Aprendizaje por refuerzo jerárquico y marco de opciones (options framework)
  • RL fuera de línea (offline RL) y aprendizaje por imitación para despliegues más seguros

Entornos de Simulación y Evaluación

  • Uso de OpenAI Gym y entornos personalizados
  • Espacios de acción continuos vs. discretos
  • Métricas para el rendimiento del agente, estabilidad y eficiencia de muestras

Integración del RL en Sistemas de IA Agéntica

  • Combinación de razonamiento y RL en arquitecturas híbridas de agentes
  • Integración del aprendizaje por refuerzo con agentes que utilizan herramientas
  • Consideraciones operativas para el escalado y despliegue

Proyecto Final

  • Diseño e implementación de un agente de aprendizaje por refuerzo para una tarea simulada
  • Análisis del rendimiento durante el entrenamiento y optimización de hiperparámetros
  • Demostración de comportamiento adaptativo y toma de decisiones en un contexto agéntico

Resumen y Próximos Pasos

Requerimientos

  • Dominio avanzado de la programación en Python
  • Sólida comprensión de los conceptos de aprendizaje automático y aprendizaje profundo
  • Familiaridad con álgebra lineal, probabilidad y métodos básicos de optimización

Audiencia Objetivo

  • Ingenieros de aprendizaje por refuerzo e investigadores de IA aplicada
  • Desarrolladores de robótica y automatización
  • Equipos de ingeniería que trabajan en sistemas de IA adaptativa y agéntica
 28 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas