Contacta con nosotros

Temario del curso

Introducción a AIOps con herramientas de código abierto.

  • Panorama general de los conceptos y beneficios de AIOps.
  • Prometheus y Grafana en la pila de observabilidad.
  • El lugar del aprendizaje automático en AIOps: análisis predictivo frente a reactivo.

Configuración de Prometheus y Grafana.

  • Instalación y configuración de Prometheus para la recopilación de series temporales.
  • Creación de dashboards en Grafana utilizando métricas en tiempo real.
  • Exploración de exportadores, reetiquetado y descubrimiento de servicios.

Preprocesamiento de datos para aprendizaje automático.

  • Extracción y transformación de métricas de Prometheus.
  • Preparación de conjuntos de datos para la detección de anomalías y previsión.
  • Uso de las transformaciones de Grafana o pipelines en Python.

Aplicación del aprendizaje automático para la detección de anomalías.

  • Modelos básicos de aprendizaje automático para la detección de valores atípicos (por ejemplo, Isolation Forest, One-Class SVM).
  • Entrenamiento y evaluación de modelos en datos de series temporales.
  • Visualización de anomalías en dashboards de Grafana.

Previsión de métricas con aprendizaje automático.

  • Construcción de modelos simples de previsión (ARIMA, Prophet, introducción a LSTM).
  • Predicción de carga del sistema o uso de recursos.
  • Uso de las previsiones para alertas tempranas y decisiones de escalado.

Integración del aprendizaje automático con alertas y automatización.

  • Definición de reglas de alerta basadas en la salida o umbrales del modelo de aprendizaje automático.
  • Uso de Alertmanager y enrutamiento de notificaciones.
  • Activación de scripts o flujos de trabajo de automatización al detectar anomalías.

Escalado y operacionalización de AIOps.

  • Integración de herramientas externas de observabilidad (por ejemplo, ELK stack, Moogsoft, Dynatrace).
  • Puesta en producción de modelos de aprendizaje automático en pipelines de observabilidad.
  • Mejores prácticas para AIOps a gran escala.

Resumen y próximos pasos.

Requerimientos

  • Comprensión de los conceptos de monitoreo y observabilidad de sistemas.
  • Experiencia utilizando Grafana o Prometheus.
  • Familiaridad con Python y principios básicos de aprendizaje automático.

Público objetivo

  • Ingenieros de observabilidad.
  • Equipos de infraestructura y DevOps.
  • Arquitectos de plataformas de monitoreo e ingenieros de confiabilidad del sitio (SREs).
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas