Contacta con nosotros

Temario del curso

Introducción a AIOps

  • Qué es AIOps y por qué es importante.
  • Monitorización tradicional frente a observabilidad impulsada por AIOps.
  • Arquitectura de AIOps y componentes clave.

Recopilación y Normalización de Datos Operativos

  • Tipos de datos de observabilidad: métricas, registros y trazas.
  • Ingestión de datos desde múltiples fuentes (servidores, contenedores, nube).
  • Uso de agentes y exportadores (Prometheus, Beats, Fluentd).

Correlación de Datos y Detección de Anomalías

  • Correlación en series temporales y métodos estadísticos.
  • Uso de modelos de aprendizaje automático para la detección de anomalías.
  • Detección de incidentes en sistemas distribuidos.

Alertas y Reducción de Ruido

  • Diseño de reglas y umbrales inteligentes para alertas.
  • Supresión, deduplicación y agrupamiento de alertas.
  • Integración con Alertmanager, Slack, PagerDuty u Opsgenie.

Análisis de Causa Raíz y Visualización

  • Uso de paneles de control para visualizar métricas y detectar tendencias.
  • Exploración de eventos y cronologías para el análisis RCA.
  • Trazado de problemas a través de capas con herramientas de trazabilidad distribuida.

Automatización y Remediación

  • Ejecución automática de scripts o flujos de trabajo a partir de incidentes.
  • Integración con sistemas ITSM (ServiceNow, Jira).
  • Casos de uso: auto-reparación, escalado y reenvío de tráfico.

Plataformas AIOps de Código Abierto y Comerciales

  • Resumen de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace.
  • Criterios de evaluación para seleccionar una plataforma AIOps.
  • Demostración y práctica con un conjunto de herramientas seleccionado.

Resumen y Próximos Pasos

Requerimientos

  • Comprensión de los conceptos de operaciones de TI y monitorización de sistemas.
  • Experiencia con herramientas o paneles de control de monitorización.
  • Familiaridad con formatos básicos de registros y métricas.

Audiencia Objetivo

  • Equipos de operaciones responsables de infraestructura y aplicaciones.
  • Ingenieros de Confiabilidad del Sitio (SRE).
  • Equipos de monitorización y observabilidad de TI.
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas