Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción a AIOps
- Qué es AIOps y por qué es importante.
- Monitorización tradicional frente a observabilidad impulsada por AIOps.
- Arquitectura de AIOps y componentes clave.
Recopilación y Normalización de Datos Operativos
- Tipos de datos de observabilidad: métricas, registros y trazas.
- Ingestión de datos desde múltiples fuentes (servidores, contenedores, nube).
- Uso de agentes y exportadores (Prometheus, Beats, Fluentd).
Correlación de Datos y Detección de Anomalías
- Correlación en series temporales y métodos estadísticos.
- Uso de modelos de aprendizaje automático para la detección de anomalías.
- Detección de incidentes en sistemas distribuidos.
Alertas y Reducción de Ruido
- Diseño de reglas y umbrales inteligentes para alertas.
- Supresión, deduplicación y agrupamiento de alertas.
- Integración con Alertmanager, Slack, PagerDuty u Opsgenie.
Análisis de Causa Raíz y Visualización
- Uso de paneles de control para visualizar métricas y detectar tendencias.
- Exploración de eventos y cronologías para el análisis RCA.
- Trazado de problemas a través de capas con herramientas de trazabilidad distribuida.
Automatización y Remediación
- Ejecución automática de scripts o flujos de trabajo a partir de incidentes.
- Integración con sistemas ITSM (ServiceNow, Jira).
- Casos de uso: auto-reparación, escalado y reenvío de tráfico.
Plataformas AIOps de Código Abierto y Comerciales
- Resumen de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace.
- Criterios de evaluación para seleccionar una plataforma AIOps.
- Demostración y práctica con un conjunto de herramientas seleccionado.
Resumen y Próximos Pasos
Requerimientos
- Comprensión de los conceptos de operaciones de TI y monitorización de sistemas.
- Experiencia con herramientas o paneles de control de monitorización.
- Familiaridad con formatos básicos de registros y métricas.
Audiencia Objetivo
- Equipos de operaciones responsables de infraestructura y aplicaciones.
- Ingenieros de Confiabilidad del Sitio (SRE).
- Equipos de monitorización y observabilidad de TI.
14 Horas