Programa del Curso

Introducción a los Big Data Ecosistemas

  • Visión general de tecnologías y arquitecturas de big data
  • Procesamiento por lotes vs. procesamiento en tiempo real
  • Estrategias de almacenamiento de datos para escalabilidad

Procesamiento Avanzado de Datos con Apache Spark

  • Otimitzación de trabajos Spark para el rendimiento
  • Transformaciones y acciones avanzadas
  • Trabajo con streaming estructurado

Machine Learning a Escala

  • Técnicas de entrenamiento distribuido de modelos
  • Ajuste de hiperparámetros en grandes conjuntos de datos
  • Implementación de modelos en entornos de big data

Deep Learning para Big Data

  • Integración de TensorFlow y PyTorch con Spark
  • Pipelines de entrenamiento distribuido de deep learning
  • Casos de uso en análisis de imágenes, texto y series temporales

Análisis en Tiempo Real y Flujo de Datos

  • Apache Kafka para la ingesta de datos en streaming
  • Frameworks de procesamiento de flujo
  • Monitoreo y alertas en sistemas en tiempo real

Data Governance, Seguridad y Ética

  • Requisitos de privacidad de datos y cumplimiento normativo
  • Control y cifrado de Access en sistemas de big data
  • Consideraciones éticas en análisis a gran escala

Integración de Big Data con Business Intelligence

  • Visualización de datos y tableros para big data
  • Conexión de pipelines de big data a herramientas de BI
  • Movilización de resultados empresariales mediante análisis avanzados

Resumen y Próximos Pasos

Requerimientos

  • Comprensión sólida de los conceptos de análisis de datos y modelado estadístico
  • Experiencia con herramientas de procesamiento de datos y lenguajes de programación como Python, R o Scala
  • Familiaridad con marcos de computación distribuida como Hadoop o Spark

Público Objetivo

  • Científicos de datos que buscan dominar el procesamiento a gran escala y la analítica predictiva
  • Analistas seniors que buscan diseñar e implementar flujos de trabajo avanzados de análisis
  • Profesionales de I+D enfocados en soluciones innovadoras impulsadas por datos
 42 Horas

Número de participantes


Precio por Participante​

Testimonios (5)

Próximos cursos

Categorías Relacionadas