Contacta con nosotros

Temario del curso

Arquitectura de Greenplum

  • Procesamiento en paralelo y multiprocesamiento simétrico (SMP)
  • Roles de segmentos y configuración del clúster
  • Escalabilidad y movimiento de datos
  • Arquitectura del almacén de datos Greenplum

Estructuras de Tablas en Greenplum

  • Tablas distribuidas frente a tablas con distribución aleatoria
  • Tablas Heap frente a tablas append-only (solo adición)
  • Formatos de almacenamiento por fila frente a formato columnar
  • Tablas particionadas y agrupadas (clustered)

Distribución de Datos y Funciones Hash

  • Lógica de hash y claves de distribución
  • Manejo de la asimetría (skew) e impacto en el rendimiento
  • Mapas hash y estrategias de colocación de filas

Índices y Optimización del Rendimiento

  • Índices agrupados (clustered) y no agrupados
  • Casos de uso de índices B-tree y bitmap
  • Comportamiento del escaneo de índices y el almacenamiento

Diseño Físico de la Base de Datos

  • Normalización y diseño del modelo lógico
  • Estrategias de acceso del usuario y análisis de distribución
  • Demografía de los datos y decisiones de indexación

Técnicas de Desnormalización

  • Datos derivados, tablas resumen y pre-join (uniones previas)
  • Tablas columnares como particionamiento vertical
  • Data marts y vistas materializadas

SQL Avanzado y Ejecución de Consultas

  • Estrategias de unión (join) y redistribución
  • Funciones OLAP y funciones de ventana (window functions)
  • Tablas temporales, subconsultas y tablas derivadas

Planes EXPLAIN y Afinamiento de Consultas

  • Lectura e interpretación de la salida EXPLAIN
  • Análisis de costes y optimización del plan
  • Movimiento de uniones y operaciones locales al segmento

Utilidades de Greenplum y Mejores Prácticas

  • ANALYZE y VACUUM
  • Carga y movimiento de datos con Nexus
  • Seguridad, permisos y consejos de rendimiento

Resumen y Próximos Pasos

Requerimientos

  • Conocimiento de bases de datos relacionales y SQL
  • Experiencia con almacenes de datos o sistemas analíticos
  • Familiaridad con operaciones en la línea de comandos de Linux

Público Objetivo

  • Arquitectos e ingenieros de datos
  • Administradores de bases de datos y líderes técnicos
  • Desarrolladores de BI y especialistas en analítica que trabajan con Greenplum
 21 Horas

Número de participantes


Precio por participante

Testimonios (5)

Próximos cursos

Categorías Relacionadas