Programa del Curso

Introducción a Data Analysis y Big Data

    ¿Qué hace que Big Data sea "grande"? Velocidad, Volumen, Variedad, Veracidad (VVVV)
Límites del procesamiento tradicional de datos
  • Procesamiento distribuido
  • Análisis estadístico
  • Tipos de análisis Machine Learning
  • Data Visualization
  • Big Data Funciones y responsabilidades
  • Administradores Desarrolladores Analistas de datos

      Languages Se utiliza para el análisis de datos

    R Language ¿Por qué R para el análisis de datos? Manipulación de datos, cálculo y visualización gráfica

      Python ¿Por qué Python para el análisis de datos?
    Manipulación, procesamiento, limpieza y procesamiento de datos
  • Enfoques para Data Analysis
  • Análisis estadístico Análisis de series temporales Pronóstico con modelos de correlación y regresión Inferencial Statistics (estimación) Descriptivo Statistics en conjuntos de Big Data (por ejemplo, cálculo de medias)
  • Machine Learning Aprendizaje supervisado frente a aprendizaje no supervisado

      Clasificación y agrupamiento
    Estimación del costo de métodos específicos
  • Filtrado
  • Procesamiento del lenguaje natural Procesamiento de texto
  • Comprender el significado del texto
  • Generación automática de texto
  • Análisis de sentimientos / análisis de temas
  • Computer Vision Adquisición, procesamiento, análisis y comprensión de imágenes
  • Reconstrucción, interpretación y comprensión de escenas 3D
  • Uso de datos de imagen para tomar decisiones
  • Big Data Infraestructura
  • Almacenamiento de datos Bases de datos relacionales (SQL) MiSQL Postgres Oráculo
  • Bases de datos no relacionales (NoSQL) Casandra
  • MongoDB
  • Neo4js
  • Entendiendo los matices Bases de datos jerárquicas

      Bases de datos orientadas a objetos
    Bases de datos orientadas a documentos
  • Bases de datos orientadas a grafos
  • Otro
  • Procesamiento distribuido Hadoop HDFS como sistema de archivos distribuido
  • MapReduce para el procesamiento distribuido
  • Chispa Marco de computación en clúster en memoria todo en uno para el procesamiento de datos a gran escala
  • Transmisión estructurada
  • Chispa SQL
  • Machine Learning bibliotecas: MLlib
  • Procesamiento de grafos con GraphX
  • ScalaCapacidad Nube pública AWS, Google, Aliyun, etc. Nube privada OpenStack, Cloud Foundry, etc.
  • Escalabilidad automática
  • Elegir la solución adecuada para el problema
  • El futuro de Big Data
  • Resumen y conclusión
  • Requerimientos

    • Una comprensión general de las matemáticas.
    • Una comprensión general de la programación.
    • Conocimientos generales de bases de datos.

    Audiencia

    • Desarrolladores / programadores
    • Consultores de TI
      35 horas

    Número de participantes



    Precio por participante

    Testimonios (2)

    Cursos Relacionados

    Categorías Relacionadas