Temario del curso
Introducción
- Spark NLP vs NLTK vs spaCy
- Descripción general de Spark NLP características y arquitectura
Empezar
- Requisitos de configuración
- Instalación Spark NLP
- Conceptos generales
Uso de canalizaciones previamente entrenadas
- Importación de módulos necesarios
- Anotadores predeterminados
- Carga de un modelo de canalización
- Transformación de textos
Creación de canalizaciones de NLP
- Descripción de la API de canalización
- Implementación de modelos NER
- Elección de incrustaciones
- Uso de incrustaciones de palabras, oraciones y universales
Clasificación e inferencia
- Casos de uso de clasificación de documentos
- Modelos de análisis de sentimiento
- Entrenamiento de un clasificador de documentos
- Uso de otros marcos de aprendizaje automático
- Gestión de modelos de NLP
- Optimización de modelos para inferencias de baja latencia
Solución de problemas
Resumen y próximos pasos
Requerimientos
- Familiaridad con Apache Spark
- Python Experiencia en programación
Audiencia
- Científicos de datos
- Desarrolladores
Testimonios (5)
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
muy interactivo...
Richard Langford
Curso - SMACK Stack for Data Science
Traducción Automática
Suficiente práctica, el instructor es conocedor
Chris Tan
Curso - A Practical Introduction to Stream Processing
Traducción Automática
Aprende sobre el streaming de Spark, Databricks y AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Traducción Automática
tareas de práctica
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática