Programa del Curso

Introducción

  • ¿Qué son Large Language Models (LLMs)?
  • LLMs vs modelos tradicionales de PNL
  • Descripción general de las características y la arquitectura de los LLM
  • Desafíos y limitaciones de los LLM

Comprensión de los LLM

  • El ciclo de vida de un LLM
  • Cómo funcionan los LLM
  • Los componentes principales de un LLM: codificador, decodificador, atención, incrustaciones, etc.

Empezar

  • Configuración del entorno de desarrollo
  • Instalar un LLM como herramienta de desarrollo, por ejemplo, Google Colab, Hugging Face

Trabajar con LLM

  • Explorando las opciones de LLM disponibles
  • Creación y uso de un LLM
  • Ajuste de un LLM en un conjunto de datos personalizado

Resumen de texto

  • Comprender la tarea del resumen de textos y sus aplicaciones
  • Uso de un LLM para el resumen de textos extractivos y abstractos
  • Evaluar la calidad de los resúmenes generados utilizando métricas como ROUGE, BLEU, etc.

Respuesta a preguntas

  • Comprender la tarea de responder preguntas y sus aplicaciones
  • Uso de un LLM para responder preguntas de dominio abierto y dominio cerrado
  • Evaluar la precisión de las respuestas generadas utilizando métricas como F1, EM, etc.

Generación de texto

  • Comprender la tarea de la generación de texto y sus aplicaciones
  • Uso de un LLM para la generación de texto condicional e incondicional
  • Controlar el estilo, el tono y el contenido de los textos generados mediante parámetros como temperatura, top-k, top-p, etc.

Integración de LLM con otros marcos y plataformas

  • Uso de LLM con PyTorch o TensorFlow
  • Uso de LLM con Flask o Streamlit
  • Uso de LLM con Google Cloud o AWS

Solución de problemas

  • Comprender los errores y fallos comunes en los LLM
  • Uso de TensorBoard para supervisar y visualizar el proceso de entrenamiento
  • Uso de PyTorch Lightning para simplificar el código de entrenamiento y mejorar el rendimiento
  • Uso de conjuntos de datos de Hugging Face para cargar y preprocesar los datos

Resumen y próximos pasos

Requerimientos

    Comprensión del procesamiento del lenguaje natural y el aprendizaje profundo Experiencia con Python y PyTorch o TensorFlow Experiencia básica en programación

Audiencia

    Desarrolladores Entusiastas de la PNL Científicos de datos
 14 horas

Número de participantes



Precio por participante

Cursos Relacionados

Categorías Relacionadas