OBJETIVO GENERAL
Proporcionar a los participantes los conocimientos esenciales sobre la ciencia de datos, comprendiendo su ciclo de vida, las técnicas fundamentales de análisis, las herramientas más utilizadas y su aplicación práctica para la extracción de conocimiento y la toma de decisiones basada en datos en contextos organizacionales.
RESULTADOS ESPERADOS
Al finalizar el curso, los participantes estarán en capacidad de:
Comprender los conceptos fundamentales de la ciencia de datos, su importancia en la sociedad actual y el rol del científico de datos en las organizaciones .
Identificar y aplicar técnicas de preprocesamiento, limpieza y transformación de datos para garantizar la calidad de la información base del análisis .
Realizar análisis exploratorio de datos utilizando técnicas de visualización que permitan descubrir patrones, tendencias y relaciones significativas .
Diferenciar entre modelos de aprendizaje supervisado y no supervisado, conociendo los algoritmos fundamentales y sus aplicaciones prácticas .
Aplicar los fundamentos aprendidos para estructurar un proyecto básico de ciencia de datos siguiendo metodologías estandarizadas como CRISP-DM .
MÓDULO 1: INTRODUCCIÓN A LA CIENCIA DE DATOS Y SU CICLO DE VIDA
1.1 ¿Qué es la Ciencia de Datos? Importancia en la sociedad actual
1.2 El perfil del científico de datos y roles en un equipo de datos
1.3 Metodologías para proyectos de datos: CRISP-DM
1.4 Tipos de datos y fuentes de información
1.5 Ética, privacidad y gobierno del dato
MÓDULO 2: PREPARACIÓN, EXPLORACIÓN Y VISUALIZACIÓN DE DATOS
2.1 Introducción a Python para ciencia de datos
2.2 Importación, limpieza y transformación de datos
2.3 Análisis exploratorio de datos (EDA)
2.4 Técnicas de visualización de datos
2.5 Reducción de dimensionalidad y selección de características
MÓDULO 3: FUNDAMENTOS DE MODELADO Y APRENDIZAJE AUTOMÁTICO
3.1 Aprendizaje supervisado vs. no supervisado
3.2 Modelos de clasificación: kNN, árboles de decisión y Naive Bayes
3.3 Modelos de regresión: regresión lineal y sus extensiones
3.4 Modelos de agrupamiento (clustering): k-means y jerárquico
3.5 Evaluación de modelos y validación cruzada
MÓDULO 4: APLICACIONES AVANZADAS Y PROYECTO FINAL
4.1 Introducción a redes neuronales y deep learning
4.2 Ensambles de modelos: Random Forest y Gradient Boosting
4.3 Procesamiento del lenguaje natural (NLP) básico
4.4 Ética aplicada: sesgos, explicabilidad y transparencia
4.5 Proyecto final: aplicación práctica de un ciclo completo de ciencia de datos