Métodos estadísticos para ciencia de datos
Clave: 22A8015
No. de horas: 72
Créditos: 5
Tipo de asignatura: Optativa
Fecha de elaboración: 2022-06-28
Objetivo general:
Que la o el estudiante obtenga conocimientos teóricos y experiencias con métodos estadísticos utilizados en el campo de la ciencia de datos, para que sea capaz de describir, visualizar, hacer inferencias y regresión con datos cuantitativos y categóricos. Además, la o el estudiante aprenderá a realizar el análisis utilizando los lenguajes R o Python. Finalmente, se espera que la o el estudiante pueda plantear y desarrollar proyectos para aplicaciones en ciencia de datos.
Temas:
1.Introducción a la ciencia de datos(4 horas)
1.1.Definiciones
1.2.Obtención y manejo de datos
1.3.Análisis exploratorio
1.4.Comunicación de resultados
2.Muestreo y diseño experimental(2 horas)
2.1.Conceptos básicos
2.2.Tipos de estudios estadísticos
2.3.Métodos de muestreo
3.Estadística descriptiva(6 horas)
3.1.Tipos de datos
3.2.Medidas de tendencia central
3.3.Medidas de variabilidad.
3.4.Covarianza
3.5.Correlación
3.6.Visualización de datos
4.Distribuciones de probabilidad(10 horas)
4.1.Conceptos de probabilidad
4.2.Distribución normal
4.3.Distribución binomial
4.4.Otras distribuciones
5.Distribuciones de muestreo(2 horas)
5.1.Distribución t
5.2.Distribución
F6.Estadística inferencial (20 horas)
6.1.Teorema del límite central
6.2.Error estándar
6.3.Intervalos de confianza
6.4.Pruebas de hipótesis
6.5.Significancia estadística
6.6.Errores de decisión
7.Anova y Boostraping(6 horas)
7.1.Anova
7.2.Bootstraping
8.Análisis de datos categóricos(6 horas)
8.1.Conceptos
8.2.Intervalos de confianza para proporciones
8.3.Pruebas de hipótesis para proporciones
8.4.Prueba Chi cuadrada
8.5.Prueba de bondad de ajuste
8.6.Tablas de contingencia
9.Estadística no paramétrica(8 horas)
9.1.Introducción a las pruebas no paramétricas
9.2.Prueba de Wilcoxon
9.3.Prueba de Mann-Whitney
9.4.Prueba de Kruskal-Wallis
10.Regresión lineal(8 horas)
10.1.Relación entre variables
10.2.Residuos
10.3.Modelo de regresión lineal simple
10.4.Predicción
10.5.R cuadrada
10.6.Inferencia en regresión lineal
10.7.Regresión con variables categóricas explanatorias
10.8.Modelo de regresión lineal múltiple
Bibliografía:
Bruce, A. Bruce y P. Gedeck. (2020). Practical statatistics for data scientists: 50+ essential concepts using R and Python. 2ndEdition, O’Reilly.5.L. Igual y S. Segui. (2017). Introduction to data science: a Python approach to concepts, techniques and applications. Springer.6.M. Bonamente. (2017). Statistics and analysis of scientific data. 2ndEdition. Springer graduate text in physics