Contrastes de hipótesis más usuales con R
Contrastes de hipótesis más usuales con R
Y porque la carabela Pinta era más velera e iba delante del Almirante, halló tierra e hizo las señales que el Almirante había mandado. Esta tierra vido primero un marinero que se decía Rodrigo de Triana; puesto que el Almirante, a las diez de la noche, estando en el castillo de popa, vido lumbre, aunque fue cosa tan cerrada que no quiso afirmar que fuese tierra; pero llamó a Pedro Gutiérrez, repostero de estrados del Rey, y dijo que parecía lumbre que mirase él, y así lo hizo y vídola. – Cristobal Colón.
Fundamento de los principales tests
Joaquín Amat Rodrigo detalla de forma muy didáctica los principales tests de R:
- Análisis de Normalidad: gráficos y contrastes de hipótesis.
- Análisis de la homogeneidad de varianza (homocedasticidad).
- T-test: Comparación de medias poblacionales independientes.
- Test para proporciones.
- ANOVA análisis de varianza para comparar múltiples medias.
- Test de Wilcoxon-Mann-Whitney como alternativa al t-test.
- Test de los rangos de Wilcoxon.
- Kruskal-Wallis test.
- Test de Friedman como alternativa al ANOVA.
- Inferencia para variables categóricas dicotómicas (proporciones): Intervalos de confianza y test de hipótesis.
- Test estadísticos para variables cualitativas: test binomial exacto, test multinomial y test chi-cuadrado goodnes of fit.
- Comparación de distribuciones: test Kolmogorov–Smirnov.
- Ajuste de distribuciones con R.
- Tests de muestreos.
Animamos al lector a revisar estos tests.
Listado
Los profesores de la Universidad de Granada David Molina Muñoz y Ana María Lara Porras han publicado un repertorio de tests estadísticos mediante R. El guión de esta práctica revisa los siguientes conceptos:
- Objetivos. Conceptos básicos.
- Paramétricos.
- Media de una población normal. Varianza conocida. Varianza desconocida.
- Parámetro p Binomial.
- Diferencias de medias de dos poblaciones independientes.
- Diferencia de medias de dos poblaciones relacionadas.
- Diferencia de proporciones.
- Chi-cuadrado.
- Independencia de una variable cualitativa.
- Independencia de dos variables cualitativas
- Otros contrastes no paramétricos.
- Prueba binomial.
- Test de Rachas.
- Bondad de ajuste: Kolmogorov-Smirnov.
- Dos muestras independientes.
- Dos muestras relacionadas.
A continuación aparece la base de datos que emplean.
datos <- structure(list(Flexiones = c(60L, 41L, 53L, 53L, 41L, 56L, 50L, 53L, 50L, 48L, 50L, 48L, 56L, 52L, 54L, 50L, 50L, 54L, 52L, 48L, 48L, 35L, 50L, 41L, 56L, 52L, 56L, 54L, 53L, 53L, 53L, 41L, 48L, 50L, 50L, 52L, 53L, 35L, 35L, 54L, 46L, 48L, 50L, 48L, 41L, 48L, 60L, 53L, 54L, 56L, 50L, 41L, 60L, 60L, 54L, 54L, 53L, 35L, 54L, 48L, 50L, 54L, 54L, 53L, 52L, 50L, 52L, 48L, 46L, 53L, 50L, 35L, 50L, 60L, 50L), Sexo = c("H", "H", "M", "M", "H", "H", "H", "M", "M", "M", "M", "M", "H", "M", "M", "H", "H", "H", "H", "H", "H", "M", "M", "M", "M", "M", "M", "H", "H", "M", "H", "M", "M", "H", "M", "H", "M", "H", "H", "M", "M", "H", "M", "H", "M", "M", "H", "M", "M", "H", "H", "H", "M", "M", "H", "H", "H", "M", "H", "M", "H", "H", "H", "H", "H", "H", "H", "H", "H", "H", "H", "H", "H", "M", "H"), Deporte = c(0L, 0L, 1L, 0L, 0L, 0L, 0L, 1L, 1L, 0L, 1L, 1L, 0L, 1L, 0L, 1L, 0L, 0L, 1L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 0L, 1L, 0L, 0L, 0L, 1L, 0L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 1L, 1L, 0L, 1L, 1L, 1L, 0L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 0L, 0L, 0L, 1L, 1L, 0L)), row.names = c(NA, -75L), class = "data.frame")
Con dicha base de datos, podemos proceder a realizar algunos tests (¡verifique primero si tiene sentido hacerlos!).
cat("Revisando la normalidad de cada sexo.\n") by(datos$Flexiones,datos$Sexo,shapiro.test) cat("Homocedasticidad bajo condiciones de normalidad.\n") var.test(datos$Flexiones~datos$Sexo, alternative = "two.sided") cat("Igualdad de medias bajo condiciones de normalidad.\n") t.test(datos$Flexiones~datos$Sexo, alternative = "two.sided", mu = 0, var.equal = TRUE) cat("Igualdad de medianas.\n") wilcox.test(datos$Flexiones~datos$Sexo, alternative = "two.sided")
Revisando la normalidad de cada sexo. datos$Sexo: H Shapiro-Wilk normality test data: dd[x, ] W = 0.87129, p-value = 0.0001879 ------------------------------------------------------------ datos$Sexo: M Shapiro-Wilk normality test data: dd[x, ] W = 0.91735, p-value = 0.01763 Homocedasticidad bajo condiciones de normalidad. F test to compare two variances data: datos$Flexiones by datos$Sexo F = 0.87506, num df = 42, denom df = 31, p-value = 0.679 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.4415454 1.6765483 sample estimates: ratio of variances 0.8750585 Igualdad de medias bajo condiciones de normalidad. Two Sample t-test data: datos$Flexiones by datos$Sexo t = -0.06154, df = 73, p-value = 0.9511 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.887271 2.714306 sample estimates: mean in group H mean in group M 50.06977 50.15625 Igualdad de medianas. Wilcoxon rank sum test with continuity correction data: datos$Flexiones by datos$Sexo W = 693, p-value = 0.9612 alternative hypothesis: true location shift is not equal to 0 Warning message: In wilcox.test.default(x = c(60L, 41L, 41L, 56L, 50L, 56L, 50L, : cannot compute exact p-value with ties
Remitimos al lector interesado a replicar los ejemplos que presentan, verificando su pertinencia teniendo en cuenta las indicaciones de Joaquín Amat Rodrigo.
Referencias
Una introducción a los contrastes de hipótesis
Esta entrada forma parte de un serie de artículos introductorios sobre contrastes de hipótesis: