UP | HOME |

Contrastes de hipótesis más usuales con R

Contrastes de hipótesis más usuales con R

Y porque la carabela Pinta era más velera e iba delante del Almirante, halló tierra e hizo las señales que el Almirante había mandado. Esta tierra vido primero un marinero que se decía Rodrigo de Triana; puesto que el Almirante, a las diez de la noche, estando en el castillo de popa, vido lumbre, aunque fue cosa tan cerrada que no quiso afirmar que fuese tierra; pero llamó a Pedro Gutiérrez, repostero de estrados del Rey, y dijo que parecía lumbre que mirase él, y así lo hizo y vídola. – Cristobal Colón.

Primer homenaje a Colón (12 de octubre de 1492), José Garnelo.

Listado

Los profesores de la Universidad de Granada David Molina Muñoz y Ana María Lara Porras han publicado un repertorio de tests estadísticos mediante R. El guión de esta práctica revisa los siguientes conceptos:

  • Objetivos. Conceptos básicos.
  • Paramétricos.
  • Media de una población normal. Varianza conocida. Varianza desconocida.
  • Parámetro p Binomial.
  • Diferencias de medias de dos poblaciones independientes.
  • Diferencia de medias de dos poblaciones relacionadas.
  • Diferencia de proporciones.
  • Chi-cuadrado.
  • Independencia de una variable cualitativa.
  • Independencia de dos variables cualitativas
  • Otros contrastes no paramétricos.
  • Prueba binomial.
  • Test de Rachas.
  • Bondad de ajuste: Kolmogorov-Smirnov.
  • Dos muestras independientes.
  • Dos muestras relacionadas.

A continuación aparece la base de datos que emplean.

datos <- structure(list(Flexiones = c(60L, 41L, 53L, 53L, 41L, 
56L, 50L, 53L, 50L, 48L, 50L, 48L, 56L, 52L, 54L, 50L, 50L, 54L, 
52L, 48L, 48L, 35L, 50L, 41L, 56L, 52L, 56L, 54L, 53L, 53L, 53L, 
41L, 48L, 50L, 50L, 52L, 53L, 35L, 35L, 54L, 46L, 48L, 50L, 48L, 
41L, 48L, 60L, 53L, 54L, 56L, 50L, 41L, 60L, 60L, 54L, 54L, 53L, 
35L, 54L, 48L, 50L, 54L, 54L, 53L, 52L, 50L, 52L, 48L, 46L, 53L, 
50L, 35L, 50L, 60L, 50L), Sexo = c("H", "H", "M", "M", "H", "H", 
"H", "M", "M", "M", "M", "M", "H", "M", "M", "H", "H", "H", "H", 
"H", "H", "M", "M", "M", "M", "M", "M", "H", "H", "M", "H", "M", 
"M", "H", "M", "H", "M", "H", "H", "M", "M", "H", "M", "H", "M", 
"M", "H", "M", "M", "H", "H", "H", "M", "M", "H", "H", "H", "M", 
"H", "M", "H", "H", "H", "H", "H", "H", "H", "H", "H", "H", "H", 
"H", "H", "M", "H"), Deporte = c(0L, 0L, 1L, 0L, 0L, 0L, 0L, 
1L, 1L, 0L, 1L, 1L, 0L, 1L, 0L, 1L, 0L, 0L, 1L, 0L, 1L, 1L, 1L, 
1L, 1L, 1L, 0L, 1L, 0L, 0L, 0L, 1L, 0L, 1L, 1L, 0L, 0L, 0L, 0L, 
0L, 1L, 0L, 0L, 0L, 0L, 1L, 1L, 0L, 1L, 1L, 1L, 0L, 1L, 1L, 0L, 
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 0L, 0L, 
0L, 1L, 1L, 0L)), row.names = c(NA, -75L), class = "data.frame")

Con dicha base de datos, podemos proceder a realizar algunos tests (¡verifique primero si tiene sentido hacerlos!).

cat("Revisando la normalidad de cada sexo.\n")
by(datos$Flexiones,datos$Sexo,shapiro.test)

cat("Homocedasticidad bajo condiciones de normalidad.\n")
var.test(datos$Flexiones~datos$Sexo, alternative = "two.sided")

cat("Igualdad de medias bajo condiciones de normalidad.\n")
t.test(datos$Flexiones~datos$Sexo, alternative = "two.sided", mu = 0, var.equal = TRUE)

cat("Igualdad de medianas.\n")
wilcox.test(datos$Flexiones~datos$Sexo, alternative = "two.sided")
Revisando la normalidad de cada sexo.
datos$Sexo: H

	Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.87129, p-value = 0.0001879

------------------------------------------------------------ 
datos$Sexo: M

	Shapiro-Wilk normality test

data:  dd[x, ]
W = 0.91735, p-value = 0.01763
Homocedasticidad bajo condiciones de normalidad.

	F test to compare two variances

data:  datos$Flexiones by datos$Sexo
F = 0.87506, num df = 42, denom df = 31, p-value = 0.679
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.4415454 1.6765483
sample estimates:
ratio of variances 
         0.8750585
Igualdad de medias bajo condiciones de normalidad.

	Two Sample t-test

data:  datos$Flexiones by datos$Sexo
t = -0.06154, df = 73, p-value = 0.9511
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.887271  2.714306
sample estimates:
mean in group H mean in group M 
       50.06977        50.15625
Igualdad de medianas.

	Wilcoxon rank sum test with continuity correction

data:  datos$Flexiones by datos$Sexo
W = 693, p-value = 0.9612
alternative hypothesis: true location shift is not equal to 0

Warning message:
In wilcox.test.default(x = c(60L, 41L, 41L, 56L, 50L, 56L, 50L,  :
  cannot compute exact p-value with ties

Remitimos al lector interesado a replicar los ejemplos que presentan, verificando su pertinencia teniendo en cuenta las indicaciones de Joaquín Amat Rodrigo.

Una introducción a los contrastes de hipótesis