Prueba de Kolmogorov-Smirnov en R (con ejemplos)

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

La prueba de Kolmogorov-Smirnov se utiliza para comprobar si una muestra procede o no de una determinada distribución.

Para realizar una prueba de Kolmogorov-Smirnov de una o dos muestras en R, podemos usar la función ks.test () .

Este tutorial muestra un ejemplo de cómo utilizar esta función en la práctica.

Ejemplo 1: Prueba de Kolmogorov-Smirnov de una muestra

Supongamos que tenemos los siguientes datos de muestra:

#Haga que este ejemplo sea reproducible
semilla (0)

#generar un conjunto de datos de 100 valores que siguen una distribución de Poisson con media = 5
 datos <- rpois (n = 20 , lambda = 5 )

Relacionado: Una guía para dpois, ppois, qpois y rpois en R

El siguiente código muestra cómo realizar una prueba de Kolmogorov-Smirnov en esta muestra de 100 valores de datos para determinar si provienen de una distribución normal:

# realizar la prueba ks.test de Kolmogorov-Smirnov 
(datos, " pnorm ")

	Prueba de Kolmogorov-Smirnov de una muestra

datos: datos
D = 0,97725, valor de p <2,2e-16
hipótesis alternativa: bilateral

De la salida podemos ver que el estadístico de prueba es 0.97725 y el valor p correspondiente es 2.2e-16 . Dado que el valor p es menor que .05, rechazamos la hipótesis nula. Tenemos evidencia suficiente para decir que los datos de la muestra no provienen de una distribución normal.

Este resultado no debería sorprender, ya que generamos los datos de muestra utilizando la función rpois () , que genera valores aleatorios que siguen una distribución de Poisson .

Ejemplo 2: Prueba de Kolmogorov-Smirnov de dos muestras

Supongamos que tenemos los siguientes dos conjuntos de datos de muestra:

#Haga que este ejemplo sea reproducible
semilla (0)

#generar dos conjuntos de datos
 data1 <- rpois (n = 20 , lambda = 5 )
datos2 <- rnorm ( 100 )

El siguiente código muestra cómo realizar una prueba de Kolmogorov-Smirnov en estas dos muestras para determinar si provienen de la misma distribución:

# realizar la prueba de Kolmogorov-Smirnov
ks.test (datos1, datos2)

	Prueba de Kolmogorov-Smirnov de dos muestras

datos: datos1 y datos2
D = 0,99, valor p = 1,299e-14
hipótesis alternativa: bilateral

A partir de la salida, podemos ver que el estadístico de prueba es 0,99 y el valor p correspondiente es 1,299e-14 . Dado que el valor p es menor que .05, rechazamos la hipótesis nula. Tenemos suficiente evidencia para decir que los dos conjuntos de datos de muestra no provienen de la misma distribución.

Este resultado tampoco debería sorprender, ya que generamos valores para la primera muestra usando la distribución de Poisson y valores para la segunda muestra usando la distribución normal .

Recursos adicionales

Cómo realizar una prueba de Shapiro-Wilk en R
Cómo realizar una prueba de Anderson-Darling en R
Cómo realizar pruebas de normalidad multivariante en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Puede usar la siguiente sintaxis para calcular la correlación entre dos columnas en un DataFrame de pandas: df [' columna1…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!