Cómo realizar una prueba de Chow en R

Actualizado el 17 de julio de 2024, por Luis Benites.

Se usa una prueba de Chow para probar si los coeficientes en dos modelos de regresión diferentes en diferentes conjuntos de datos son iguales.

Esta prueba se usa típicamente en el campo de la econometría con datos de series de tiempo para determinar si existe una ruptura estructural en los datos en algún momento.

Este tutorial proporciona un ejemplo paso a paso de cómo realizar una prueba de Chow en R.

Paso 1: crear los datos

Primero, crearemos algunos datos falsos:

#crear datos
data <- data.frame (x = c (1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 7, 8, 8, 9, 10, 10,
                         11, 12, 12, 13, 14, 15, 15, 16, 17, 18, 18, 19, 20, 20),
                   y = c (3, 5, 6, 10, 13, 15, 17, 14, 20, 23, 25, 27, 30, 30, 31,
                         33, 32, 32, 30, 32, 34, 34, 37, 35, 34, 36, 34, 37, 38, 36))

#ver las primeras seis filas de datos
cabeza (datos)

  xy
1 1 3
2 1 5
3 2 6
4 3 10
5 4 13
6 4 15

Paso 2: Visualice los datos

A continuación, crearemos un diagrama de dispersión simple para visualizar los datos:

#cargar biblioteca de paquetes de visualización
 ggplot2 (ggplot2)

#create scatterplot
 ggplot (datos, aes (x = x, y = y)) +
    geom_point (col = ' azul acero ', tamaño = 3 )

Prueba de comida en R

En la gráfica de dispersión podemos ver que el patrón en los datos parece cambiar en x = 10. Por lo tanto, podemos realizar la prueba de Chow para determinar si hay un punto de ruptura estructural en los datos en x = 10.

Paso 3: Realice la prueba de Chow

Podemos utilizar el sctest función de la strucchange paquete para realizar una prueba de Chow:

#cargar biblioteca de paquetes de
 strucchange (strucchange)

# realizar prueba de Chow 
sctest (datos $ y ~ datos $ x, tipo = " Chow ", punto = 10 )

	Prueba de comida

datos: datos $ y ~ datos $ x
F = 110.14, valor p = 2.023e-13

Desde el resultado de la prueba podemos ver:

  • Estadística de la prueba F : 110,14
  • valor p: <.0000

Dado que el valor p es menor que .05, podemos rechazar la hipótesis nula de la prueba. Esto significa que tenemos suficiente evidencia para decir que existe un punto de ruptura estructural en los datos.

En otras palabras, dos líneas de regresión pueden ajustarse al patrón en los datos de manera más efectiva que una sola línea de regresión.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Este tutorial proporciona un ejemplo de cómo etiquetar los puntos en un diagrama de dispersión tanto en base R como…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!