Transformación de Box Cox: definición, ejemplos

Actualizado por ultima vez el 5 de octubre de 2021, por Luis Benites.

¿Qué es una transformación de Box Cox?

Una transformación de Box Cox es una transformación de variables dependientes no normales en una forma normal . La normalidad es una suposición importante para muchas técnicas estadísticas; si sus datos no son normales, aplicar un Box-Cox significa que puede ejecutar una mayor cantidad de pruebas.

La transformación de Box Cox lleva el nombre de los estadísticos George Box y Sir David Roxbee Cox, quienes colaboraron en un artículo de 1964 y desarrollaron la técnica.

Mire el video para obtener una breve descripción general de Box Cox:

Introducción a la transformación de Box Cox Mira este video en YouTube .
¿No puedes ver el vídeo? Haga clic aquí

Ejecución de la prueba

En el centro de la transformación de Box Cox hay un exponente, lambda (λ), que varía de -5 a 5. Se consideran todos los valores de λ y se selecciona el valor óptimo para sus datos; El “valor óptimo” es aquel que da como resultado la mejor aproximación a una curva de distribución normal . La transformación de Y tiene la forma: Esta prueba solo funciona para datos positivos. Sin embargo, Box y Cox propusieron una segunda fórmula que se puede usar para valores de y negativos:
box cox fórmula 1

boxcox formula2

Las fórmulas son engañosamente simples. Probar todos los valores posibles a mano es innecesariamente laborioso; la mayoría de los paquetes de software incluirán una opción para una transformación de Box Cox, que incluye:

  • R : usa el comando boxcox(objeto, …).
  • Minitab : haga clic en el cuadro Opciones (por ejemplo, mientras ajusta un modelo de regresión ) y luego haga clic en Transformaciones de Box-Cox/λ óptimo.
Transformaciones comunes de Box-Cox
Valor lambda (λ) Datos transformados (Y’)
-3 Y -3 = 1/Y 3
-2 Y -2 = 1/Y 2
-1 Y -1 = 1/Y 1
-0.5 Y -0.5 = 1/(√(Y))
0 pesado)**
0.5 Y 0.5 = √(Y)
1 Y 1 = Y
2 año 2
3 año 3

**Nota: la transformación de cero es log(0); de lo contrario, todos los datos se transformarían en Y 0 = 1.
La transformación no siempre funciona bien, así que asegúrese de verificar sus datos después de la transformación con una gráfica de probabilidad normal .

Referencias

Box, GEP y Cox, DR (1964). Un análisis de las transformaciones, Journal of the Royal Statistical Society, Serie B, 26, 211-252. Disponible en línea aquí .
Agresti A. (1990) Análisis de datos categóricos. John Wiley and Sons, Nueva York.
Klein, G. (2013). La caricatura Introducción a la estadística. Colina y Wamg.
Levine, D. (2014). Incluso usted puede aprender estadísticas y análisis: una guía fácil de entender sobre estadísticas y análisis, 3.ª edición. Prensa Pearson FT

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

El ruido estadístico es la irregularidad aleatoria que encontramos en cualquier dato de la vida real. No tienen patrón. Un…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!