Actualizado por ultima vez el 5 de octubre de 2021, por Luis Benites.
¿Qué es una transformación de Box Cox?
Una transformación de Box Cox es una transformación de variables dependientes no normales en una forma normal . La normalidad es una suposición importante para muchas técnicas estadísticas; si sus datos no son normales, aplicar un Box-Cox significa que puede ejecutar una mayor cantidad de pruebas.
La transformación de Box Cox lleva el nombre de los estadísticos George Box y Sir David Roxbee Cox, quienes colaboraron en un artículo de 1964 y desarrollaron la técnica.
Mire el video para obtener una breve descripción general de Box Cox:
Introducción a la transformación de Box Cox Mira este video en YouTube .
¿No puedes ver el vídeo? Haga clic aquí
Ejecución de la prueba
En el centro de la transformación de Box Cox hay un exponente, lambda (λ), que varía de -5 a 5. Se consideran todos los valores de λ y se selecciona el valor óptimo para sus datos; El “valor óptimo” es aquel que da como resultado la mejor aproximación a una curva de distribución normal . La transformación de Y tiene la forma: Esta prueba solo funciona para datos positivos. Sin embargo, Box y Cox propusieron una segunda fórmula que se puede usar para valores de y negativos:
Las fórmulas son engañosamente simples. Probar todos los valores posibles a mano es innecesariamente laborioso; la mayoría de los paquetes de software incluirán una opción para una transformación de Box Cox, que incluye:
- R : usa el comando boxcox(objeto, …).
- Minitab : haga clic en el cuadro Opciones (por ejemplo, mientras ajusta un modelo de regresión ) y luego haga clic en Transformaciones de Box-Cox/λ óptimo.
Transformaciones comunes de Box-Cox | |
Valor lambda (λ) | Datos transformados (Y’) |
-3 | Y -3 = 1/Y 3 |
-2 | Y -2 = 1/Y 2 |
-1 | Y -1 = 1/Y 1 |
-0.5 | Y -0.5 = 1/(√(Y)) |
0 | pesado)** |
0.5 | Y 0.5 = √(Y) |
1 | Y 1 = Y |
2 | año 2 |
3 | año 3 |
**Nota: la transformación de cero es log(0); de lo contrario, todos los datos se transformarían en Y 0 = 1.
La transformación no siempre funciona bien, así que asegúrese de verificar sus datos después de la transformación con una gráfica de probabilidad normal .
Referencias
Box, GEP y Cox, DR (1964). Un análisis de las transformaciones, Journal of the Royal Statistical Society, Serie B, 26, 211-252. Disponible en línea aquí .
Agresti A. (1990) Análisis de datos categóricos. John Wiley and Sons, Nueva York.
Klein, G. (2013). La caricatura Introducción a la estadística. Colina y Wamg.
Levine, D. (2014). Incluso usted puede aprender estadísticas y análisis: una guía fácil de entender sobre estadísticas y análisis, 3.ª edición. Prensa Pearson FT