Cambio de datos

Actualizado por ultima vez el 18 de septiembre de 2021, por Luis Benites.

Cambiar datos es agregar una constante k a cada miembro de un conjunto de datos, donde k es un número real . En términos visuales, está levantando toda la distribución de puntos de datos y cambiando en masa una distancia de k.

Cambio de datos y la media y la mediana

Cuando los datos se desplazan, la media (μ) y la mediana se desplazan por la constante k.

Es decir, cuando cambia un conjunto de datos por k, de modo que f(x)= x+k para cada x en su conjunto de datos,

  • f(μ)= μ + k
  • f(media)= media + k

Tenga en cuenta que k puede ser positivo o negativo.

Medidas de propagación y posición relativa

Su desviación estándar , varianza , puntajes z y valores de percentiles permanecen sin cambios cuando se cambia su conjunto de datos. Dado que cada punto en su conjunto de datos se mueve exactamente la misma distancia, no hay cambios en sus relaciones entre sí.

Un ejemplo de cambio de datos

Suponga que está ejecutando un proyecto de investigación sobre los artículos que las personas empacan en el buzón de correo prioritario USPS #4. Recopila sus datos y hace su análisis, y luego se da cuenta de que, aunque ha trabajado con los pesos netos, solo el contenido de las cajas es importante para su investigación. Suponga que sus medidas están en onzas. Como cada caja pesa 5 onzas, k= -5.

  • Si su media era 41 antes del cambio, ahora es 36.
  • Si su mediana era 28, ahora es 23.
  • Si tu desviación estándar era 16, sigue siendo 16.
  • Su varianza permanecerá igual, al igual que su puntaje z.

Ver también: Desplazamientos horizontales de un gráfico.

Cambio de datos y reescalado

Hay algunos casos en los que es posible que deba realizar un cambio de datos y un cambio de escala; por ejemplo, cuando necesita cambiar las lecturas de temperatura de Fahrenheit a grados Celsius, donde la temperatura en Fahrenheit, F = [(9/5)*C ]+32.

En este caso, primero cambia tus datos por k= -32 y aplica esta constante aditiva a tu media y mediana. La desviación estándar y la varianza permanecerán sin cambios para este paso. Luego vuelva a escalar y multiplique su media y desviación estándar por la constante de cambio de escala 5/9 para encontrar la media y la desviación estándar para su conjunto de datos en Celsius.

Referencias

https://www.cs.princeton.edu/courses/archive/fall08/cos436/Duda/PR_Mahal/scaling.htm
http://www.cs.xu.edu/math/math116/12f04/Ch06.pdf
https: //www.stt.msu.edu/academics/classpages/uploads/SS15/200-4/Chapter6.pdf

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Qué es el rastro de Pillai? La traza de Pillai se utiliza como estadística de prueba en MANOVA y MANCOVA…
statologos comunidad-2

You have Successfully Subscribed!