Cómo calcular las puntuaciones Z en R

En estadística, una puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor de la media. Usamos la siguiente fórmula para calcular una puntuación z:

z = (X – μ) / σ

dónde:

  • X es un único valor de datos sin procesar
  • μ es la media de la población
  • σ es la desviación estándar de la población

Este tutorial explica cómo calcular las puntuaciones z para los valores de datos sin procesar en R.

Ejemplo 1: encontrar puntuaciones Z para un solo vector

El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en un vector:

#create vector de datos
datos <- c (6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score para cada valor de datos 
z_scores <- (media de datos (datos)) / sd (datos)

#muestra las puntuaciones z 
z_scores

[1] -1,3228757 -1,1338934 -1,1338934 -0,1889822 0,0000000 0,0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

Cada puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor individual de la media. Por ejemplo:

  • El primer valor de datos brutos de «6» es 1.323 desviaciones estándar por debajo de la media.
  • El quinto valor de datos brutos de «13» es 0 desviaciones estándar de la media, es decir, es igual a la media.
  • El último valor de datos brutos de «22» es 1.701 desviaciones estándar por encima de la media.

Ejemplo 2: encontrar puntuaciones Z para una sola columna en un marco de datos

El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en una sola columna de un marco de datos:

#create dataframe
df <- data.frame (asiste = c (4, 4, 6, 7, 9, 13),
                 puntos = c (24, 29, 13, 15, 19, 22),
                 rebotes = c (5, 5, 7, 8, 14, 15))

#Busque el puntaje z para cada valor de datos en la columna 'puntos'
 z_scores <- (df $ points-mean (df $ points)) / sd (df $ points)

#muestra las puntuaciones z 
z_scores

[1] 0,6191904 1,4635409 -1,2383807 -0,9006405 -0,2251601 0,2814502

Cada puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor individual de la media. Por ejemplo:

  • El primer valor de datos brutos de «24» es 0,619 desviaciones estándar por encima de la media.
  • El segundo valor de datos brutos de «29» es 1.464 desviaciones estándar por encima de la media.
  • El tercer valor de datos brutos de «13» es 1,238 desviaciones estándar por debajo de la media.

Y así.

Ejemplo 3: Encuentre puntuaciones Z para cada columna en un marco de datos

El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en cada columna de un marco de datos usando la función sapply () .

#create dataframe
df <- data.frame (asiste = c (4, 4, 6, 7, 9, 13),
                 puntos = c (24, 29, 13, 15, 19, 22),
                 rebotes = c (5, 5, 7, 8, 14, 15))

# encontrar puntuaciones z de cada columna
sapply (df, función (df) (df-mean (df)) / sd (df))

         ayuda puntos rebotes
[1,] -0,92315712 0,6191904 -0,9035079
[2,] -0,92315712 1,4635409 -0,9035079
[3,] -0,34011052 -1,2383807 -0,4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

Las puntuaciones z para cada valor individual se muestran en relación con la columna en la que se encuentran. Por ejemplo:

  • El primer valor de «4» en la primera columna es 0,923 desviaciones estándar por debajo del valor medio de su columna.
  • El primer valor de «24» en la segunda columna es .619 desviaciones estándar por encima del valor medio de su columna.
  • El primer valor de «9» en la tercera columna es .904 desviaciones estándar por debajo del valor medio de su columna.

Y así.

Puede encontrar más tutoriales de R aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

A menudo, es posible que desee recorrer los nombres de columna de un marco de datos en R y realizar…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!