Cómo calcular las puntuaciones Z en R

En estadística, una puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor de la media. Usamos la siguiente fórmula para calcular una puntuación z:

z = (X – μ) / σ

dónde:

  • X es un único valor de datos sin procesar
  • μ es la media de la población
  • σ es la desviación estándar de la población

Este tutorial explica cómo calcular las puntuaciones z para los valores de datos sin procesar en R.

Ejemplo 1: encontrar puntuaciones Z para un solo vector

El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en un vector:

#create vector de datos
datos <- c (6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score para cada valor de datos 
z_scores <- (media de datos (datos)) / sd (datos)

#muestra las puntuaciones z 
z_scores

[1] -1,3228757 -1,1338934 -1,1338934 -0,1889822 0,0000000 0,0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

Cada puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor individual de la media. Por ejemplo:

  • El primer valor de datos brutos de «6» es 1.323 desviaciones estándar por debajo de la media.
  • El quinto valor de datos brutos de «13» es 0 desviaciones estándar de la media, es decir, es igual a la media.
  • El último valor de datos brutos de «22» es 1.701 desviaciones estándar por encima de la media.

Ejemplo 2: encontrar puntuaciones Z para una sola columna en un marco de datos

El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en una sola columna de un marco de datos:

#create dataframe
df <- data.frame (asiste = c (4, 4, 6, 7, 9, 13),
                 puntos = c (24, 29, 13, 15, 19, 22),
                 rebotes = c (5, 5, 7, 8, 14, 15))

#Busque el puntaje z para cada valor de datos en la columna 'puntos'
 z_scores <- (df $ points-mean (df $ points)) / sd (df $ points)

#muestra las puntuaciones z 
z_scores

[1] 0,6191904 1,4635409 -1,2383807 -0,9006405 -0,2251601 0,2814502

Cada puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor individual de la media. Por ejemplo:

  • El primer valor de datos brutos de «24» es 0,619 desviaciones estándar por encima de la media.
  • El segundo valor de datos brutos de «29» es 1.464 desviaciones estándar por encima de la media.
  • El tercer valor de datos brutos de «13» es 1,238 desviaciones estándar por debajo de la media.

Y así.

Ejemplo 3: Encuentre puntuaciones Z para cada columna en un marco de datos

El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en cada columna de un marco de datos usando la función sapply () .

#create dataframe
df <- data.frame (asiste = c (4, 4, 6, 7, 9, 13),
                 puntos = c (24, 29, 13, 15, 19, 22),
                 rebotes = c (5, 5, 7, 8, 14, 15))

# encontrar puntuaciones z de cada columna
sapply (df, función (df) (df-mean (df)) / sd (df))

         ayuda puntos rebotes
[1,] -0,92315712 0,6191904 -0,9035079
[2,] -0,92315712 1,4635409 -0,9035079
[3,] -0,34011052 -1,2383807 -0,4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

Las puntuaciones z para cada valor individual se muestran en relación con la columna en la que se encuentran. Por ejemplo:

  • El primer valor de «4» en la primera columna es 0,923 desviaciones estándar por debajo del valor medio de su columna.
  • El primer valor de «24» en la segunda columna es .619 desviaciones estándar por encima del valor medio de su columna.
  • El primer valor de «9» en la tercera columna es .904 desviaciones estándar por debajo del valor medio de su columna.

Y así.

Puede encontrar más tutoriales de R aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

A menudo, es posible que desee recorrer los nombres de columna de un marco de datos en R y realizar…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!