Contenido de este artículo
- 0
- 0
- 0
- 0
En estadística, una puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor de la media. Usamos la siguiente fórmula para calcular una puntuación z:
z = (X – μ) / σ
dónde:
- X es un único valor de datos sin procesar
- μ es la media de la población
- σ es la desviación estándar de la población
Este tutorial explica cómo calcular las puntuaciones z para los valores de datos sin procesar en R.
Ejemplo 1: encontrar puntuaciones Z para un solo vector
El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en un vector:
#create vector de datos datos <- c (6, 7, 7, 12, 13, 13, 15, 16, 19, 22) #find z-score para cada valor de datos z_scores <- (media de datos (datos)) / sd (datos) #muestra las puntuaciones z z_scores [1] -1,3228757 -1,1338934 -1,1338934 -0,1889822 0,0000000 0,0000000 [7] 0.3779645 0.5669467 1.1338934 1.7008401
Cada puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor individual de la media. Por ejemplo:
- El primer valor de datos brutos de «6» es 1.323 desviaciones estándar por debajo de la media.
- El quinto valor de datos brutos de «13» es 0 desviaciones estándar de la media, es decir, es igual a la media.
- El último valor de datos brutos de «22» es 1.701 desviaciones estándar por encima de la media.
Ejemplo 2: encontrar puntuaciones Z para una sola columna en un marco de datos
El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en una sola columna de un marco de datos:
#create dataframe df <- data.frame (asiste = c (4, 4, 6, 7, 9, 13), puntos = c (24, 29, 13, 15, 19, 22), rebotes = c (5, 5, 7, 8, 14, 15)) #Busque el puntaje z para cada valor de datos en la columna 'puntos' z_scores <- (df $ points-mean (df $ points)) / sd (df $ points) #muestra las puntuaciones z z_scores [1] 0,6191904 1,4635409 -1,2383807 -0,9006405 -0,2251601 0,2814502
Cada puntuación z nos dice a cuántas desviaciones estándar se encuentra un valor individual de la media. Por ejemplo:
- El primer valor de datos brutos de «24» es 0,619 desviaciones estándar por encima de la media.
- El segundo valor de datos brutos de «29» es 1.464 desviaciones estándar por encima de la media.
- El tercer valor de datos brutos de «13» es 1,238 desviaciones estándar por debajo de la media.
Y así.
Ejemplo 3: Encuentre puntuaciones Z para cada columna en un marco de datos
El siguiente código muestra cómo encontrar la puntuación z para cada valor de datos sin procesar en cada columna de un marco de datos usando la función sapply () .
#create dataframe df <- data.frame (asiste = c (4, 4, 6, 7, 9, 13), puntos = c (24, 29, 13, 15, 19, 22), rebotes = c (5, 5, 7, 8, 14, 15)) # encontrar puntuaciones z de cada columna sapply (df, función (df) (df-mean (df)) / sd (df)) ayuda puntos rebotes [1,] -0,92315712 0,6191904 -0,9035079 [2,] -0,92315712 1,4635409 -0,9035079 [3,] -0,34011052 -1,2383807 -0,4517540 [4,] -0.04858722 -0.9006405 -0.2258770 [5,] 0.53445939 -0.2251601 1.1293849 [6,] 1.70055260 0.2814502 1.3552619
Las puntuaciones z para cada valor individual se muestran en relación con la columna en la que se encuentran. Por ejemplo:
- El primer valor de «4» en la primera columna es 0,923 desviaciones estándar por debajo del valor medio de su columna.
- El primer valor de «24» en la segunda columna es .619 desviaciones estándar por encima del valor medio de su columna.
- El primer valor de «9» en la tercera columna es .904 desviaciones estándar por debajo del valor medio de su columna.
Y así.
Puede encontrar más tutoriales de R aquí .
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/
¿Te hemos ayudado?
Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:La ayuda no cuesta nada
Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo: