Cómo normalizar datos en hojas de Google

Para normalizar un conjunto de valores de datos medios para escalar los valores tales que la media de todos los valores es 0 y la desviación estándar es de 1.

Este tutorial explica cómo normalizar datos en Google Sheets.

Ejemplo: cómo normalizar datos en hojas de Google

Supongamos que tenemos el siguiente conjunto de datos en Google Sheets:

Utilice los siguientes pasos para normalizar este conjunto de valores de datos.

Paso 1: calcula la media.

Primero, usaremos la función = PROMEDIO (rango de valores) para encontrar la media del conjunto de datos.

Paso 2: Encuentra la desviación estándar.

A continuación, usaremos la función = DESVEST (rango de valores) para encontrar la desviación estándar del conjunto de datos.

Paso 3: normaliza los valores.

Por último, usaremos la función STANDARDIZE (x, mean, standard_dev) para normalizar cada uno de los valores en el conjunto de datos.

NOTA:

La función ESTANDARIZAR utiliza la siguiente fórmula para normalizar un valor de datos dado:

Valor normalizado = (x – x ) / s

dónde:

  • x = valor de los datos
  • x = media del conjunto de datos
  • s = desviación estándar del conjunto de datos

La siguiente imagen muestra la fórmula utilizada para normalizar el primer valor en el conjunto de datos:

Datos normalizados en Hojas de cálculo de Google

Una vez que normalizamos el primer valor en la celda B2, podemos pasar el mouse sobre la esquina inferior derecha de la celda B2 hasta que aparezca un pequeño + . Haga doble clic en + para copiar la fórmula a las celdas restantes:

Conjunto de datos normalizado en Google Sheets

Ahora todos los valores del conjunto de datos están normalizados.

Cómo interpretar datos normalizados

La fórmula que usamos para normalizar un valor de datos dado, x, fue la siguiente:

Valor normalizado = (x – x ) / s

dónde:

  • x = valor de los datos
  • x = media del conjunto de datos
  • s = desviación estándar del conjunto de datos

Si un punto de datos en particular tiene un valor normalizado mayor que 0, significa que el punto de datos es mayor que la media. Por el contrario, un valor normalizado menor que 0 es una indicación de que el punto de datos es menor que la media.

En particular, el valor normalizado nos dice cuántas desviaciones estándar tiene el punto de datos original de la media. Por ejemplo, considere el punto de datos «12» en nuestro conjunto de datos original:

Conjunto de datos normalizado en Google Sheets

El valor normalizado para «12» resultó ser -1.288, que se calculó como:

Valor normalizado = (x – x ) / s = (12 – 22,267) / 7,968 = -1,288

Esto nos dice que el valor «12» es 1.288 desviaciones estándar por debajo de la media en el conjunto de datos original.

Cada uno de los valores normalizados en el conjunto de datos puede ayudarnos a comprender qué tan cerca o lejos está de la media un valor de datos en particular. Un valor normalizado pequeño indica que un valor está cerca de la media, mientras que un valor normalizado grande indica que un valor está lejos de la media.

Recursos adicionales

Cómo normalizar datos en Excel
Cómo normalizar datos en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Directo & CEO de Statologos LSI

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

Deja un comentario

La forma más fácil de ordenar un marco de datos por una columna en R es usar la función order…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!