Cómo calcular la varianza muestral y poblacional en R

Contenido de este artículo

0.1 Ejemplo: Calcular la varianza muestral y poblacional en R
0.2 Ejemplo: calcular la varianza de la muestra de varias columnas

1 Redactor del artículo
2 ¿Te hemos ayudado?

Puedes opinar sobre este contenido:

La varianza es una forma de medir qué tan dispersos están los valores de los datos alrededor de la media.

La fórmula para encontrar la varianza de una población es:

σ ² = Σ (x _i – μ) ² / N

donde μ es la media de la población, x _i es el i- ^ésimo elemento de la población, N es el tamaño de la población y Σ es solo un símbolo elegante que significa «suma».

La fórmula para encontrar la varianza de una muestra es:

s ² = Σ (x _yo – x ) ² / (n-1)

donde x es la media de la muestra, x _i es el i- ^ésimo elemento de la muestra y n es el tamaño de la muestra.

Ejemplo: Calcular la varianza muestral y poblacional en R

Supongamos que tenemos el siguiente conjunto de datos en R:

#define dataset
datos <- c (2, 4, 4, 7, 8, 12, 14, 15, 19, 22)

Podemos calcular la varianza de la muestra usando la función var () en R:

#calcular la varianza de la muestra
var (datos)

[1] 46.01111

Y podemos calcular la varianza de la población simplemente multiplicando la varianza de la muestra por (n-1) / n de la siguiente manera:

#determine la longitud de los datos
 n <- longitud (datos)

#calcular la varianza de la población
var (datos) * (n-1) / n

[1] 41,41

Tenga en cuenta que la varianza de la población siempre será menor que la varianza de la muestra.

En la práctica, normalmente calculamos las variaciones de muestra para conjuntos de datos, ya que es inusual recopilar datos para una población completa.

Ejemplo: calcular la varianza de la muestra de varias columnas

Supongamos que tenemos el siguiente marco de datos en R:

#create data frame
 data <- data.frame (a = c (1, 3, 4, 4, 6, 7, 8, 12),
                   b = c (2, 4, 4, 5, 5, 6, 7, 16),
                   c = c (6, 6, 7, 8, 8, 9, 9, 12))

#ver marco de datos
datos

   a B C
1 1 2 6
2 3 4 6
3 4 4 7
4 4 5 8
5 6 5 8
6 7 6 9
7 8 7 9
8 12 16 12

Podemos usar la función sapply () para calcular la varianza muestral de cada columna en el marco de datos:

# encontrar la varianza de muestra de cada columna
 sapply (data, var)

        a B C 
11.696429 18.125000 3.839286

Y podemos usar el siguiente código para calcular la desviación estándar de la muestra de cada columna, que es simplemente la raíz cuadrada de la varianza de la muestra:

# encontrar la desviación estándar de muestra de cada columna
 sapply (datos, sd)

       a B C 
3.420004 4.257347 1.959410

Puede encontrar más tutoriales de R aquí .

https://r-project.org
https://www.python.org/
https://www.stata.com/

Redactor del artículo

Luis Benites
Director de Statologos.com
Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Equipo de Statologos

Luis Benites

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.
Director de Statologos.com
Dereck Amesquita

I am a Bachelor of Science in Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.
Statistics content writer
Cisco Pfoccori

15 años haciendo SEO, monetizando, haciendo nichos y ayudando a empresas a mejoras sus estrategia digital. Pueden contactarme si necesitan mejorar su digitalización, actualmente trabajo para CirculoSEO.
Editor de contenido y SEO

Ejemplo: Calcular la varianza muestral y poblacional en R

Ejemplo: calcular la varianza de la muestra de varias columnas

Redactor del artículo

¿Te hemos ayudado?

Artículos relacionados:

Deja un comentario Cancelar la respuesta

You have Successfully Subscribed!