Cómo calcular SST, SSR y SSE en Excel

A menudo usamos tres valores de suma de cuadrados diferentes para medir qué tan bien una línea de regresión realmente se ajusta a un conjunto de datos: 1. Suma de cuadrados totales (SST): la suma de las diferencias cuadradas entre los puntos de datos individuales (y i ) y la media de la variable de … Leer completo

Cómo agregar una matriz Numpy a un DataFrame de Pandas

Ocasionalmente, es posible que desee agregar una matriz NumPy como una nueva columna a un DataFrame de pandas. Afortunadamente, puede hacer esto fácilmente usando la siguiente sintaxis: df [‘ nueva_columna ‘] = nombre_matriz. tolist () Este tutorial muestra un par de ejemplos de cómo utilizar esta sintaxis en la práctica. Ejemplo 1: Agregar matriz NumPy … Leer completo

Cómo calcular la correlación parcial en R

En estadística, a menudo usamos el coeficiente de correlación de Pearson para medir la relación lineal entre dos variables. Sin embargo, a veces nos interesa comprender la relación entre dos variables mientras controlamos por una tercera variable . Por ejemplo, supongamos que queremos medir la asociación entre el número de horas que estudia un estudiante … Leer completo

Cómo encontrar valores únicos en varias columnas en Pandas

A menudo, puede estar interesado en encontrar todos los valores únicos en varias columnas en un DataFrame de pandas. Afortunadamente, esto es fácil de hacer usando la función pandas unique () combinada con la función ravel () : unique () : devuelve valores únicos en orden de aparición. ravel (): devuelve una serie de datos … Leer completo

La distribución uniforme en R

Una distribución uniforme es una distribución de probabilidad en la que es igualmente probable que se elija cada valor entre un intervalo de a a b . La probabilidad de que obtengamos un valor entre x 1 y x 2 en un intervalo de a a b se puede encontrar usando la fórmula: P (obtener … Leer completo

Coeficiente Phi: definición y ejemplos

Un coeficiente Phi (a veces llamado coeficiente de contingencia cuadrático medio ) es una medida de la asociación entre dos variables binarias. Para un determinado tabla 2 × 2 para dos variables aleatorias x y y : El coeficiente Phi se puede calcular como: Φ = (AD-BC) / √ (A + B) (C + D) … Leer completo

Prueba exacta de Fisher: definición, fórmula y ejemplo

La prueba exacta de Fisher se utiliza para determinar si existe o no una asociación significativa entre dos variables categóricas. Por lo general, se usa como una alternativa a la prueba de independencia de chi-cuadrado cuando uno o más de los recuentos de celdas en una tabla de 2 × 2 es menor que 5. … Leer completo

¿Qué es el Eta parcial al cuadrado? (Definición y ejemplo)

El eta cuadrado parcial es una forma de medir el tamaño del efecto de diferentes variables en modelos ANOVA. Mide la proporción de varianza explicada por una variable dada de la varianza total restante después de tener en cuenta la varianza explicada por otras variables en el modelo. Cómo calcular Eta parcial al cuadrado La … Leer completo

¿Cómo sumar columnas específicas en R (con ejemplos)?

A menudo, es posible que desee encontrar la suma de un conjunto específico de columnas en un marco de datos en R. Afortunadamente, para sumar columnas especificas en R, debemos usar rowSums () . Este tutorial muestra varios ejemplos de cómo utilizar esta función en la práctica. Hallar la suma de columnas específicas El siguiente … Leer completo

Cómo realizar una prueba t de muestras emparejadas en R

Una prueba t de muestras pareadas es una prueba estadística que compara las medias de dos muestras cuando cada observación en una muestra se puede emparejar con una observación en la otra muestra. Por ejemplo, supongamos que queremos saber si un determinado programa de estudios tiene un impacto significativo en el rendimiento de los estudiantes … Leer completo