Cómo calcular la similitud del coseno en R

La similitud de coseno es una medida de la similitud entre dos vectores de un espacio de producto interno.

Para dos vectores, A y B, la similitud del coseno se calcula como:

Similitud de coseno = ΣA i B i / (√ΣA i 2 √ΣB i 2 )

Este tutorial explica cómo calcular la similitud de coseno entre vectores en R usando la función coseno () de la biblioteca lsa .

Similitud de coseno entre dos vectores en R

El siguiente código muestra cómo calcular la similitud de coseno entre dos vectores en R:

biblioteca (lsa)

 #define vectores
a <- c (23, 34, 44, 45, 42, 27, 33, 34)
b <- c (17, 18, 22, 26, 26, 29, 31, 30)

#calcular coseno similitud
 coseno (a, b)

         [, 1]
[1,] 0,965195

La similitud de coseno entre los dos vectores resulta ser 0,965195 .

Similitud de coseno de una matriz en R

El siguiente código muestra cómo calcular la similitud de coseno entre una matriz de vectores:

biblioteca (lsa)

 #define matrix
a <- c (23, 34, 44, 45, 42, 27, 33, 34)
b <- c (17, 18, 22, 26, 26, 29, 31, 30)
c <- c (34, 35, 35, 36, 51, 29, 30, 31)

datos <- cbind (a, b, c)

#calculate Coseno Coseno de similitud
 (datos)

          a B C
a 1.0000000 0.9651950 0.9812406
b 0,9651950 1,0000000 0,9573478
c 0,9812406 0,9573478 1,000000000

A continuación se explica cómo interpretar la salida:

  • El coseno Similitud entre los vectores un y b es 0,9651950 .
  • El coseno Similitud entre los vectores un y c es 0,9812406 .
  • El coseno Similitud entre los vectores b y c es 0,9573478 .

Notas

1. La función coseno () funcionará con una matriz cuadrada de cualquier tamaño.

2. La función coseno () funcionará en una matriz, pero no en un marco de datos. Sin embargo, puede convertir fácilmente un marco de datos en una matriz en R utilizando la función as.matrix () .

3. Consulte esta página de Wikipedia para obtener más detalles sobre la similitud de coseno.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Este tutorial explica cómo calcular el rango intercuartil de un conjunto de datos en Excel. ¿Qué es el rango intercuartil?…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!