Cómo eliminar valores atípicos en diagramas de caja en R

Ocasionalmente, es posible que desee eliminar valores atípicos de los diagramas de caja en R. Este tutorial explica cómo hacerlo usando tanto la base R como ggplot2 .

Eliminar valores atípicos en diagramas de caja en Base R

Supongamos que tenemos el siguiente conjunto de datos:

datos <- c (5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

El siguiente código muestra cómo crear un diagrama de caja para este conjunto de datos en la base R:

diagrama de caja (datos)

Para eliminar los valores atípicos, puede utilizar el argumento esquema = FALSO :

diagrama de caja (datos, contorno = FALSO )

Diagrama de caja con valor atípico eliminado en R

Eliminar valores atípicos en diagramas de caja en ggplot2

Supongamos que tenemos el siguiente conjunto de datos:

data <- data.frame (y = c (5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

El siguiente código muestra cómo crear un diagrama de caja usando la biblioteca de visualización ggplot2:

biblioteca (ggplot2)

ggplot (datos, aes (y = y)) +
  geom_boxplot ()

Para eliminar los valores atípicos, puede utilizar el argumento outlier.shape = NA :

ggplot (datos, aes (y = y)) +
   geom_boxplot (outlier.shape = NA )

ggplot2 diagrama de caja con valores atípicos eliminados

Tenga en cuenta que ggplot2 no ajusta automáticamente el eje y. Para ajustar el eje, puede usar coord_cartesian :

ggplot (datos, aes (y = y)) +
   geom_boxplot (outlier.shape = NA ) +
   coord_cartesian (ylim = c (5, 30))

diagrama de caja ggplot2 sin valores atípicos

Recursos adicionales

Cómo establecer límites de eje en ggplot2
Cómo crear gráficos lado a lado en ggplot2
Una guía completa de los mejores temas de ggplot2

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

La distancia de Hamming entre dos vectores es simplemente la suma de los elementos correspondientes que difieren entre los vectores.…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!