Una guía para el procedimiento Benjamini-Hochberg

Puedes opinar sobre este contenido:
  • 0
  • 0
  • 0
  • 0

Actualizado el 17 de julio de 2024, por Luis Benites.

Siempre que realice una prueba estadística, es posible que obtenga un valor p inferior a 0,05 por pura casualidad, incluso si su hipótesis nula es cierta.

Por ejemplo, suponga que desea saber si una determinada planta tiene una altura media superior a 10 pulgadas. Sus hipótesis nulas y alternativas para la prueba serían:

H 0 : μ = 10 pulgadas

H A : μ> 10 pulgadas

Para probar esta hipótesis, puede salir y recolectar una muestra aleatoria de 20 plantas para medir. Incluso si la verdadera altura media de esta especie de planta es de 10 pulgadas, es posible que haya seleccionado una muestra de 20 plantas que eran inusualmente altas, lo que lo llevará a rechazar la hipótesis nula.

Aunque la hipótesis nula era cierta (la altura media de esta planta en realidad era de 10 pulgadas), la rechazó. En estadística, llamamos a esto un «descubrimiento falso». Afirmó haber hecho un descubrimiento, un «resultado significativo», pero en realidad es falso.

Ahora imagine que realiza 100 pruebas estadísticas a la vez. Usando un nivel alfa de 0.05, solo hay un 5% de probabilidad de hacer un descubrimiento falso con cualquier prueba individual, pero debido a que está realizando una cantidad tan grande de pruebas, esperaría que alrededor de 5 de las 100 conduzcan a descubrimientos falsos.

En el mundo moderno, los descubrimientos falsos pueden ser un problema común, ya que la tecnología ha permitido a los investigadores realizar cientos o incluso miles de pruebas estadísticas a la vez.

Por ejemplo, los investigadores médicos pueden realizar pruebas estadísticas en decenas de miles de genes a la vez. Incluso con una tasa de descubrimientos falsos de solo el 5%, esto significa que cientos de pruebas podrían resultar en descubrimientos falsos.

Una forma de controlar la tasa de falsos descubrimientos es utilizar algo conocido como Procedimiento Benjamini-Hochberg.

El procedimiento Benjamini-Hochberg

El procedimiento Benjamini-Hochberg funciona de la siguiente manera:

Paso 1: Realice todas sus pruebas estadísticas y encuentre el valor p para cada prueba.

Paso 2: Organice los valores p en orden de menor a mayor, asignando un rango a cada uno: el valor p más pequeño tiene un rango de 1, el siguiente más pequeño tiene un rango de 2, etc.

Paso 3: Calcule el valor crítico de Benjamini-Hochberg para cada valor p, usando la fórmula (i / m) * Q

dónde:

i = rango del valor p

m = número total de pruebas

Q = la tasa de falsos descubrimientos que eligió

Paso 4: Encuentre el valor p más grande que sea menor que el valor crítico. Designe cada valor p que sea menor que este valor p como significativo.

El siguiente ejemplo ilustra cómo realizar este procedimiento con valores concretos.

Ejemplo

Suponga que los investigadores están interesados ​​en determinar si 20 variables diferentes están relacionadas con la enfermedad cardíaca. Realizan 20 pruebas estadísticas individuales a la vez y reciben un valor p para cada prueba. La siguiente tabla muestra los valores p para cada prueba, ordenados de menor a mayor.

Ejemplo de procedimiento Benjamini-Hochberg

Suponga que los investigadores están dispuestos a aceptar una tasa de descubrimientos falsos del 20%. Por lo tanto, para calcular el valor crítico de Benjamini-Hochberg para cada valor p, podemos usar la siguiente fórmula: (i / 20) * 0.2 donde i = rango del valor p.

La siguiente tabla muestra el valor crítico de Benjamini-Hochberg para cada valor p individual:

Conjunto de datos de ejemplo de Benjamini-Hochberg

La prueba con el valor p más grande que es menor que su valor crítico Benjamini-Hochberg es la Variable # 11, que tiene un valor p de 0.039 y un valor crítico BH de 0.040.

Por lo tanto, esta prueba y todas las pruebas con un valor p menor se considerarán significativas.

Ejemplo de procedimiento de Bejamini-Hochberg

Tenga en cuenta que aunque la Variable n. ° 17 y la Variable n. ° 3 no tenían valores p más pequeños que sus valores críticos de BH, todavía se consideran significativos ya que tienen valores p más pequeños que la Variable n. ° 11.

Cómo elegir una tasa de descubrimiento falso

Uno de los pasos más importantes en el procedimiento Benjamini-Hochberg es elegir una tasa de descubrimiento falso. Debe elegir su tasa de descubrimiento falso antes de recopilar datos o realizar pruebas estadísticas.

Por lo general, realizará una gran cantidad de pruebas estadísticas durante la fase exploratoria de su análisis, que luego realizará un seguimiento con más pruebas para investigar más a fondo sus hallazgos.

Si las pruebas de seguimiento son de bajo costo, entonces puede considerar establecer una tasa de descubrimiento falso más alta porque, incluso si tiene algunos descubrimientos falsos, es probable que descubra estos descubrimientos falsos con pruebas futuras.

Además, si el costo de perder un descubrimiento importante es alto, es posible que desee establecer una tasa de descubrimiento falso más alta para no perderse nada importante.

Dependiendo de los costos de su investigación y de la importancia de no perderse ningún descubrimiento importante, la tasa de falsos descubrimientos variará de una situación a otra.

Recursos adicionales

Una explicación de los valores P y la importancia estadística
¿Qué es la tasa de error familiar?

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Redactor del artículo

  • Luis Benites
    Director de Statologos.com

    Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

    Ver todas las entradas

¿Te hemos ayudado?

Ayudanos ahora tú, dejanos un comentario de agradecimiento, nos ayuda a motivarnos y si te es viable puedes hacer una donación:

La ayuda no cuesta nada

Por otro lado te rogamos que compartas nuestro sitio con tus amigos, compañeros de clase y colegas, la educación de calidad y gratuita debe ser difundida, recuerdalo:

Deja un comentario

Se utiliza un ANOVA de medidas repetidas para determinar si existe o no una diferencia estadísticamente significativa entre las medias…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!