¿Qué es la pseudorreplicación?

La pseudorreplicación es un problema común que ocurre en los estudios estadísticos. En este artículo compartimos lo siguiente:

  • Una explicación simple de la pseudorreplicación.
  • Ejemplos de pseudorreplicación
  • Cómo evitar la pseudorreplicación

¡Saltemos!

¿Qué es la pseudorreplicación?

Supongamos que queremos saber si el medicamento A o el medicamento B son mejores para reducir la presión arterial.

Si simplemente le damos el medicamento A a una persona y el medicamento B a otra persona diferente, y medimos su correspondiente caída en la presión arterial, no tendremos suficiente información del estudio para generalizar los resultados a personas que no sean estas dos.

Además, cada persona responde de manera diferente a los medicamentos, por lo que las diferencias que vemos en la presión arterial pueden deberse al azar.

Sin embargo, si administramos el medicamento A a 30 personas y el medicamento B a otras 30 personas, podemos obtener mucha más información sobre la variabilidad de cada medicamento. Esto nos permitirá utilizar la inferencia estadística para averiguar si uno de los medicamentos es más eficaz para reducir la presión arterial que el otro en promedio.

Este simple ejemplo destaca un componente importante de la inferencia estadística: cuando estamos interesados ​​en probar las diferencias entre los tratamientos, necesitamos la replicación . Un error común que se comete a menudo en los estudios es el uso de pseudorreplicación.

La replicación se refiere a tener más de una unidad experimental con el mismo tratamiento. Cada unidad con el mismo tratamiento se conoce como réplica. Por ejemplo, si solo le damos cada medicamento a una persona, no tenemos replicación. Pero si le damos cada medicamento a 30 personas diferentes, entonces tenemos 30 repeticiones.

La pseudorreplicación se refiere al caso en que los tratamientos no se replican o cuando las repeticiones no son estadísticamente independientes.

Repasemos tres ejemplos de pseudorreplicación para comprenderlo mejor.

Ejemplo 1

Escenario: Suponga que los investigadores quieren saber si el programa A o el programa B es más efectivo para ayudar a los jugadores de baloncesto de la escuela secundaria a saltar más alto. Un equipo de la escuela secundaria en una escuela local se elige al azar para implementar el programa A durante un mes, mientras que otro equipo de la escuela secundaria en otra escuela local se elige al azar para implementar el programa B durante un mes. Después de un mes, los jugadores de cada equipo son evaluados para medir su salto máximo.

Problema: no hay una verdadera réplica en este estudio. En este ejemplo, las escuelas son las unidades experimentales a las que se les asigna aleatoriamente un tratamiento. Aunque varios jugadores de cada escuela participan en el programa, los jugadores son pseudo-réplicas porque los resultados para cada jugador no son independientes; están influenciados por los entrenadores, los estilos de práctica y otros factores específicos del equipo.

Remedio: Necesitamos varias réplicas de las unidades experimentales. En este caso, dado que las unidades experimentales son los equipos, necesitamos asignar más de un equipo de secundaria a cada programa. Por ejemplo, asigne cinco equipos de escuelas secundarias locales para usar el programa A y cinco equipos diferentes para usar el programa B. Esto nos daría información sobre la variabilidad del efecto de los diferentes programas.

Ejemplo 2

Escenario: suponga que los investigadores quieren saber si el medicamento A o el medicamento B son más eficaces para reducir la presión arterial. El medicamento A se administra a una persona y el medicamento B se administra a otra persona. La presión arterial de cada persona se mide una vez por semana durante diez semanas.

Problema: no hay una verdadera réplica en este estudio. En este ejemplo, se realizan varias mediciones en la misma persona, lo que es un ejemplo de una medición repetida , no una réplica.

Remedio: Necesitamos varias réplicas de las unidades experimentales. En este caso, dado que las unidades experimentales son los individuos, necesitamos asignar más de un individuo para usar cada medicamento. Por ejemplo, asigne 30 personas para que usen el medicamento A y 30 personas para que usen el medicamento B. Esto nos daría información sobre la variabilidad del efecto de los diferentes medicamentos.

Ejemplo 3

Escenario: suponga que los investigadores quieren saber si la fórmula A o la fórmula B es más eficaz para hacer que las plantas crezcan más. La Fórmula A se rocía en 100 plantas en un campo y la Fórmula B se rocía en 100 plantas en un campo diferente varias millas más adelante.

Problema: no hay una verdadera réplica en este estudio. En este ejemplo, los campos son las unidades experimentales a las que se les asigna aleatoriamente un tratamiento. Aunque varias plantas de cada campo se rocían con la fórmula, las plantas son pseudo-réplicas porque los resultados para cada planta no son independientes; las 100 plantas en cada campo comparten las condiciones presentes en ese campo (condiciones del suelo, depredadores naturales, condiciones climáticas, cantidad de lluvia en un campo frente al otro, etc.).

Remedio: Necesitamos varias réplicas de las unidades experimentales. En este caso, dado que las unidades experimentales son las plantas, debemos rociar la fórmula A en 100 plantas y la fórmula B en 100 plantas que están todas ubicadas en el campo. Esto asegura que las condiciones del campo no sesgarán los resultados de un tratamiento más que el otro, ya que las plantas que reciben la fórmula A y las plantas que reciben la fórmula B están todas ubicadas en el mismo campo.

Efectos de la pseudorreplicación

Cuando se produce una pseudorreplicación en un estudio, es probable que se subestime la variabilidad. Esto tiene dos efectos:

  • Es probable que los intervalos de confianza sean demasiado estrechos (y poco confiables)
  • El error de Tipo I (probabilidad de rechazar falsamente una hipótesis nula verdadera ) será mayor.

Ambos son efectos indeseables en un estudio y hacen que la inferencia estadística no sea confiable. Esto significa que será difícil generalizar los hallazgos del estudio a una población más grande .

Qué hacer al respecto

Si es posible, asegúrese de evitar la pseudorreplicación al diseñar un experimento. Tenga en cuenta que para los estudios observacionales, la pseudorreplicación es común y, a menudo, no se puede evitar.

Si no es posible evitar la pseudorreplicación, considere el estudio como un estudio preliminar que se puede utilizar para diseñar un mejor estudio en el futuro. Además, sea abierto sobre las limitaciones del estudio cuando informe cualquier hallazgo a una audiencia más amplia.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

1 comentario en «¿Qué es la pseudorreplicación?»

  1. Creo que hay que revisar los conceptos . subestimar la variación da un error tipo I? No será sobreestimarla?
    Las pseudo-réplicas son inevitables cuando se esta analizando sitios diferentes y un efecto determinado, como ocurre en estudios ecológicos, que hacer?

    Responder

Deja un comentario

Una prueba binomial compara una proporción muestral con una proporción hipotética. Por ejemplo, supongamos que tenemos un dado de 6…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!