Sistema de Información Esencial en Terapéutica y Salud

@SIETES7

Última actualización: 13/1/2021
SIETES contiene 93213 citas

 
Ref. ID 102667
 
Tweet
Ioannidis JPA. The proposal to lower P value thresholds to .005
Journal of the American Medical Association (JAMA)
10 de abril 2018
Volumen 319 nº 14 página(s) 1429-30

La mayoría de los artículos (96%) en revistas médicas presenta valores de p en el resumen o el texto. Sin embargo, es probable que muchas de las conclusiones subrayadas en estos trabajos sean falsas.

En 2016 la Asociación Americana de Estadística publicó una declaración sobre los valores de p. Los autores de esta declaración también escribieron, además, unos 20 artículos independientemente, sobre diferentes aspectos de esta cuestión. Un grupo de 72 metodólogos propuso recientemente una modificación sencilla: mover el valor habitual de significación estadística de 0,05 a 0,005, para los nuevos descubrimientos. Esta propuesta fue acogida con comentarios favorables y desfavorables.

Los valores de p son mal interpretados, son objeto de fiabilidad injustificada, y son utilizados para fines para los que no están concebidos. La interpretación errónea más habitual es que representan “la probabilidad de que la hipótesis estudiada sea verdadera”. Un valor de p=0,02 (2%) es erróneamente interpretado como que la hipótesis nula (es decir, que el fármaco es tan eficaz como placebo) tiene un 2% de probabilidad de ser verdadera, y que la alternativa (que el fármaco es más eficaz que placebo) tiene un 98% de probabilidad de ser correcta.

A menudo se olvida que “una inferencia correcta exige una descripción y una transparencia completas”. Los valores de p con mejor aspecto (más bajos) no garantizan descripción y transparencia completas.

El valor de p no mide la magnitud del efecto ni la importancia de un resultado.

Se ha propuesto en múltiples ocasiones disminuir el nivel de significación (por debajo de 0,05). Por ejemplo, en los estudios de genómica poblacional, la adopción de un nivel de 5 x 10(-8) (elevado a -8) ha hecho que las asociaciones que se han descrito en estos estudios puedan repetirse en otro estudio, y además estas asociaciones aparecen de manera consistente cuando se examinadas en nuevas poblaciones. No obstante, para otros campos de investigación es muy difícil fijar un nivel de significación preciso.

En la mayoría de la investigación biomédica no queda clara la multiplicidad de los factores que se tienen en cuenta, y los análisis no son sistemáticos y no son transparentes. En la mayoría de los estudios observacionales exploratorios sin protocolos y planes de análisis predeterminados, no está claro cuántos análisis se realizaron y qué vías de análisis fueron exploradas. Incluso en la actualida, en que es más frecuente publicar un protocolo antes del inicio así como un plan de análisis estadístico, subsiste un “elevado grado de libertad” sobre la manera de analizar los resultados y sobre lo que publicar y cómo. Además, en la investigación clínica contemporánea muchos estudios se centran en efectos beneficiosos o adversos menores; por lo tanto, aumenta el riesgo de que cada uno de los posibles sesgos altere el resultado del estudio.

Trasladar el umbral del valor de p de 0,05 a 0,005 empujaría a alrededor de una tercera parte de los resultados estadísticamente significativos de la investigación publicada hasta ahora a la categoría de solamente “sugerente”. Este desplazamiento es esencial para las personas que piensan en blanco y negro, o en significativo y no significativo. Para la enorme mayoría de la investigación observacional publicada hasta ahora, esta reclasificación sería bienvenida.

El autor concluye que la reducción del nivel de significación del valor de p podría hacer más bien que mal, a pesar de que en ocasiones pueda desplazar un efecto de tratamiento verdadero de la zona de significación. Sin embargo, se debe tener en cuenta que hay que fijarse en la magnitud del efecto y en su incertidumbre (como la reflejada en los intervalos de confianza).

Adoptar un nivel de significación más bajo de 0,05 puede ayudar a promover una agenda de investigación diferente, con menos estudios, pero mayores y mejor concebidos y diseñados, con suficiente poder estadístico para pasar pruebas más exigentes. Sin embargo, esta medida también puede tener efectos colaterales. Si los investigadores y otros interesados (por ejempl