Obtención de números suficientemente grandes en las pruebas imparciales de los tratamientos
En las pruebas de los tratamientos a veces es posible obtener números suficientemente grandes de la investigación realizada en uno o dos centros. Sin embargo, si se desea evaluar el impacto de los tratamientos en resultados raros como la muerte, generalmente es necesario incluir a pacientes de muchos centros, a menudo de muchos países, a participar en la investigación con el fin de obtener evidencia científica fiable.
Por ejemplo, la participación de 10 000 pacientes en 13 países mostró que la administración de corticoesteroides a personas con lesiones cerebrales graves, un tratamiento que se ha utilizado durante más de tres decenios, era mortal. [2] En otra prueba imparcial organizada por el mismo equipo de investigación, la participación de 20 000 pacientes en 40 países mostró que un fármaco económico llamado ácido tranexámico reduce el número de defunciones causadas por la hemorragia después de un traumatismo. [3]
Debido a que estos estudios se diseñaron para reducir los sesgos además de las incertidumbres resultantes de la intervención del azar, son pruebas imparciales ejemplares y proporcionan evidencia científica de buena calidad y de gran trascendencia para la atención sanitaria en todo el mundo. De hecho, en una encuesta organizada por la revista científica BMJ, el segundo de estos ensayos aleatorizados fue votado como el estudio más importante de 2010.
La figura que se muestra a continuación está basada en datos aportados amablemente por el equipo galardonado para ilustrar la importancia de que las estimaciones de los efectos de los tratamientos se realicen en función de la mayor cantidad de información posible, a fin de reducir los riesgos de llegar a conclusiones erróneas debido a la intervención del azar.
El rombo en la parte inferior de la figura representa el resultado global del ensayo del ácido tranexámico. Muestra que el fármaco reduce la muerte a causa de la hemorragia en casi el 30 % (riesgo relativo apenas por encima de 0,7).
Este resultado global brinda la estimación más fiable del efecto de este fármaco, aunque la estimación de los centros en el Continente A sugiere un efecto menos notable (que no es estadísticamente significativo y que probablemente subestime el efecto verdadero) y la estimación de los centros de la categoría «Otros continentes» sugiere un efecto más notable (que probablemente esté sobrestimado).
Casi de la misma manera en que se puede disminuir la intervención del azar al combinar los datos de muchos centros en un ensayo multinacional, los resultados de estudios similares pero independientes pueden en ocasiones combinarse estadísticamente, un proceso que se conoce como ‘metanálisis’.
Aunque los estadísticos perfeccionaron los métodos para el metanálisis a lo largo de muchos años, no fue hasta los años setenta que comenzaron a aplicarlos con más frecuencia; en un principio los usaban los profesionales de las ciencias sociales en los Estados Unidos y, más adelante, lo hicieron los investigadores médicos. Hacia fines del siglo XX, el metanálisis era aceptado por muchos como un elemento importante de las pruebas imparciales de los tratamientos.
Por ejemplo, cinco estudios realizados en cinco países diferentes se organizaron y se financiaron por separado para abordar una pregunta que llevaba 60 años sin respuesta: en los recién nacidos prematuros, «¿qué concentración de oxígeno en la sangre ofrece la mayor probabilidad de que los bebés sobrevivan sin discapacidades importantes?».
Si la concentración de oxígeno en la sangre es demasiado alta, los bebés pueden quedar ciegos; si es demasiado baja, pueden morir o desarrollar parálisis cerebral. Debido a que, incluso en estos frágiles bebés, las diferencias resultantes de las distintas concentraciones de oxígeno probablemente sean modestas, se necesitan grandes números para detectarlas.
Por lo tanto, los equipos de investigación responsables de cada uno de los cinco estudios acordaron combinar la evidencia científica de sus respectivos estudios para obtener una estimación más fiable que cualquiera de sus estudios podría brindar de forma individual. [4]