Interpretación de resultados del ensayo clínico
Conceptos estadísticos clave
El promedio de pacientes en el grupo control y en el grupo de tratamiento del estudio que alcanza un objetivo determinado, dice mucho sobre el efecto real del fármaco. Aunque lo verdaderamente importante es determinar si la diferencia entre los grupos de tratamiento es estadísticamente significativa (si la diferencia observada refleja un patrón y no se debe a la casualidad) y por lo tanto puede ofrecer un verdadero beneficio a los pacientes.
Los análisis estadísticos miden y evalúan los datos del estudio para tratar de proporcionar medidas objetivas de la eficacia de los tratamientos, la probabilidad de que las diferencias entre los tratamientos muestren cambios relevantes en el riesgo de ciertos eventos (signos, síntomas o factores de la enfermedad) y dan una medida matemáticamente precisa de la eficacia y beneficios de los tratamientos.
La interpretación correcta de los resultados de los ensayos clínicos depende del adecuado y preciso análisis estadístico y la comprensión de lo que significan tanto numéricamente como en impacto a los pacientes.
Usando estadísticas para describir diferencias
■ Significación Estadística
Medida matemática que sirve para evaluar la diferencia entre los grupos estudiados; se mide la diferencia en un valor (por ejemplo: número de personas que consiguieron una RC) que se ha podido observar en un grupo de tratamiento en comparación con el otro, y se considera que es estadísticamente significativa si se trata de un valor mayor que el que el que se podría esperar que sucediera solo por casualidad.
■ Valores de probabilidad (p)
El p-valor es la probabilidad de obtener un resultado estadístico por casualidad. Cuanto más bajo sea el p-valor, menos probable es que el resultado obtenido sea debido a la casualidad, y por lo tanto este resultado se podrá atribuir al fármaco sometido a ensayo.
El p-valor para que el resultado se considere significativo puede variar en algunos casos pero por lo general se fija en 0,05. Un p-valor de 0,05 significa que hay sólo un 5% probabilidad de que el resultado ocurriese por casualidad – y por lo tanto que el resultado sea debido a una verdadera diferencia entre los efectos del tratamiento.
■ Promedios – la mediana y la media
Las mejoras observadas en valores como el de supervivencia libre de enfermedad o supervivencia global, se resumen en valores que reflejan por donde está “el centro” de todo el grupo.
La mediana es el valor medio de un conjunto de números cuando están colocados en orden de menor a mayor, por ejemplo, la mediana de 5, 7, 9, 10, 13, 18, 23 es 10. En un ensayo clínico, se alcanza la mediana cuando el 50% de los pacientes han experimentado un evento (como muerte o recurrencia). La mediana para una valoración final sen representa normalmente con una ‘m’ minúscula, por ejemplo mELP (mediana de enfermedad libre de progresión). Es importante recordar que considerar el valor de la mediana para medir supervivencia no siempre proporciona la imagen más precisa de los efectos de un tratamiento.
Por ejemplo, si el 51% de los pacientes ganan sólo dos meses o menos de supervivencia gracias a un tratamiento, mientras que el 49% gana 10 o más meses, por definición la mediana de supervivencia se calcularía como menos de dos meses – que no es un verdadero reflejo del beneficio. Del mismo modo, si un ensayo tenía, por ejemplo, 800 pacientes, la mediana se alcanzaría una vez que 400 alcancen el objetivo (por ejemplo, experimentar un evento en particular). Pero el otro 400 puede potencialmente responder mucho mejor, y la mediana no reflejaría esto.
Otra forma de medida es – la media – .
La media es la estimación calculada al sumar un conjunto de números (por ejemplo, un conjunto de resultados) y dividiendo por el número de valores sumados. Por ejemplo la media de 5, 7, 9,
10, 13, 18, 23 es la suma de todos ellos divididos entre 7 = 12,1.
■ Hazard ratio (HR)
El cociente de riesgo o Hazard ratio, es el riesgo relativo de que ocurra un evento (por ejemplo, progresión de la enfermedad) en un grupo del ensayo en comparación al otro, durante toda la duración del estudio.
Un HR de 1 significa que no hay diferencia entre los grupos, un HR de 2 significa que hay un riesgo doble y un HR de 0,5 indica que hay la mitad de riesgo de que un evento ocurra en un grupo con respecto al otro.
En el siguiente ejemplo, un HR para la Supervivencia Global de 0,73 indica que hay una reducción del 27% en el riesgo de progresión o muerte en el grupo tratado con el fármaco A comparando con el fármaco B. Se calcula de la siguiente manera: 1-0,73 (de HR) x 100 = 27% de reducción del riesgo.
Es importante destacar que, a diferencia de las medias, el Hazard ratio tiene en cuenta la diferencia en los eventos durante todo el período del ensayo, no solo en un punto específico durante el ensayo o al final, por lo que es un buen predictor del efecto real del tratamiento en toda la población de pacientes. Esta metodología tiene la ventaja de utilizar toda la información disponible, incluyendo los pacientes que no completaron el ensayo por cualquier motivo. Un HR por lo tanto es más útil cuando el riesgo para la valoración final descrita no es constante con respecto al tiempo.
■ Intervalo de confianza (IC )
El porcentaje de IC indica la certeza de que un resultado fallará en un rango de resultados marcados específicamente con “Límites de confianza” inferior y superior por ejemplo: Un resultado HR del 95% con un IC de 0,65 (inferior) – 0,80 (superior) significa que con una certeza del 95%, en las mismas condiciones de estudio el resultado de HR estará entre 0,65 y 0,80 para la misma población. Dependiendo lo estrecho o ancho de este rango se puede proporcionar información muy valiosa sobre la precisión de los resultados. Un IC estrecho implica precisión alta y un amplio IC implica precisión pobre. El IC se utiliza como una indicación de cómo un resultado de un estudio se reflejará en la población de pacientes en general fuera de la investigación.
■ Reducción del riesgo absoluto (RRA) y Reducción del riesgo relativo (RRR)
RRA es la diferencia absoluta entre el número de eventos (por ejemplo, porcentaje de pacientes que han progresado) que se produjeron en el grupo de tratamiento y el número de los eventos en el grupo control. Por ejemplo, en un estudio en el que el 10% de los pacientes tratados con el fármaco A progresaron frente a un 15% de los pacientes tratados con el fármaco B, hay una RRA del 5% en la progresión de la enfermedad con el fármaco A en comparación con el fármaco B: RRA = 15% -10% = 5%.
La RRR por otro lado, observa esa misma diferencia entre los grupos de pacientes tratados con diferentes tratamientos, pero expresa el cambio en el riesgo como un porcentaje, en lugar de una diferencia en valores absolutos. Usando el ejemplo anterior, la RRR de la progresión se reduce en un 33% con el medicamento A en comparación con el medicamento B: RRR = (15-10) / 15 = 5/15 = 33,3%.
■ Número necesario a tratar (NN T)
El NNT es una estadística que informa del número de pacientes que necesitan ser tratados con una terapia (o combinación de terapias) para que un paciente obtenga un determinado objetivo. El NNT se calcula a partir de datos de estudios clínicos y se considera una medida para decidir si un tratamiento beneficia a un gran número o sólo a un limitado número de pacientes que recibieron un fármaco. Cuanto menor sea el NNT más efectivo será el tratamiento.
■ Ratio Odds (RO)
Es una medida de la efectividad del tratamiento, el RO es el índice de probabilidad de que un evento ocurra en el grupo de tratamiento expresado como un porcentaje de la probabilidad de que ese evento ocurra en el grupo control. Cuanto más cercanos sea el RO a 1, menor será la diferencia entre el efecto del tratamiento de intervención y el tratamiento control. Si el RO es mayor (o menor) de 1, entonces los efectos del tratamiento son mayores (o menores) que los del tratamiento control.
Forma habitual de presentar los resultados de los ensayos clínicos
Importancia de evaluar los cambios en el tiempo
Los métodos estadísticos permiten analizar y examinar toda la información de un estudio en el tiempo para descubrir si hay diferencias estadísticamente significativas entre los tratamientos que la simple medida de la mediana (una medida tomada en un punto particular dentro del ensayo) no puede representar. Con la herramienta estadística correcta, puede realizarse una medida precisa del efecto de un tratamiento que tenga en cuenta los diferentes tiempos de inicio y la duración del tiempo que los pacientes han estado en tratamiento.
■ Curva de Kaplan-Meier (KM)
Las curvas KM representan la proporción de la población de estudio que aún sobreviven (o libre de enfermedad o algún otro resultado especificado u objetivo) en tiempos sucesivos. Este es el método más comúnmente utilizado para representar la supervivencia global o eficacia. En el caso de curvas de KM en los estudios de tratamiento que demuestran supervivencia global, las curvas proporcionan un gráfico para un periodo de tiempo determinado. Comparan los pacientes que reciben el fármaco en investigación con los del grupo control, mostrando el porcentaje de pacientes que siguen vivos en un momento determinado. Calcula este porcentaje de acuerdo al tiempo que un paciente ha estado recibiendo un tratamiento, en lugar de considerar desde cuando entraron en el estudio.
Cuanto mayor sea la separación de las curvas mayor será la diferencia entre los grupos de tratamiento en el valor que estén siendo analizados. Si los grupos de tratamiento representados en la curva KM siguen un camino similar, sugiere que hay sólo una pequeña diferencia entre los grupos del estudio en el valor medido. Si los grupos se uniesen, significaría que en ese momento determinado no había diferencia entre los dos grupos del estudio.
■ Forest plot (FP) : Análisis de Subgrupos
Cuando varios ensayos han estudiado un mismo tratamiento, o subgrupo de pacientes dentro de un ensayo que puedan responder de manera diferente al tratamiento, el análisis de subgrupos es una manera de mostrar y comparar los diferentes grupos de información.
El análisis de subrupos es una forma útil de analizar de un vistazo si el beneficio o el efecto de un tipo de tratamiento es uniforme en todos los estudios o en los diferentes subgrupos de pacientes. Un conjunto de datos, por ejemplo un subgrupo o estudio determinado, generalmente se muestra con un cuadrado. El tamaño de los cuadrados es proporcional al tamaño o peso (importancia) de los datos descritos, y las líneas horizontales a ambos lados de cada cuadrado representan los intervalos de confianza.
La gráfica muestra visualmente si un tratamiento proporciona o no un resultado positivo en un grupo particular de pacientes en relación con otro tratamiento, usando dos columnas y una línea vertical divisoria que representa cuando el tratamiento no tiene efecto. Normalmente, los datos que caen a la izquierda de la línea vertical muestran que el tratamiento en estudio es más eficaz que el comparador, mientras que los datos que caen en el lado derecho de la línea vertical (sin efecto) sugieren que en ese subgrupo o ensayo el comparador es más eficaz que el tratamiento en estudio.
En el siguiente ejemplo (ver imagen 10) se muestra el Hazard Ratio de la SLP de los diferentes subgrupos de pacientes. El tratamiento A es más eficaz que el tratamiento B en los subgrupos de pacientes que caen a la izquierda de la línea vertical. Sin embargo, los subgrupos que se encuentran en la derecha de la línea vertical significan que en esos subgrupos de pacientes el tratamiento B es más eficaz que tratamiento A.
Habitualmente los análisis de subgrupos proporcionan hipótesis de trabajo para estudios prospectivos posteriores.
■ Gráficos en Cascada
Este tipo de gráfico refleja a cada paciente de forma individual, por ejemplo, muestra el estado de la tasa de respuesta del tumor de cada paciente, mostrando si está en progresión, estabilizado o en mejora. En estudios sobre el cáncer los gráficos en cascada se utilizan a menudo para mostrar los datos de Tasa de Respuesta Objetiva.
Artículos relacionados
A continuación dejamos listados una serie de artículos relacionados con los Ensayos Clínicos que pueden ser de tu interés:
Próximos eventos