INTRODUCCIÓN
Uno de los objetivos más frecuentes en investigación clínica es intentar cuantificar la asociación causal entre una exposición o un tratamiento y un evento clínico o resultado. Los ensayos clínicos controlados (EC) surgen para dar respuesta científica a las diferentes innovaciones terapéuticas en el campo de la medicina1. En este sentido, el diseño de EC se ha establecido como el de más calidad para estudiar relaciones causales en tratamientos2, evitando sesgos o errores sistemáticos que puedan enmascarar el verdadero efecto de una determinada intervención. De hecho, el objetivo principal en la mayoría de los EC es estimar el impacto que tiene un nuevo tratamiento comparado con el convencional sobre un resultado clínico del paciente. Por todo ello, los EC constituyen el «patrón oro» de la evidencia a la hora de tomar decisiones clínicas en la práctica médica habitual.
Sin embargo, los EC tienen algunas limitaciones derivadas principalmente de sus condiciones de estudio y de su incapacidad para detectar algunas diferencias para otros resultados distintos del objetivo de interés entre los grupos que se analizan. Los EC se realizan, en general, en pacientes muy seleccionados bajo criterios de inclusión muy estrictos que pueden alejarnos de su aplicabilidad en la práctica clínica habitual. Asimismo, el desarrollo de un EC puede ser inviable por motivos éticos obvios o tener un seguimiento reducido con respecto al evento de interés (en general, 1-2 años), lo que limita su reproducibilidad3. Finalmente, los EC pueden carecer de potencia estadística suficiente por abordar enfermedades poco frecuentes y/o con seguimiento muy prolongado4.
Todas estas razones justifican la necesidad de llevar a cabo estudios observacionales (EO), los cuales pueden proporcionar una información válida y complementaria de una exposición o intervención terapéutica sobre un resultado, siempre que se aplique una metodología científica rigurosa5. En otras palabras, los EO representan una opción válida en investigación clínica para evaluar intervenciones terapéuticas cuando se emplean las herramientas estadísticas adecuadas para su análisis como los modelos de regresión, los índices de propensión o los modelos estructurales marginales (MEM).
MODELOS ESTRUCTURALES MARGINALES: APORTANDO EVIDENCIA A LOS ESTUDIOS OBSERVACIONALES
En general, los EO de cohortes son realizados para evaluar el efecto de un tratamiento cuya asignación no se ha distribuido aleatoriamente, dado que la intervención terapéutica se ha establecido a partir de la práctica médica habitual o las características individuales de cada paciente. No obstante, si el diseño y análisis son adecuados, los resultados de los estudios de cohortes pueden ser comparables a los de los ensayos clínicos6.
En la práctica clínica habitual, la evaluación del efecto del tratamiento sobre el pronóstico del paciente es compleja debido a la existencia de variables clínicas confusoras, especialmente si el inicio de los tratamientos varía a lo largo del tiempo y la variable resultado es tiempo a un evento. Indudablemente, esto puede conducir a sobreestimaciones o infravaloraciones del efecto del tratamiento, lo que hace muy vulnerable a los EO, debilitando la contundencia de los resultados e incurriendo en la confusión por indicación. Las herramientas estadísticas convencionales más frecuentemente utilizadas para minimizar estos problemas son los modelos de regresión y la estratificación e índice de propensión7-9, pero también pueden estar sesgadas si existen variables confusoras que varían a lo largo del tiempo o que pueden estar afectadas por tratamientos previos10.
Un análisis alternativo para manejar estos sesgos consiste en la aplicación de los MEM, propuestos por Robins et al. (1999)11. En esencia, los MEM constituyen una alternativa a los modelos clásicos cuando existe una variable confusora dependiente del tiempo que se asocia al evento de interés, pero también se relaciona con el tratamiento que se está evaluando. Se denominan estructurales porque estudian causalidad y no simplemente asociación. Son marginales porque se usan las distribuciones marginales de los contrafactuales, condicionadas a las variables basales, en lugar de la conjunta. Se denomina contrafactual a todo evento que no ha ocurrido, pero que pudiera haber ocurrido. La inferencia causal se realiza comparando teóricamente qué ocurriría si todos los pacientes hubieran sido tratados frente a si ningún paciente hubiera sido tratado. Los métodos de regresión tienen sesgos aunque no exista confusión residual (es decir, incluso si se hubieran medido todas las indicaciones posibles del tratamiento) porque se debe a un ajuste inapropiado de la confusión creada por variables dependientes del tiempo afectadas por el tratamiento previo.
La implementación, propuesta por estos autores, de estos modelos consta de 3 pasos básicos:
1) Crear un índice de propensión, es decir, una función que estime la probabilidad («propensión») que tienen los pacientes de ser asignados a cada grupo de tratamiento mediante una regresión logística en la que la variable dependiente es el tratamiento y las independientes son las variables que se asocian con el inicio del tratamiento. Para ajustar este modelo de regresión, cada paciente se «desdobla» en tantas observaciones como unidades de tiempo (meses, semanas, etc.) tenga (figura 2 y figura 3) y se ajusta con un método que tiene en cuenta su falta de independencia (modelos GEE)12.
2) Con el mismo método, se crea una función para la probabilidad de ser censurado y combinando ambas se crea un peso para ponderar cada individuo por su inversa. Con esta ponderación se simula una pseudopoblación en la que el tratamiento, y la censura, son independientes de los confusores medibles.
3) Finalmente se ajusta un modelo de Cox para el tratamiento, ponderando los individuos con esos pesos. El modelo de Cox se simula mediante un modelo de regresión logística expandido, es decir, como en el paso 1, cada paciente se «desdobla» en tantas observaciones como medidas repetidas en el tiempo tenga. La odds ratio de esta regresión logística se aproxima bien al riesgo relativo instantáneo del modelo de Cox, porque el riesgo de eventos es bajo en todos los meses13.
ASUNCIONES Y CONDICIONES DE LOS MODELOS ESTRUCTURALES MARGINALES
Como todos los modelos estadísticos, los MEM tienen asunciones que se deberían verificar9. Básicamente, estas asunciones son:
- Consistencia: es decir, que la exposición se tiene que poder definir sin ambigüedades, explicar cómo con un cierto nivel de exposición se asigna a una persona expuesta a un nivel diferente. La evaluación de la consistencia puede ser muy fácil para tratamientos, pero complicada en otro tipo de exposiciones, tales como peso corporal, resistencia a la insulina o nivel de exposición a partículas en suspensión.
- Intercambiabilidad: que los sujetos expuestos y no expuestos, censurados y no censurados, tengan una distribución igual de los confusores. Implica la asunción de no confusión no medible. Esta asunción no se puede comprobar en una serie de datos observados, pero se puede realizar análisis de sensibilidad añadiendo al modelo más simple otros confusores o modificando la función de los confusores, por ejemplo añadiendo términos cuadráticos o funciones splines. En un ensayo clínico, la intercambiabilidad en el tratamiento es lo que se intenta conseguir con la asignación aleatoria.
- Positividad: existencia de individuos expuestos y no expuestos para cada nivel de los confusores, también llamada asignación experimental del tratamiento. Por ejemplo, si se está evaluando un tratamiento con posible efecto teratogénico, la probabilidad de recibir este fármaco en embarazadas es 0 de forma estructural. Esto parece muy obvio en este caso, pero resulta complicado de establecer para las distintas combinaciones de confusores. Una forma simple de testar esta asunción se puede realizar mediante el cálculo de las distintas combinaciones posibles de confusores y calculando el porcentaje de expuestos para cada combinación. Por ejemplo, si se quiere evaluar el efecto de la estatina en pacientes con trasplante renal, se debería tener pacientes tratados y no tratados para cualquier valor de colesterol. Obviamente, este punto quizás es una limitación importante para su aplicación generalizada en la práctica clínica.
- Buena especificación del modelo: la estimación ponderada de los parámetros de un modelo estructural marginal requiere también ajustar varios modelos: el modelo estructural, el modelo de regresión del tratamiento y el modelo de regresión para las censuras.
Bajo estas 4 asunciones de consistencia, intercambiabilidad, positividad y buena especificación del modelo para estimar los pesos, se crea mediante IPTW una pseudopoblación en la cual la exposición es independiente de los confusores medidos. La pseudopoblación es el resultado de asignar a cada paciente un peso proporcional a la probabilidad de recibir su historia de exposición a un tratamiento.
Uno de los problemas claves en la estimación del efecto del tratamiento sobre un resultado dado es la selección de variables por las que corregir14,15. La elección errónea de variables confusoras puede generar un sesgo, modificando la varianza del estimador o el error. En la decisión de la elección de variables se proponen 2 planteamientos:
- Planteamiento clínico, en el que la decisión está basada en el conocimiento de clínicos expertos, intentando establecer cuál es el diagrama causal entre la exposición y el evento. En otras palabras, la elección de cada variable se justifica mediante el conocimiento de un experto.
- Planteamiento estadístico, buscando qué variables se asocian estadísticamente de forma univariante con la exposición y/o con el evento. De esta forma tendríamos 3 posibles tipos de variables: variables que sólo se asocian con el evento/resultado, variables que sólo se relacionan con el tratamiento/exposición y variables que asocian con el resultado y con el tratamiento.
¿Qué variables incluir?
Variables que se relacionan con el resultado: su inclusión hace decrecer la varianza y mantiene el sesgo igual.
Variables que sólo se relacionan con la exposición: su inclusión hace que se incremente la varianza de la estimación y mantiene el sesgo igual. La finalidad de la elección de variables en un estudio con índice de propensión es reducir el sesgo del estimador del efecto del tratamiento, no maximizar la predicción del estatus de tratamiento. Por tanto, estas variables no deberían incluirse.
Variables que se relacionan con ambos: sí deberían incluirse.
Adecuación del modelo
Tradicionalmente la correcta adecuación del modelo de índice de propensión se ha testado mediante el índice C de Harrell (área bajo la curva ROC)16 asumiendo que índices C próximos a 1 reflejarían una adecuada medida de discriminación. Sin embargo, un valor alto del índice C es indicativo de solapamiento entre individuos experimentales y controles, lo cual puede indicar una falta de comparabilidad entre las características de los individuos tratados y no tratados.
Actualmente, los MEM están implementados mediante macros en software en SAS15, R17 y Stata18.
APLICACIÓN DE LOS MODELOS ESTRUCTURALES MARGINALES EN NEFROLOGÍA
Los MEM se han implementado en el campo de la medicina, incluido el área de la Nefrología, para dar rigor científico a los EO, especialmente cuando se evalúan variables dependientes del tiempo. A título de ejemplo, esta herramienta se utilizó inicialmente en pacientes con VIH10 en los que la carga viral o el recuento de CD4 pueden ser considerados como confusores dependientes del tiempo en la evaluación causal de un tratamiento retroviral, cuando aparece un nuevo acontecimiento de sida o en la muerte del paciente durante el curso evolutivo de la enfermedad.
En Nefrología, los MEM se han implementado para establecer la relación causal entre múltiples tratamientos o exposiciones y el pronóstico o desenlace final de una entidad. Múltiples EO han mostrado que los pacientes con altas dosis de eritropoyetina (EPO) tenían una elevada mortalidad, si bien los pacientes que requerían dosis más elevadas de EPO tenían mayor comorbilidad. La gran variabilidad en la dosis de EPO durante el seguimiento de los pacientes en diálisis hacía que los confusores fueran dependientes del tiempo, es decir, que los factores pronósticos pudieran ser marcadores para iniciar el tratamiento y estar afectados al mismo tiempo por el propio tratamiento. En un EO reciente, se investigó elegantemente la relación causal entre la dosis de EPO y la mortalidad mediante la aplicación de los MEM19. En este estudio, que incluyó 27.791 pacientes durante un seguimiento de 12 meses, la variable de exposición fue la dosis de EPO (categorizada en rangos), mientras que la variable final (end-point) fue la muerte del paciente o la pérdida de seguimiento. En el análisis final se incluyeron variables basales (edad, sexo, raza, tiempo en diálisis, presencia de diabetes, etc.) y variables evolutivas dependientes del tiempo (parámetros de laboratorio, medicaciones concomitantes, comorbilidad, etc.). Los niveles de hemoglobina pudieran ser a priori una variable confusora dependiente del tiempo, ya que niveles bajos de ésta favorecen la administración de dosis altas de EPO, la cual aumenta los niveles de hemoglobina. Por tanto, y dado que la hemoglobina pudiera estar en la cadena causal entre la EPO y la mortalidad, no se deberían utilizar en este caso los modelos convencionales de regresión para dilucidar esta asociación. Se evaluaron tres tipos de modelos incrementando el número de predictores asociados al uso de EPO para la buena especificación del modelo de estudio. Las variables que asociaron con la dosis de EPO de forma más directa fueron la hemoglobina previa, el tipo de acceso vascular y la comorbilidad, evaluada por las hospitalizaciones. La conclusión a la que llegan los autores es que, aunque el análisis más simple, corrigiendo sólo por hemoglobina e historia previa de uso de EPO, podría indicar que dosis muy altas de EPO (más de 49.000 IU en 2 semanas) se asocian con mayor mortalidad (hazard ratio [HR] = 1,51), este efecto desaparece (HR = 0,98) cuando se plantea un MEM más completo. En cualquier caso, este estudio no está exento de limitaciones importantes como la asunción de positividad, que exigiría una probabilidad distinta de 0 de recibir cualquiera de las dosis de EPO ante cualquier valor de hemoglobina, o la confusión residual al no incluirse en el modelo variables biológicas importantes (proteína C reactiva, recuento de linfocitos, etc.) que pudieran afectar el resultado final.
De manera similar, la aplicación de MEM en EO de pacientes con enfermedad renal avanzada ha proporcionado luz sobre algunos aspectos clínicos controvertidos de la terapia sustitutiva de la función renal. Concretamente, esta herramienta estadística ha permitido dilucidar que ni la restricción de fosfato en la dieta de estos pacientes ni el tipo de diálisis recibido (hemodiálisis vs. diálisis peritoneal) influyen decisivamente sobre la mortalidad de estos pacientes20,21. Por el contrario, una excesiva restricción de fósforo en la dieta pudiera acarrear un mayor riesgo de muerte en esta población. Asimismo, la aplicación de MEM en un EO multicéntrico holandés demostró que la pérdida de la función renal residual se asociaba a mayor mortalidad22. Esto respalda la posibilidad de aplicar una terapia renal sustitutiva individualizada en función del volumen urinario que tenga cada paciente al inicio del tratamiento dialítico crónico.
En el campo del trasplante renal, la utilidad de los MEM se ha centrado en testar el impacto de alteraciones metabólicas sobre la mortalidad y en evaluar la eficacia de fármacos inmunosupresores y medicación cardioprotectora sobre la supervivencia del paciente y del injerto renal. En efecto, el empleo de modelos de regresión de Cox y MEM, ajustando para variables confusoras, demostró que niveles elevados de glucemia o un tratamiento insulínico más intenso se asociaba a mayor mortalidad23. Empleando una metodología similar, se demostró que el uso de micofenolato mofetil proporcionaba una mayor supervivencia del injerto renal con respecto al empleo de azatioprina24. Finalmente, un EO reciente de nuestro grupo que incluyó 990 pacientes que recibieron un injerto renal entre 1996-2005 demostró, mediante un análisis de regresión de Cox con variables dependientes del tiempo, que el empleo de fármacos que bloquean el sistema renina-angiotensina (inhibidores de la enzima conversora de angiotensina [IECA] y antagonistas de los receptores de la angiotensina II [ARA II]) se asociaban a una reducción del riesgo de mortalidad (HR = 0,626, 95% intervalo de confianza [IC], 0,407-0,963), pero no de pérdida del injerto. Similares resultados fueron observados después de ajustar por variables confusoras para la indicación de IECA/ARA mediante el empleo de MEM (HR = 0,629, 95% IC, 0,407-0,973)25. Una vez más, estos hallazgos confirman la utilidad de la implementación de los MEM en los EO de cohortes de pacientes con enfermedades renales.
En resumen, la aplicación de MEM en los EO de cohortes que utilicen variables dependientes del tiempo puede proporcionar una información válida y complementaria a los EC a la hora de evaluar la eficacia clínica de un determinado tratamiento o exposición. Sin duda, esto ayudará a incrementar el nivel de evidencia de los EO en diferentes áreas de la medicina, incluida la Nefrología.
CONCEPTOS CLAVE
1. Los resultados de los EO pueden ser comparables a los de los ensayos clínicos en cuanto a evaluar la eficacia de un tratamiento o exposición, siempre que el diseño y el análisis de éstos sea adecuado y riguroso.
2. La existencia de variables clínicas confusoras, dependientes del tiempo, pueden conducir a sobreestimaciones o infravaloraciones del efecto del tratamiento cuando se emplean los modelos de regresión convencionales, incurriendo en la confusión por indicación.
3. Los MEM pueden evitar el sesgo de la confusión por indicación, pero tienen asunciones que deberían ser verificadas.
4. La elección de variables confusoras para la aplicación de MEM debe hacerse desde un planteamiento clínico y estadístico. La elección errónea de estas variables puede generar un sesgo que modifica la varianza del estimador.
5. A la hora de valorar la eficacia de un tratamiento mediante un EO, la aplicación de MEM puede incrementar el nivel de evidencia para su aplicación en la práctica clínica diaria.
Agradecimientos
Los autores agradecen la colaboración de la Unidad de Bioestadística del Hospital Ramón y Cajal (IRYCIS, Madrid; CIBER Epidemiología y Salud Pública CIBERESP) y la de los equipos de trasplante renal del Hospital Universitario de Canarias (Tenerife) y del Hospital Universitario Carlos Haya (Málaga). Este estudio fue financiado parcialmente por Instituto de Salud Carlos III Retic RD06/0016 (RedInRen), FIS PI070732 y FIS PI10/01020 del Ministerio Español de Ciencia e Innovación (MICINN), y por la Consejería de Salud del Gobierno de Andalucía (PI-0499/2009).
11267_19115_23989_es_11267_figura1.doc
Figura 1.
11267_19115_23990_es_11267_figura2.doc
Figura 2.
11267_19115_23991_es_11267_figura3.doc
Figura 3.