Al hilo del desarrollo de la evidencia acumulada a través de 25 años desde la irrupción de la eritropoyetina humana recombinante para el tratamiento de la anemia de la enfermedad renal crónica se comentan distintos fenómenos que han influido en la interpretación de esa evidencia: la aprobación y comercialización de la eritropoyetina sólo con ensayos no controlados y sin criterios de valoración de relevancia clínica, el peso indebido otorgado a estudios observacionales, el peso del razonamiento fisiopatológico frente a la evidencia empírica, la desvalorización de resultados de ensayos clínicos contrarios a lo esperado, los conflictos de intereses con la industria farmacéutica y el fracaso del aumento de la hemoglobina con agentes estimulantes de la eritropoyesis como variable sustituta de la reducción de la morbilidad y mortalidad. Se cuestionan las dianas terapéuticas actuales de las guías de práctica clínica a la luz de la presente evidencia. Por último, se proponen varias medidas para aplicar mejor las nuevas intervenciones terapéuticas que aparezcan en el futuro: su aceptación sobre la base de ensayos controlados y aleatorizados con criterios de valoración clínicos, mejor interpretación de la evidencia científica, desconfianza acerca de los criterios de valoración sustitutos, y freno a la influencia de la industria (farmacéutica y tecnológica) en la interpretación de la evidencia científica.
La historia de los agentes estimuladores de la eritropoyesis para el tratamiento de la anemia de la insuficiencia renal aporta múltiples enseñanzas. Algunas de ellas parecen ser difíciles de aprender, pues se repiten con más frecuencia de lo deseable. En este artículo se repasan algunas de esas enseñanzas, que sin duda podrán ser útiles para comprender mejor nuevas intervenciones terapéuticas que aparezcan en el futuro. El recorrido histórico de los agentes estimuladores de la eritropoyesis en los más de 25 años transcurridosdesde la producción de eritropoyetina por técnicas de ADN recombinante ha atravesado tres fases, el descubrimiento clínico de la eritropoyetina y su uso para evitar las transfusiones sanguíneas; el estudio de los efectos clínicos de la normalización de la hemoglobina; y la fase de recapitulación, en la que nos encontramos ahora.
PRIMERA FASE: EL DESCUBRIMIENTO CLÍNICO DE LA ERITROPOYETINA Y SU USO PARA EVITAR LAS TRANSFUSIONES DE SANGRE
La producción de eritropoyetina humana por técnicas de ADN recombinante en 19851, y con ella la posibilidad de generarla en cantidades importantes, supuso un cambio radical en el tratamiento de la anemia de la insuficiencia renal. Aunque el déficit de eritropoyetina es sólo una de las causas de la anemia de la insuficiencia renal, la reposición de la eritropoyetina cambiaría por completo el panorama del tratamiento de la anemia. Antes, dicho tratamiento se basaba en los andrógenos, de escasa eficacia y con efectos adversos, en el hierro, y en el uso de transfusiones de sangre, con sus riesgos añadidos, en particular los de infección y de sensibilización frente a antígenos de histocompatibilidad. Los dos primeros ensayos clínicos de eritropoyetina recombinante en seres humanos2,3, con 35 pacientes en total, tuvieron un impacto enorme. Demostraron que el tratamiento con eritropoyetina intravenosa en pacientes en hemodiálisis aumenta la hemoglobina y la eritropoyesis y elimina prácticamente las necesidades de transfusión sanguínea. Un ensayo posterior, de fase III, de 333 pacientes pero no controlado, centrado en la reducción de las transfusiones, en el aumento del hematocrito y también en la calidad de vida relacionada con la salud, dio resultados similares4. En 1989, la Food and Drug Administration (FDA) de EE.UU. aprobó la epoetina alfa para la insuficiencia renal crónica y poco después se aprobó en Europa y en otros lugares del mundo.
Estudios no controlados y sin criterios de valoración clínicos importantes
Sin embargo, estos estudios adolecían de dos limitaciones metodológicas importantes. La primera, que no tenían grupo de control con qué comparar. Hay situaciones clínicas en las que la aparición de un nuevo tratamiento no necesita de un grupo control para su comparación, ya sea porque el efecto terapéutico sea espectacular o porque no haya ninguna alternativa terapéutica, como sucede en las situaciones de «todo o nada». En estas situaciones, todos los pacientes morían antes de la puesta en marcha del nuevo tratamiento mientras que con éste algunos sobreviven, o bien morían bastantes pacientes antes del tratamiento y con él no muere ninguno. La diálisis, tanto para el tratamiento del fracaso renal agudo como para el tratamiento de la insuficiencia renal crónica terminal, es un buen ejemplo de esta situación de «todo o nada» y su incorporación al arsenal terapéutico no fue a través de ningún ensayo con grupo de control y con distribución aleatoria. La reducción de la necesidad de transfusiones de sangre es un objetivo importante, pero su importancia clínica no alcanza el significado de las situaciones de «todo o nada». Que los primeros ensayos clínicos publicados con la eritropoyetina2,3 carecieran de grupo de control no tiene mayor transcendencia, pues en muchas ocasiones los ensayos de fase I y de fase II, que evalúan las primeras administraciones de un medicamento a seres humanos o buscan un escalado de dosis para encontrar la dosis efectiva con menor tasa de efectos adversos, se diseñan sin grupo de control, ya que la información que obtienen es meramente preliminar. Estos ensayos reclutan a pocos sujetos, poseen un tiempo de seguimiento relativamente corto y evalúan criterios de valoración indirectos. Sin embargo, los ensayos posteriores de fase III deberían haber sido controlados, con criterios de valoración clínicos, por tanto, con tamaños de muestra mayores, y con tiempos de seguimiento prolongados. Los ensayos no controlados, más propiamente llamados incontrolados, como justificación de la práctica clínica, tienen unos efectos completamente desproporcionados para su propio valor intrínseco. La afirmación de Hugo Muensch de que «[n]ada mejor que la falta de controles para mejorar la eficacia de una intervención»5 cobra todo su sentido en el caso de la eritropoyetina.
La segunda limitación de estos ensayos, más importante aún, fue que los criterios de valoración principales en esos estudios no eran criterios clínicos relevantes (morbilidad y mortalidad) sino el aumento de la hemoglobina y la reducción de las transfusiones. Partían de la presunción de que la hemoglobina sérica es una variable sustituta (indirecta o «subrogada») suficientemente válida de una mejoría clínica que se traduce en una menor morbilidad y mortalidad.
Al igual que el ensayo de Eschbach, et al.4 otros tres ensayos publicados poco después tampoco fueron controlados6-8. No así el Canadian Erythropoietin Study Group, un ensayo controlado con placebo publicado en 19909 y varios ensayos posteriores10,11. Los dos ensayos preliminares2,3 detectaron diversos efectos adversos, como la trombosis del acceso vascular y el agravamiento de la hipertensión, con un caso de encefalopatía hipertensiva. Estos efectos adversos justificaban un enfoque comparativo con un grupo de control que recibiera placebo y con variables clínicas importantes como criterio de valoración principal. Pero la autorización del medicamento se produjo cuando no había una base suficiente para la toma de decisiones clínicas informadas. Quedaban aspectos importantes sin estudiar, como cuándo comenzar el tratamiento con eritropoyetina, la diana terapéutica de hemoglobina con mayor beneficio y menor riesgo, la mejor vía de administración (intravenosa o subcutánea), y el papel y la vía de administración del hierro como tratamiento adyuvante. Aunque estas dos últimas cuestiones se podrían resolver después de la comercialización, la indefinición inicial acerca de la mejor diana condicionaría los acontecimientos posteriores. La autorización y la comercialización de la eritropoyetina que pusieron en el mercado un tratamiento disponible eficaz para la anemia llevaron a un empleo masivo de la eritropoyetina en las unidades de diálisis y en las consultas externas de nefrología.
En esta primera fase también se efectuaron varios ensayos para evaluar el efecto del tratamiento con eritropoyetina en la mejoría de la calidad de vida relacionada con la salud de los pacientes con insuficiencia renal crónica en diálisis. Pero los primeros ensayos que evaluaron la influencia de la eritropoyetina en la calidad de vida fueron estudios no controlados4,12,13, así como estudios posteriores14, con la excepción del ensayo del Canadian Erythropoeitin Study Group9.
SEGUNDA FASE: ESTUDIO DE LOS EFECTOS DE LA NORMALIZACIÓN DE LA HEMOGLOBINA
En los 10 años posteriores a los primeros ensayos publicados, se publicó un pequeño ensayo que evaluaba la morbilidad y la mortalidad de los pacientes en hemodiálisis en tratamiento con eritropoyetina10, pero sin potencia estadística suficiente para ello; también se publicaron otros ensayos clínicos de pequeño tamaño centrados en el tratamiento de la anemia en los pacientes en diálisis peritoneal11 o en pacientes en prediálisis15,16. Para entonces, prácticamente todos los pacientes en diálisis con anemia recibían tratamiento con agentes estimulantes de la eritropoyesis. Sin ninguna evidencia que lo respaldara, la mayoría de los pacientes presentaban hemoglobinas entre 9 y 11 g/dl, y sólo unos pocos tenían hemoglobinas superiores17. Fue entonces cuando ganó peso la hipótesis, formulada ya desde el principio, de que una normalización completa de la anemia mejoraría el desenlace clínico de los pacientes, en términos de morbilidad y de mortalidad. A su favor, el conocido efecto de la anemia en la génesis de la hipertrofia ventricular izquierda, la intolerancia al ejercicio y la insuficiencia cardíaca.
El primer ensayo que se publicó para evaluar el efecto de la normalización del hematocrito fue el Normal Hematocrit Study, publicado en 1998 y financiado por Amgen17. Este ensayo, el de mayor tamaño realizado hasta ese momento, incluyó sólo a pacientes en hemodiálisis con aumento del riesgo cardíaco, como cardiopatía isquémica o insuficiencia cardíaca. Este estudio se suspendió prematuramente al observarse, en contra de lo esperado, un aumento de mortalidad en el grupo asignado a la normalización del hematocrito, aunque estadísticamente no significativo. La recepción de estos resultados en la comunidad nefrológica fue muy escéptica y desconfiada18-20. Se dijo que los resultados del Normal Hematocrit Study, al centrarse en pacientes con enfermedad cardíaca, no eran aplicables a pacientes jóvenes sin comorbilidad asociada, lo cual era cierto en sentido estricto, pero ignoraba el hecho de que en la población joven sin comorbilidad no se disponía de ninguna evidencia en favor de la normalización de la hemoglobina: la ausencia de evidencia no podía llevar a defender su normalización en esa población.
El peso del razonamiento fisiopatológico
Esta reacción tiene que ver con una tendencia, todavía muy poderosa, a primar las consideraciones fisiopatológicas sobre la evidencia científica. El movimiento de la medicina basada en la evidencia se propuso desde sus inicios primar la evidencia científica21, pero lamentablemente este propósito está aún lejos de hacerse realidad. Si la anemia de la insuficiencia renal tiene mucho que ver con el déficit de producción de eritropoyetina, es difícil sustraerse a la idea de que la reposición terapéutica de la eritropoyetina corregirá la anemia, al igual que la diálisis elimina el exceso de urea y potasio, con lo que el organismo vuelve a una situación más próxima a su equilibrio fisiológico. Esta idea tiene tanta lógica que lleva a un segundo plano la necesidad de comprobar empíricamente en la práctica que eso es así efectivamente. Y cuando la evidencia empírica es contraria a la lógica fisiopatológica, se cuestiona la validez de la evidencia antes de poner en cuestión esa lógica. Esto tiene que ver también con que los clínicos estamos acostumbrados a razonar primordialmente con mecanismos fisiopatológicos, sin que las consideraciones epidemiológicas o estadísticas posean demasiada relevancia.
Sesgos de los estudios observacionales
Otra razón muy importante para defender la idea de la normalización de la hemoglobina es la pléyade de estudios observacionales, de cohorte, que sistemáticamente han demostrado una mayor supervivencia en los pacientes en diálisis con mayores niveles de hemoglobina22-26. De ellos se podría inferir, equivocadamente, que si hay asociación habrá causalidad, cuando los estudios de cohorte nunca permiten establecer dicha causalidad de modo fehaciente. Que los pacientes con menor anemia se mueren menos no ha de deberse necesariamente al hecho de que la anemia constituya un factor de riesgo causal de muerte sino puede deberse también a que esa asociación está confundida por un tercer factor, un factor de confusión, que se asocia a la anemia y que, a su vez, aumenta la mortalidad. Alternativamente, podría ocurrir que la anemia fuera la causa real del incremento de mortalidad, pero de ahí no se desprende la idea de que cualquier procedimiento que corrija la anemia mejora la mortalidad. Obviamente, habrá que demostrar de manera empírica que eso es así con la intervención particular con la que se quiera corregir la anemia, mediante ensayos controlados y con distribución aleatoria. Que la eritropoyetina recombinante sea una hormona que produce el organismo en condiciones normales no significa que no deba estudiarse de forma empírica su administración terapéutica. En muchas ocasiones se olvida que a la hora de interpretar la evidencia existe una diferencia crucial entre los estudios de cohorte y los ensayos controlados y con distribución aleatoria: a diferencia de los estudios de cohorte, los ensayos controlados y aleatorizados sí pueden establecer relaciones causales más sólidas, siempre que se descarte el papel del azar en las asociaciones, pues un ensayo controlado y aleatorizado válido, por su propio diseño, apenas tiene sesgo de selección o confusión.
Posteriormente, se publicaron varios ensayos más que comparaban el efecto de dianas altas y dianas bajas de hemoglobina en la morbilidad, todos de escasa potencia para detectar diferencias en la mortalidad, en pacientes en diálisis27-29 y en prediálisis28,30-32. Pero en 2006 se publicó el ensayo mayor hasta entonces, el ensayo Correction of Hemoglobin and Outcomes in Renal Insufficiency, CHOIR, estadounidense, con epoetina alfa, financiado por Ortho Biotech y Johnson & Johnson33, junto con otro ensayo de menor tamaño, el ensayo Cardiovascular Risk Reduction by Early Anemia Treatment with Epoetin-beta, CREATE, efectuado en Europa, Asia y México, financiado por F. Hoffmann-Roche34, ambos en pacientes en prediálisis. Los resultados de estos ensayos, que comparaban la normalización de la anemia con una corrección parcial con respecto a varias criterios de valoración clínicos, fueron decepcionantes para la hipótesis en favor de la normalización de la anemia: hubo más sucesos clínicos en el grupo de la normalización de la hemoglobina que en el de la diana menor en el ensayo CHOIR, motivo por el que se paró prematuramente, y no hubo reducción de sucesos clínicos con la normalización de la hemoglobina en el ensayo CREATE, en donde el número de sucesos cardiovasculares y de casos que llegaron a diálisis fue mayor con la normalización de la hemoglobina.
Desvalorización de los resultados contrarios a lo esperado
Alguna reacciones de la comunidad nefrológica fueron también de cierta incredulidad, a modo de repetición de lo que había sucedido con el ensayo Normal Hematocrit Study35-37. Un comentario crítico de Levin36, centrado en los aspectos metodológicos de los ensayos CREATE y CHOIR, fue contestado correctamente por los autores del ensayo CHOIR38. El propio comentario de Levin muestra incoherencias que traslucen una importante preferencia por la hipótesis de la normalización: por ejemplo, señala que el aumento de casos con indicación de diálisis en el grupo de la normalización de la hemoglobina del ensayo CREATE pudo deberse a un sesgo de información generado por la ausencia de enmascaramiento (los médicos que sabían que el paciente no tenía anemia indicarían la diálisis antes que en el paciente con anemia, en quien demorarían la entrada en diálisis hasta después de corregirla)36; sin embargo, hace caso omiso del sesgo inducido por la falta de enmascaramiento para interpretar los mejores resultados en la calidad de vida relacionada con la salud observados en el grupo de normalización de la anemia.
En 2007 apareció un metanálisis para evaluar la asociación entre las dianas de hemoglobina y la mortalidad, con la información de los ocho ensayos controlados y aleatorizados publicados hasta entonces, con más de 5.000 pacientes39. En este metanálisis, que incluía tanto ensayos en diálisis como en prediálisis, la razón de riesgos de mortalidad con dianas altas fue de 1,17 (intervalo de confianza [IC] del 95%, 1,01 a 1,35). Merece la pena señalar que no había heterogeneidad en sus resultados, es decir, no había diferencias apreciables entre los resultados de unos ensayos y otros. Un «Editorial» que acompañaba al metanálisis40 indicó que el aumento de mortalidad se debía fundamentalmente al incremento de sucesos cardiovasculares graves. Además, señaló que, dada la fuerza de la evidencia que aportaba este metanálisis, dejaba de tener sentido seguir investigando el posible beneficio de intentar conseguir una diana alta, pues estaba demostrado que era perjudicial; en su lugar, habría que diseñar ensayos con otros propósitos, como la comparación de distintas dosis de agentes estimulantes de la eritropoyesis, con independencia de la diana de hemoglobina, para evaluar el efecto de la dosis. Este comentario pedía la suspensión del ensayo TREAT, entonces en marcha, o una justificación pública de las razones de su continuación. El metanálisis de Phrommitntikul, et al. no fue bien recibido por muchos nefrólogos: la crítica principal que recibió fue la de mezclar en el mismo metanálisis a los pacientes en diálisis con los pacientes en prediálisis41-43; sin embargo, el metanálisis careció de heterogeneidad, de modo que los resultados en contra de la normalización de la anemia fueron similares en pacientes en diálisis y en prediálisis. Y se puede argüir que los pacientes en prediálisis y en diálisis componen un continuo en lo que respecta a la anemia de la insuficiencia renal44. Con respecto a la suspensión o continuación del ensayo TREAT en marcha, varios nefrólogos defendieron su continuación35,36,41. Los propios investigadores del ensayo TREAT así lo hicieron públicamente45, con el argumento de que el comité de vigilancia de datos y seguridad del ensayo no había encontrado evidencia convincente para recomendar la modificación o la finalización del ensayo y acusó a la petición del «Editorial» que pedía la suspensión del ensayo de irresponsable y de querer usurpar el papel del comité nombrado de vigilancia de datos y seguridad; acusación sorprendente, pues es contraria al ambiente de crítica abierta que debe prevalecer en el mundo científico. Por un lado, la evidencia parecía lo suficientemente poderosa como para desaconsejar la continuación del ensayo TREAT, a la luz de los ensayos efectuados hasta ese momento y del metanálisis resumen de ellos (junto con la evidencia complementaria de los efectos nocivos de la corrección de la anemia con agentes estimulantes de la eritropoyetina en pacientes con cáncer46); sin embargo, en la comunidad nefrológica no había un suficiente acuerdo en favor de ello, todavía se confiaba en que surgieran pruebas en favor de la normalización de la anemia.
El papel de los conflictos de intereses con la industria farmacéutica
Otro factor añadido que intervino en la interpretación de los ensayos efectuados para evaluar los agentes estimulantes de la eritropoyesis fue la influencia de las guías de práctica clínica en el mantenimiento de la hipótesis de la normalización de la hemoglobina. Las guías K/DOQI, tras recomendar en 1997 una diana de hemoglobina entre 11 y 12 g/dl47 (enmendando la ficha técnica de la FDA, que recomendaba entre 10 y 12 g/dl), actualizaron en 2006 su recomendación para establecer una diana mínima en 11 g/dl mientras señalaban que no había evidencia en favor de una diana superior a 13 g/dl, lo que suponía en la práctica elevar la diana al rango 11-13 g/dl48. Ya se habían publicado varias revisiones sistemáticas que no encontraban ninguna evidencia en favor de la normalización de la hemoglobina49-51, y aunque todavía no se habían publicado los ensayos CHOIR y CREATE, sus resultados ya eran conocidos para los redactores de las guías K/DOQI de anemia. Lo grave de la modificación fue que se produjo sin ninguna evidencia que la sustentara, más bien al contrario, la evidencia se inclinaba en contra de dianas altas, aunque de modo impreciso, pues unos ensayos habían empleado 12 g/dl y otros 13 g/dl. Esta modificación en ausencia de evidencia produjo un gran escándalo y se atribuyó en parte a la existencia de conflictos de intereses: la National Kidney Foundation, promotora de la guía K/DOQI, recibió más de la mitad de sus ingresos de compañías privadas y la mayoría de los autores de las guías tuvieron vínculos financieros con compañías fabricantes o vendedoras de agentes estimulantes de la eritropoyesis52. En marzo de 2007 la FDA cambió el etiquetado de los agentes estimulantes de la eritropoyetina y añadió una advertencia de que se debería evitar que la hemoglobina superara los 12 g/dl debido al aumento en el riesgo de muerte y sucesos cardíacos graves, mientras que recordaba que sólo deberían emplearse para elevar la hemoglobina por encima del nivel mínimo para evitar transfusiones de sangre. En septiembre de 2007, la K/DOQI modificó la guía y recomendó una diana entre 11 y 12 g/dl53. La posición de la guía europea fue algo distinta, pues ya desde 2004 recomendaban que la hemoglobina mínima estuviera en 11 g/dl con el límite superior establecido en 14 g/dl, excepto en pacientes con enfermedad cardiovascular, en quienes el límite se fijó en 12 g/dl54; aunque fuera mediante una subvención sin restricción, lo cierto es que las principales compañías vendedoras de agentes estimulantes de eritropoyesis habían financiado la elaboración y redacción de la guía54. En 2009 se publicó una actualización en la que se fijaba la diana en un rango comprendido entre 11 y 12 g/dl, sin que la diana sobrepasase de 13 g/dl intencionadamente, y esta recomendación se aplicaba a todo tipo de pacientes con enfermedad renal crónica55. La sombra de la influencia de los conflictos de intereses en la elaboración de las guías de práctica clínica generó sospechas que nunca deberían haberse producido56-58. También parece que los conflictos de intereses tuvieron un papel en el rechazo de The New England Journal of Medicine a la publicación de un artículo «Editorial» de Robert Steinbrook acerca de la publicación de los ensayos CREATE y CHOIR, que era muy crítico con la financiación de las guías K/DOQI por la industria farmacéutica; el «Editorial» fue publicado poco después en The Lancet59.
TERCERA FASE: RECAPITULACIÓN
La publicación del ensayo Trial to Reduce Cardiovascular Events with Aranesp Therapy, TREAT, ha abierto una nueva fase. La polémica no ha concluido, pero es muy improbable que se recojan más datos sobre la cuestión de la diana alta de hemoglobina y el peso de la evidencia es ahora muy superior y prácticamente incuestionable. TREAT fue el ensayo más grande hecho nunca, multinacional, financiado por Amgen, con 4.038 sujetos con diabetes, enfermedad renal crónica sin diálisis y anemia, que fueron aleatorizados a recibir en un régimen doble ciego darbepoetina alfa para alcanzar una hemoglobina de 13 g/dl o placebo, con rescate de darbepoetina si la hemoglobina bajaba de 9 g/dl; quizás el diseño que debería haberse planteado desde la irrupción de la eritropoyetina recombinante, más de 20 años antes. De haberse hecho entonces, con bastante probabilidad se habría evitado bastante morbilidad y los costes sanitarios se habrían reducido en gran medida60,61. Hubo dos criterios de valoración principales, ambos compuestos, muerte por cualquier causa o un suceso cardiovascular (infarto de miocardio, insuficiencia cardíaca, ictus u hospitalización por isquemia miocárdica) y muerte o insuficiencia renal terminal. El tiempo mediano de seguimiento fue de casi 2,5 años. Ninguno de los dos grupos alcanzó las dianas previstas (mediana de 12,5 g/dl en el grupo de 13 g/dl y mediana de 10,6 g/dl en el grupo placebo). Hubo un número mayor de muertes por cualquier causa en el grupo de darbepoetina y de los criterios de valoración principales (razón de riesgos instantáneos 1,05 en ambos casos), sin alcanzar significación estadística. Sí se observó un aumento significativo del número de ictus en el grupo de la darbepoetina (razón de riesgos instantáneos 1,92, IC 95%, 1,38 a 2,68). El grupo de la darbepoetina tuvo menos episodios de revascularización cardíaca y más de muertes por cáncer y de episodios de tromboembolismo62.
Como en ocasiones anteriores, el ensayo desencadenó la polémica. Por una parte, quienes aceptaban la evidencia y reflexionaban acerca de las causas del fracaso de la hipótesis de la normalización de la anemia: velocidad demasiado rápida en el aumento de la hemoglobina, oscilaciones en sus niveles o concentraciones que sobrepasan los niveles diana63, aumento de la viscosidad o un incremento de la hipertensión, inducidos por los agentes estimulantes de la eritropoyesis, toxicidad generada por el hierro o toxicidad directa producida por los propios agentes estimulantes de la eritropoyesis64. El papel nocivo de dosis aumentadas de los agentes estimulantes de la eritropoyesis, por mecanismos escasamente comprendidos todavía, se sugiere como hipótesis en un análisis secundario y, por tanto, observacional y sujeto a confusión, del ensayo CHOIR65 y en otros trabajos66-68, aunque es una cuestión abierta, pues pueden intervenir los fenómenos de la confusión por indicación (que aquellos pacientes que reciben dosis más altas son los que tienen mayor comorbilidad) y la confusión por los cambios temporales69-73.
Nueva desvalorización de los resultados contrarios a lo esperado
Por otra parte, hubo autores que interpretaron que los resultados perjudiciales del ensayo TREAT para el grupo de la normalización de la anemia (aumento del ictus y de las muertes por cáncer) pudieron ser fenómenos debidos meramente al azar, pues no eran criterios de valoración principales del ensayo74. Aunque es cierto que esos resultados pueden deberse al azar, su interpretación no puede ignorar el resto de la evidencia disponible (el aumento de las muertes por cáncer cuando se administran agentes estimulantes de la eritropoyesis75,76 y el metanálisis de todos los ensayos con respecto a la incidencia de ictus, con una razón de riesgos de 1,51 en el grupo de la diana alta con respecto a la diana baja (IC 95%, 1,03 a 2,21)77. Otro argumento en favor de la hipótesis de la normalización de la anemia tras el ensayo TREAT fue que sus resultados sólo se deberían aplicar a la población de pacientes diabéticos en prediálisis, que fue la población de estudio74,78,79. Este argumento, semejante al esgrimido cuando se publicó el ensayo Normal Hematocrit Trial acerca de los pacientes con riesgo cardiovascular, no tiene en cuenta que la elección de los pacientes con más riesgo para su inclusión en los ensayos se hace por razones operativas (al tener más riesgo de muerte, aumenta la potencia del estudio para detectar diferencias), y que en los ensayos clínicos es muy raro que haya diferencias apreciables en los riesgos relativos entre los distintos subgrupos (diabéticos y no diabéticos, prediálisis y diálisis, por ejemplo), a diferencia de sus riesgos absolutos, de modo que quien plantea el argumento ha de demostrar empíricamente que existen esas diferencias80. La ausencia reiterada de heterogeneidad entre las distintas poblaciones de los distintos metanálisis hace muy improbable que existan diferencias entre esos subgrupos.
El trabajo más relevante publicado recientemente ha sido el metanálisis actualizado que engloba todos los ensayos efectuados para comparar dianas altas con dianas bajas de hemoglobina, que amplía los metanálisis previos para incorporar los del ensayo TREAT77. Sus resultados son concluyentes en contra del beneficio de la diana alta: en comparación con la diana baja, la razón de riesgos de mortalidad es de 1,09 (IC 95%, 0,99 a 1,20), la razón de riesgos de sucesos cardiovasculares importantes es de 1,15 (IC 95%, 0,98 a 1,33), la de ictus ya se ha mencionado, la de hipertensión 1,67 (IC 95%, 1,31 a 2,12), la de trombosis del acceso vascular 1,33 (IC 95% 1,16 a 1,53) y la de insuficiencia renal terminal que requiere tratamiento renal sustitutivo 1,08 (IC 95%, 0,97 a 1,20). Estos resultados muestran que el propósito de conseguir dianas altas conduce a algunos sucesos nocivos y no se reducen otros sucesos clínicos importantes. El mismo trabajo hace un metanálisis acumulado, en el que se señala que tras el ensayo del Normal Hematocrit Trial, con 1.718 pacientes, ya se obtuvo prácticamente la misma información acerca de la mortalidad que tras el ensayo TREAT, pero después participaron 8.233 pacientes más en 12 ensayos durante 11 años77. El metanálisis aborda expresamente las posibles diferencias entre los subgrupos y no encuentra ninguna diferencia apreciable en los pacientes con enfermedad renal crónica en prediálisis o los pacientes en diálisis, ni entre los diabéticos y los no diabéticos. El único beneficio que observa con la administración de los agentes estimulantes de la eritropoyesis es la reducción de las transfusiones.
Sin apenas evidencia acerca del efecto de los agentes estimulantes de la eritropoyesis en la mejora de la calidad de vida
Los defensores de la normalización de la anemia han afirmado siempre que el tratamiento con agentes estimulantes de eritropoyetina mejoraba la calidad de vida relacionada con la salud de los pacientes con enfermedad renal crónica. Lo cierto es que muchos de los estudios efectuados han sido no controlados, con sus sesgos consiguientes, y los pocos ensayos controlados y aleatorizados que han abordado esta cuestión han presentado muchos problemas metodológicos (ausencia de enmascaramiento, con los consiguientes sesgos de información; ausencia de hipótesis previas, con descripción selectiva de los resultados, con su efecto sobrestimador; ausencia de un instrumento universal de medida de la calidad de vida; múltiples comparaciones con el riesgo del aumento del error estadístico de tipo I). Recientemente se han publicado varias revisiones sistemáticas: dos de ellas, financiadas por Amgen, reúnen tanto ensayos aleatorizados como estudios no controlados, de modo que su validez es cuestionable81,82; de los otros dos, una es una revisión sistemática con metanálisis83 y encuentra con las dianas altas de hemoglobina una mejoría escasa en la función física, salud general, vitalidad y salud mental, sin significación clínica, mientras que la otra, sin metanálisis, corrobora esos resultados77.
La hemoglobina como variable sustituta equivocada
Los resultados de los ensayos para normalizar la hemoglobina en la anemia de la insuficiencia renal crónica han demostrado que es una equivocación tomar a la hemoglobina como variable sustituta de mortalidad, al menos con los agentes estimulantes de la eritropoyesis. Una variable sustituta debe asociarse con el efecto clínico buscado (a mayor hemoglobina, menor morbilidad y mortalidad), pero también debe responder a las intervenciones terapéuticas de un modo concordante con el efecto clínico buscado (si la búsqueda de una hemoglobina alta supusiera la reducción de la morbilidad y la mortalidad), lo que no sólo no se cumple en este caso, sino que se da el efecto contrario68. Volvemos al principio: los 25 años transcurridos desde la fabricación de la eritropoyetina humana recombinante han descansado en el equívoco del valor del aumento de la hemoglobina mediante agentes estimulantes de la eritropoyesis como variable sustituta de mortalidad y es hora de reconsiderar todo desde el inicio. La pregunta que se formula ahora es: ¿son válidas las recomendaciones de la FDA, de la Agencia Europea de Medicamentos (EMA) y de las guías K/DOQI y europeas con respecto a situar la diana de la hemoglobina en 10-12 g/dl o en 11-12 g/dl, o tienen que modificarse? Si juzgamos a partir de la fuerza de la evidencia, las dianas recomendadas nunca se han validado con respecto a un grupo placebo y con criterios de valoración cardiovasculares en ningún ensayo controlado y aleatorizado: la mejor evidencia disponible está en el grupo control del ensayo TREAT, es decir, el mínimo para reducir las transfusiones, de modo que las recomendaciones actuales (10-11 a 12 g/dl) deberían rebajarse a niveles más conservadores68,84-86 mientras no se disponga de mejor evidencia. Pero la polémica sobre este asunto no está cerrada74,79.
En resumen, el auge y el posterior declive parcial del uso de agentes estimulantes de la eritropoyesis son consecuencia de una acogida entusiasta desde su inicio, basándose en beneficios indirectos, como la reducción de la necesidad de transfusiones, pero sin correlato clínico suficiente en criterios de morbilidad y mortalidad; de una interpretación sesgada de la evidencia científica con respecto a los beneficios y riesgos de estos agentes, y de la influencia indebida de la industria farmacéutica, sobre todo en la elaboración de las guías de práctica clínica. Aunque han permitido reducir en gran medida la necesidad de transfusiones en la enfermedad renal crónica, también han podido inducir un aumento ciertamente importante en la morbilidad y quizá en la mortalidad y sin duda han generado un coste económico adicional no justificado a los sistemas públicos de salud.
PROPUESTAS
Las siguientes medidas que se proponen podrían contribuir a evitar que en el futuro se repitan situaciones parecidas:
1. La aceptación de nuevas intervenciones terapéuticas debe hacerse sobre la base de ensayos controlados y aleatorizados suficientemente potentes, que evalúen criterios de valoración con suficiente relevancia clínica. Esto significa que las agencias reguladoras (FDA, EMA, la Agencia Española de Medicamentos y Productos Sanitarios) tienen una especial responsabilidad, pues no deben hacer aprobaciones prematuras y, una vez aprobadas las intervenciones, deben exigir a los promotores suficientes estudios de seguimiento para asegurar que la relación beneficio/riesgo sea favorable. Pero también es responsabilidad de los clínicos tomar con cautela todas las innovaciones que aparezcan y exigir la evidencia suficiente para su aplicación masiva.
2. Se debe aprender a interpretar mejor la evidencia científica: la evidencia empírica debe prevalecer siempre sobre los razonamientos fisiopatológicos, la evidencia de los ensayos clínicos debe prevalecer sobre la aportada por los estudios observacionales, y en la mayoría de las ocasiones la evidencia de las revisiones sistemáticas debe prevalecer sobre la aportada por los ensayos individuales.
3. Se ha de desconfiar de los criterios de valoración sustitutos de sucesos clínicos importantes y relevantes, en particular cuando no se han validado suficientemente. Son pocas las variables sustitutas adecuadas y se han de buscar, en la medida de lo posible, criterios de valoración clínicos sólidos e incuestionables.
4. Se ha de impedir que la industria (farmacéutica o tecnológica) influya en la interpretación de la evidencia científica. No tiene sentido que la industria financie la elaboración de guías de práctica clínica, pues hay conflictos de intereses evidentes. Tampoco tiene sentido que financie el diseño y ejecución de revisiones sistemáticas. Idealmente, la investigación de aspectos clínicos relevantes debería hacerse con fondos públicos y la efectuada con fondos privados debe someterse a un escrutinio público independiente.