Constituye una aspiración irrenunciable de la medicina actual reclamada por todos sus protagonistas (enfermos, profesionales y administraciones), el que los actos médicos se sustenten en conocimientos científicos obtenido de procesos de investigación clínica rigurosa.
Por otra parte, sobre todo desde el surgimiento de internet y su imparable desarrollo, las posibilidades de difusión del conocimiento clínico se han multiplicado de forma exponencial (revistas, sitios web, cursos on line, etc.). Paradójicamente, esta inflación de medios, y otros fenómenos (heterogeneidad en calidad y formato, complejidad metodológica, sesgos, márketing, etc.) que hemos analizado en un trabajo previo1,2, explican la dificultad que tiene el médico para identificar los avances clave de investigación clínica que le permitan seleccionar con rigor los mejores instrumentos disponibles para el cuidado de sus enfermos.
Éste es el sentido de la metodología que ha ido desarrollándose en las últimas dos décadas (y que se ha dado en llamar Medicina Basada en la Evidencia) para proporcionar al profesional sanitario técnicas de evaluación de la calidad e impacto clínico del conocimiento contenido en la literatura médica, así como de documentos de síntesis que le permitan un acceso fácil y riguroso a éste. Entre éstos, tienen especial relevancia las revisiones sistemáticas (RS) y las guías de práctica clínica (GPC).
Las RS se realizan siempre como respuesta a problemas clínicos concretos, utilizando una metodología estructurada y sistemática para el análisis de la información, valoración crítica de los estudios y síntesis de éstos. Este rigor metodológico las diferencia positivamente de las revisiones clásicas de la literatura científica3-6.
CALIDAD DE LA EVIDENCIA Y GRADOS DE RECOMENDACIÓN
El estudio de una pregunta clínica mediante una RS puede concluir que no existen trabajos de investigación que avalen la respuesta o que éstos son escasos y de baja calidad o bien que diferentes estudios presentan resultados inconsistentes entre sí (sin causa justificada), ofreciendo escasa confianza en la validez de los mismos. Por el contrario, la intervención analizada puede estar refrendada por un metanálisis de alta calidad, que incluye el estudio de varios ensayos clínicos aleatorizados, multicéntricos, rigurosamente realizados, proporcionando su agregación un resultado muy preciso y, por tanto, de gran valor probatorio de su utilidad clínica.
De esta forma, las RS proporcionan resultados muy objetivos y reproducibles, que pueden ordenarse en niveles de calidad de la evidencia, que indican la confianza en que los valores inducidos por la intervención sobre las variables de resultado se aproximen al real en cada caso, y cuál será el efecto promedio esperable. Esta clasificación es enormemente útil para calificar la validez de cualquier intervención y para objetivar las «zonas grises» en las que el conocimiento clínico es muy escaso y que necesitan más investigación7-9.
La jerarquización de la evidencia, además de ofrecer una síntesis rápida y objetiva de la calidad metodológica del conjunto de trabajos de la literatura científica sobre una determinada intervención, constituye una de las bases para la definición de las recomendaciones utilizadas en las GPC10-13.
La mayoría de las sociedades científicas establecen, como uno de sus más importantes objetivos, la realización de GPC para reducir la variabilidad de la práctica clínica, fenómeno muy relevante en nuestra especialidad14-17. Con ello se pretende establecer patrones de actuación que mejoren los niveles asistenciales, aunque el tema no está exento de polémica8-10,17-20. En nefrología, el trabajo DOPPS (Dialysis Outcomes and Practice Patterns Study) muestra cómo pueden mejorar las variables de resultado en pacientes en los que se sigue una serie de indicadores marcados por las GPC21. La Sociedad Española de Nefrología (S.E.N.) ha potenciado su propia línea de guías clínicas y recomendaciones22.
En las GPC, además del concepto de calidad de la evidencia, se introduce el de grado o fuerza de la recomendación que sustenta una propuesta de intervención10-13. Ambos conceptos, aunque relacionados y complementarios, se ocupan de aspectos distintos. La fuerza de una recomendación se apoya, decisivamente, en la calidad de la evidencia que la sustenta, ya que un alto nivel de recomendación debe basarse en la buena calidad metodológica de los trabajos analizados. Pero esto no es suficiente porque puede existir un alto nivel de evidencia del resultado beneficioso de una determinada intervención, pero la magnitud del efecto puede ser irrelevante clínicamente y no recomendable. Por tanto, es importante distinguir la significación estadística de la importancia clínica y mostrar objetivamente la magnitud del efecto sobre las variables primarias y su precisión (que se relaciona estrechamente con el tamaño muestral). Y, por último, el elemento más importante para decidir el grado de recomendación depende de la solución del binomio beneficio/perjuicio neto para la salud resultante de un análisis de varios factores (magnitud del efecto y daño), pero también de otros, como disponibilidad social y coste23,24.
El objetivo fundamental de este trabajo consiste en analizar los principales sistemas de jerarquización de la evidencia y sus problemas, deteniéndonos fundamentalmente en el recientemente propuesto sistema GRADE23-28.
SISTEMAS DE JERARQUIZACIÓN DE LA EVIDENCIA Y GRADOS DE RECOMENDACIÓN
Desde el lanzamiento de las primeras GPC hace más de tres décadas19,29 se han utilizado numerosas escalas de gradación de la evidencia, que se caracterizan por su heterogeneidad y la presencia, en muchas de ellas, de serias deficiencias que impiden reflejar, con rigor, la calidad de los trabajos en los que se fundamentan las recomendaciones de práctica clínica. La mayoría adoptó un enfoque muy simple, fácil de entender, de aplicar y de presentar en los escritos de recomendaciones, lo que explica su éxito y difusión29-32. Pero, en la mayor parte de los casos, el grado de evidencia se fija, casi exclusivamente, por el tipo de diseño de los estudios, considerando muchas de ellas que el ensayo clínico es la única garantía de acreditación de la intervención, sin tener en cuenta el análisis de calidad de los estudios o su consistencia y marginando completamente a los estudios observacionales29-34. Por otra parte, la mayoría adolece de un déficit de reproducibilidad: en el trabajo de Ferreira et al.35 se muestra que la utilización de diferentes sistemas de jerarquización de la evidencia puede conducir a la formulación de distintas propuestas de actuación clínica en un mismo asunto.
En las primeras descripciones del grupo de medicina basada en la evidencia, publicadas en la revista JAMA36,37, se establecen escalas de gradación de la evidencia que atienden, no sólo al tipo de diseño, sino también a cuestiones que se derivan de la calidad de éste y se acompañan de protocolos para graduar la fuerza de las recomendaciones. Una de las que ha adquirido mayor nivel de consenso y difusión ha sido la elaborada por el Centro de Medicina Basada en la Evidencia de la Universidad de Óxford (OCEBM)38. En ésta se distinguen cinco niveles de evidencia y cuatro grados de recomendación. El pilar básico de la clasificación continúan siendo los tipos de diseño. Para los artículos que estudian intervenciones sobre tratamiento, el nivel más alto de la escala lo ocupan las revisiones sistemáticas de ensayos clínicos aleatorizados (ECA), especialmente aquéllos de alta calidad metodológica. Pero éstos pueden situarse en niveles de evidencia I o II, según la calidad de los trabajos. Los estudios observacionales se sitúan en un nivel inferior de evidencia (grados II a IV) sólo por encima de las opiniones de expertos o documentos de consenso (grado V), aunque se incluye el fenómeno «todo o nada» (all & none) en un nivel alto de evidencia (I c), para incluir a los estudios observacionales que muestran una importante magnitud del efecto que deja sin viabilidad, por razones éticas, la realización de ECA (p. ej., el tratamiento sustitutivo en la enfermedad renal crónica terminal).
El sistema contempla, además, cuatro grados de recomendación (de A a D), relacionados, fundamentalmente, con el nivel de calidad de la evidencia pero con la posibilidad de extrapolar a escalones más bajos, por razones clínicas. Por otra parte, la escala del OCEBM comprende, no sólo artículos de tratamiento, sino también de diagnóstico, pronóstico, estudios de prevalencia y análisis económico.
Esta escala ha sido ampliamente utilizada por instituciones de prestigio y, hasta ahora, por el Grupo de Nefrología Basada en la Evidencia de la S.E.N. Nosotros creemos que es una herramienta útil, que presenta como principal inconveniente la dificultad de jerarquizar cada uno de los diseños por la calidad del trabajo y la difusa consideración del contexto clínico.
Sin embargo, la situación dista de ser satisfactoria: la proliferación de escalas genera confusión y dudas en los usuarios, que se cuestionan la sensibilidad y reproducibilidad de los distintos modelos. Atkins et al.24,25 publicaron un trabajo en el que doce expertos evaluaron independientemente los seis sistemas de jerarquización de la evidencia más usados en el momento. Concluyeron que existían diferencias sustanciales en los criterios de gradación, con una baja sensibilidad y reproducibilidad de los mismos. La escala que encontraron más sensible y que respondía más adecuadamente a todo tipo de cuestiones es la del OCEBM.
La principal conclusión de ese trabajo fue constatar la inexistencia, hasta ese momento, de un modelo adecuado para la calificación de la evidencia y grados de recomendación que pudieran ser universalmente aceptados. Esto decidió a un grupo de expertos a constituirse en grupo para elaborar una propuesta que superara las limitaciones de los actuales sistemas de gradación de la evidencia (Grading of Recommendations Assessment, Development and Evaluation Working Group [GRADE])23-28, que se describe más adelante.
En nefrología la situación es similar, pero agravada por dificultades específicas de nuestra especialidad en relación con la disponibilidad de evidencia: dificultad y escasez de ECA39,40, evolución silente y prolongada de las enfermedades renales que obliga a utilizar variables subrogadas (p. ej., proteinuria), exclusión de enfermos con enfermedad renal en grandes ECA de afectación cardiovascular cuando ésta es su primera causa de mortalidad41,42, y otras.
Diversas instituciones internacionales nefrológicas vienen realizando GPC desde hace unos 20 años43-46. Las primeras guías de The National Kidney Foundation. Dialysis Outcomes and Quality Initiative (DOQI) establecieron bases para el desarrollo de GPC en enfermedad renal crónica (ERC). En 1999 se habían desarrollado 114 guías DOQI, 56 basadas en el consenso de expertos, 31 mixtas y sólo 27 basadas en la evidencia46-49, lo que pone de manifiesto las dificultades existentes. En estas primeras GPC no se indicaban expresamente los criterios utilizados para evaluar la calidad de la evidencia que sustentaba las recomendaciones. Pero sí se especifica, de forma precisa y detallada, en las guías publicadas más recientemente en las que se ha adoptado, al igual que otras organizaciones internacionales, el modelo GRADE de elaboración de GPC y jerarquización de la evidencia, que se desbriben más adelante50,51.
La EDTA-ERA viene realizando GPC desde hace más de 10 años44,45 en un contexto similar de problemas, por lo que se decidió pedir a un grupo de expertos que reconsiderara las condiciones en las que debían realizarse las GPC patrocinadas por esta institución y el sistema que adoptar para realizar la gradación de la evidencia. Las principales conclusiones fueron las siguientes:
- La falta de evidencia verificable en estudios de investigación clínica en numerosas áreas de nuestra especialidad39,40,44 explica que un número importante de las recomendaciones recogidas en las guías europeas son exclusivamente respaldadas por recomendaciones de expertos. Creían que, aun señalando expresamente este bajo nivel de evidencia, su presencia en un documento auspiciado por la EDTA-ERA podría generar equívocos, orientando la práctica clínica en un determinado sentido sin suficiente respaldo experimental. Por esta razón, el grupo acordó que la EDTA-ERA impulsara GPC sólo en aspectos sustentados por niveles de evidencia adecuados, el resto se recogerían como «Recomendaciones» y se publicarían en un formato completamente diferente44,45. También se decidió el cambio de nombre del grupo responsable de su elaboración y publicación, de European Renal Best Practice Guidelines a European Renal Best Practice.
- Se reconocieron déficits de calidad metodológica en algunos aspectos de las guías44, por lo que se decidió reconsiderar su sistemática de realización y clasificación en niveles de evidencia y grado de recomendación, adoptando como propias las decisiones de la iniciativa KDIGO44,45,51,52. Ante las dudas acerca de la presencia de sesgos en las GPC patrocinadas por la industria53, se decidió que las guías europeas de nefrología sólo admitieran patrocinios institucionales44.
La última y más rigurosa iniciativa para propiciar el desarrollo de GPC en nefrología es la de KDIGO (The Kidney Disease Global Outcomes improvement initiative)52, una fundación independiente, declarada sin ánimo de lucro, y que tiene como principal objetivo: «mejorar el cuidado y los resultados del tratamiento de pacientes con enfermedad renal en todo el mundo, mediante la promoción, coordinación, colaboración e integración de GPC sobre temas nefrológicos».
Ante la importante variabilidad de los sistemas utilizados para el desarrollo de GPC en nefrología, KDIGO encargó en el año 2004 a una comisión de expertos la revisión de los conocimientos actuales sobre graduación de la evidencia, con el fin de llegar a un consenso para adoptar un sistema que conjugara, de forma razonable, la simplicidad con la complejidad y que cubriera los objetivos necesarios para un sistema de jerarquización eficaz y riguroso. Esta comisión, acordó adoptar el sistema GRADE para la sistemática de elaboración de las guías y para la clasificación de la calidad de la evidencia y la fuerza de las recomendaciones.
También realizaron adaptaciones particulares del GRADE para el caso de la nefrología, elaboradas con criterios estrictos y mencionando expresamente las mismas en las GPC. Las principales fueron: 1) la necesidad de extrapolar resultados obtenidos en población sin nefropatía a los pacientes con nefropatía e insuficiencia renal, y 2) la necesidad de agregación de datos cualitativos cuando no es posible utilizar variables cuantitativas.
EL MODELO GRADE PARA LA JERARQUIZACIÓN DE LA CALIDAD DE LA EVIDENCIA Y GRADOS DE RECOMENDACIÓN
El modelo GRADE23-28,52 presenta importantes fortalezas: es un sistema sencillo y fácil de implementar que desarrolla una metodología rigurosa de realización de revisiones sistemáticas y utiliza escalas estructuradas para calificar la calidad de la evidencia de los trabajos y la fuerza de la recomendación. El modelo ha sido evaluado en estudios piloto que afrontan distintos problemas clínicos, acreditando un adecuado nivel de sensibilidad y reproducibilidad54. Por todo ello, ha alcanzando un alto nivel de consenso y aceptación internacional44,45,51,52 por parte de importantes instituciones nefrológicas (Caring for Australians with renal impairment, United Kingdom Renal Association, European Best Practice Guidelines, Canadian Society of Nephrology. Kidney Disease Outcomes Quality Initiative).
La tabla 1 muestra la sistemática que seguir en respuesta a preguntas clínicas concretas sobre el resultado de una intervención y, por tanto, para la realización de GPC establecida por GRADE23,52.
Organización general y realización de revisiones sistemáticas
Los pasos 1 a 3 describen la estrategia inicial de búsqueda de la evidencia para contestar a preguntas clínicas sobre una intervención y realizar una GPC, incluyendo la organización general del trabajo (constitución del grupo y sistemática de realización, identificación de las intervenciones a estudiar, definición de las variables de resultado, incluyendo las de daño), la realización de RS para cada intervención de interés clínico (búsqueda, selección y tabulación de resultados para cada variable, determinando la magnitud del efecto y la calidad del estudio), y la preparación de perfiles de evidencia para cada variable de resultado con importancia clínica y en cada subgrupo de enfermos, tabulando los principales resultados y la calidad metodológica de cada trabajo.
Estimación de la calidad de la evidencia
Del 4 a 6 se describen los pasos a seguir para jerarquizar la calidad de la evidencia. Para ello, GRADE desarrolla un análisis estructurado y explícito (cada revisor explica la naturaleza de sus decisiones) que considera, no sólo el diseño, sino también la calidad metodológica de los estudios, así como su consistencia, precisión y aplicabilidad. En primer lugar, se realiza un análisis de la calidad de la evidencia para cada variable de resultado (y subgrupo de pacientes), clasificándola en cuatro grados: calidad alta, moderada, baja y muy baja (grados del 1 al 4). Este índice expresa el grado de confianza que podemos tener en que la estimación del efecto de una intervención sobre la variable de interés se aproxime al real y será tanto mayor cuanto más alto sea el nivel de evidencia. La probabilidad de que una nueva investigación pueda cambiar los resultados será muy baja, en los casos calificados como de calidad de la evidencia muy alta e irá aumentando conforme ésta disminuya. Los puntos que se siguen en el GRADE para su valorar la calidad se esquematizan en la tabla 2.
- Diseño: Para la evaluación del nivel de evidencia se comienza analizando el tipo de diseño de los trabajos incluidos. Para estudios que deciden sobre la eficacia terapéutica, la producción de sesgos es mucho menos probable cuando se utiliza un ECA (si el planteamiento y el desarrollo son metodológicamente adecuados) que con cualquier otro tipo de diseño. Por esto, en la clasificación de GRADE si una intervención está respaldada inicialmente por ECA obtiene, como punto de partida, la mayor calificación de la evidencia (grado 4 = calidad muy alta). Por el contrario, los estudios observacionales se califican inicialmente de calidad baja (grado 2). Naturalmente, este planteamiento constituiría una simplificación inválida si no se realizan correcciones ya que, a veces, los estudios observacionales muestran resultados de gran valor probatorio mientras que los ECA pueden reducirlo por varias circunstancias: déficit de calidad metodológica, inconsistencia, aplicabilidad, presencia de sesgos.
- Calidad metodológica: Los ECA pueden disminuir su nivel de evidencia si existen limitaciones metodológicas importantes (en este caso, reducirán su nivel de evidencia en ¿1 grado) y si estas limitaciones son muy serias, disminuirían en ¿2 grados. Los elementos que el GRADE considera de forma sistemática para valorar la calidad metodológica son: el diseño del estudio, lo adecuado de su tamaño muestral, las técnicas de aleatorización y ocultación, variables de resultado estudiadas (incluyendo daño), el seguimiento, los perdidos a la evolución, el análisis estadístico y el análisis por intención de tratar. De esta forma, una recomendación formulada a partir de estudios con diseño de ECA puede ser calificada como de baja evidencia.
- Consistencia: El hallazgo de resultados discordantes entre trabajos semejantes con los que se estudia el efecto de una intervención cuestiona la credibilidad de aquéllos y, por tanto, si no se encuentra una explicación razonable a estas diferencias, reduce su nivel de evidencia. Si existe inconsistencia, el método GRADE disminuye en ¿1 el grado asignado hasta ese momento.
- Aplicabilidad: Se refiere a si la población o el diseño del estudio lo hacen asimilable a nuestra población de interés. Si existen diferencias sustanciales (raza, edad, sexo, comorbilidad, gravedad, subpoblación, etc.) de la población estudiada con la población diana, el grado de evidencia disminuye también entre ¿1 y ¿2 grados, según la importancia de las diferencias. Lo mismo sucede si existen diferencias importantes entre las variables de resultado estudiadas o en la intervención (dosis o pauta administrada, etc.) o cuando la comparación entre dos intervenciones no se estudia directamente, sino utilizando otra o un grupo control o con el empleo de variables subrogadas de significación no claramente establecida. Finalmente, el nivel de la evidencia también disminuye (¿1 grado) si en el trabajo se utilizan datos confusos o imprecisos o existe alta posibilidad de sesgos por alguna de las características del trabajo.
Por otra parte, como se ha descrito previamente, se considera que la probabilidad de sesgos es mayor, y por tanto el grado de evidencia menor, cuando se utilizan estudios observacionales. Por tanto, el GRADE les asigna una evidencia inicial baja (grado 2). Sin embargo, hay intervenciones con resultados muy convincentes que utilizan, exclusivamente, estudios observacionales. Anteriormente se ha descrito que el sistema de clasificación OCEBM concede un alto nivel de evidencia a los estudios observacionales que obtienen una gran magnitud del efecto (all & none). En el sistema GRADE se tiene también en cuenta esta circunstancia, valorando la fuerza de la asociación entre la intervención y la variable de resultado, de tal forma que para un estudio observacional con una magnitud del efecto fuerte, considerando éste cuando el RR (riesgo relativo) es mayor que 2 con un IC (intervalo de confianza) inferior a 0,5 se añade +1 grado a la calificación basal y si es muy fuerte (RR >5 e IC <0,2) se añaden +2 grados.
Por otra parte, también se considera que potencia el nivel de evidencia la presencia de factores de confusión que tienden a disminuir el efecto de la intervención o cuando existe un gradiente de respuesta intervención-variable (+1 grado en ambos casos).
Siguiendo esta clasificación, una intervención cuyo efecto ha sido estudiado con ECA puede obtener un grado de evidencia bajo o muy bajo y, al contrario, un estudio observacional, una calificación de evidencia de calidad alta.
En una GPC el análisis del valor de una intervención (que hará recomendable o no su utilización en una determinada situación clínica) depende de la calidad de la evidencia y de la magnitud del efecto de ésta sobre diferentes variables de resultado (p. ej., supervivencia, síntomas cardiovasculares, ingresos, efectos secundarios, etc.) y cada una de éstas tiene una importancia diferente sobre las decisiones: es decir, hay variables de resultado que pueden estar sustentadas en un alto nivel de evidencia pero cuya importancia relativa en la toma de decisión es bajo. Por tanto, es importante considerar la importancia de cada variable en relación al conjunto de ellas, para establecer la recomendación final. El GRADE establece (paso 5) que, para este análisis, se incluyan sólo las variables con importancia clínica, ordenándolas de más a menos según el peso que estimemos que deben tener en la recomendación, calificando su importancia según corresponda en cada caso, como «crítica» o «importante pero no crítica». Por último, debemos globalizar la calidad de la evidencia de una intervención asumiendo para el conjunto la calidad de la asistencia de las variables críticas con menor nivel de evidencia.
Estimación de la fuerza de la recomendación
El sistema GRADE establece dos grados de recomendación, fuerte (nivel 1) y débil (nivel 2), aunque también se admiten recomendaciones fuera de gradación para casos con niveles bajos de evidencia, en los que el beneficio para la salud sea evidente a juicio de los expertos que desarrollan la GPC (basado en el consenso).
La calidad de la evidencia es el argumento inicial para determinar la fuerza de la recomendación y debe plantearse sólo cuando está respaldada por niveles adecuados de calidad metodológica. Pero no es el único: una determinada intervención puede estar sustentada en trabajos de alta calidad metodológica, pero no ser recomendable por otras razones y, al contrario, los niveles de evidencia pueden ser bajos o muy bajos, pero su recomendación, obligatoria por razones clínicas obvias (p. ej., anticoagulación en hemodiálisis).
El método GRADE (paso 7) establece la necesidad de realizar un balance del efecto neto para la salud de cada una de las intervenciones utilizadas en una GPC para matizar el énfasis o grado de recomendación. Las posibilidades de conclusión son: 1) hay un beneficio neto para la salud (beneficio>daño); 2) hay bastante equilibrio entre beneficio y daño (depende de circunstancias clínicas concretas); 3) es incierto si existe beneficio o daño, y 4) no hay un beneficio neto para la salud (daño>beneficio). Junto a esto, deben hacerse otras consideraciones (paso 8 del GRADE), como la valoración clínica de la magnitud del efecto, los costes, la disponibilidad, etc.
Con todo esto se realiza una estimación del grado de recomendación, teniendo en cuenta los criterios que se muestran en la tabla 3.
Las recomendaciones en una GPC deben basarse en niveles de calidad de la evidencia altos o moderados (A o B). El grado de recomendación fuerte (nivel 1) está respaldado por una alta calidad de la evidencia y un efecto neto para la salud favorable. Por esto, el texto especifica que «se recomienda» y se espera que la propuesta sea seguida por los médicos ya que la mayoría de los especialistas bien informados elegirían esta opción. En el grado de recomendación débil, la calidad de la evidencia es moderada o alta pero el balance beneficio/daño u otras razones aconsejan una recomendación débil. Muchos especialistas bien informados elegirían esta opción, pero una sustancial minoría no lo haría, con argumentos razonables. La redacción de la propuesta en este caso, no la «recomienda», sino que la «sugiere». Se espera que los especialistas sigan la propuesta, pero su seguimiento está condicionado o es discrecional.
En la recomendación basada en el consenso, la calidad de la evidencia es baja, muy baja o ausente, por lo que la propuesta se realiza a partir de la opinión sustentada por expertos y la decisión, en casos en los que, aunque están sustentados en niveles muy bajos de evidencia metodológica, presentan, sin embargo, argumentos clínicos que muestran de forma clara y rotunda que el beneficio para la salud es claramente superior al daño (p. ej., el tratamiento con métodos de diálisis en la enfermedad renal crónica terminal) o, al menos, que los expertos consideran muy aconsejable (p. ej., una determinada frecuencia de revisiones). El seguimiento de estas recomendaciones es sugerido, pero prevalece el criterio individual del médico ante la situación de su paciente individual.
Como conclusión, creemos que los sistemas de jerarquización de la evidencia y grados de recomendación son importantes para objetivar de forma sencilla, pero con un importante trasfondo de rigor crítico, los distintos elementos en los que deben basarse las recomendaciones de práctica clínica. El modelo GRADE, aunque todavía presenta limitaciones, supone un avance importante en los sistemas de clasificación de calidad de la evidencia y grados de recomendación, en el que se tienen en cuenta de forma estructurada, explícita y sencilla, los distintos elementos que intervienen en ésta: diseño, calidad metodológica, consistencia, magnitud del efecto, precisión, aplicabilidad, presencia potencial de sesgos y balance beneficio/daño. Ha sido adoptado por las principales instituciones nefrológicas internacionales: KDIGO ha lanzado las primeras GPC siguiendo esta metodología, expuesta de una forma transparente y fácilmente comprensible, que facilita la comprensión de la recomendación y los matices (calidad metodológica y fuerza de la recomendación que modulan su aplicación)55. De igual modo y por las mismas razones, nosotros propugnamos su adopción por la S.E.N. y por su grupo de Nefrología Basada en la Evidencia.
Tabla 1. Sistemática básica para la realización de una guía clínica
Tabla 2. Criterios GRADE para jerarquizar el grado de calidad de la evidencia
Tabla 3. Criterios GRADE. Estimación del grado de la recomendación