array:19 [
  "pii" => "X2013757509002245"
  "issn" => "20137575"
  "doi" => "10.3265/NEFROLOGIA.2009.29.S.E.noID.36.free "
  "estado" => "S300"
  "fechaPublicacion" => "2009-12-01"
  "documento" => "article"
  "subdocumento" => "fla"
  "cita" => "Nefrología Suplemento Extraordinario. 2009;29:15-20"
  "abierto" => array:3 [
    "ES" => true
    "ES2" => true
    "LATM" => true
  ]
  "gratuito" => true
  "lecturas" => array:2 [
    "total" => 5919
    "formatos" => array:3 [
      "EPUB" => 116
      "HTML" => 5006
      "PDF" => 797
    ]
  ]
  "itemSiguiente" => array:15 [
    "pii" => "X2013757509002081"
    "issn" => "20137575"
    "doi" => "10.3265/NEFROLOGIA.2009.29.S.E.noID.36.free "
    "estado" => "S300"
    "fechaPublicacion" => "2009-12-01"
    "documento" => "article"
    "subdocumento" => "fla"
    "cita" => "Nefrología Suplemento Extraordinario. 2009;29:21-6"
    "abierto" => array:3 [
      "ES" => true
      "ES2" => true
      "LATM" => true
    ]
    "gratuito" => true
    "lecturas" => array:2 [
      "total" => 8325
      "formatos" => array:3 [
        "EPUB" => 118
        "HTML" => 7496
        "PDF" => 711
      ]
    ]
    "es" => array:8 [
      "idiomaDefecto" => true
      "titulo" => "¿Son los vaptanes fármacos eficaces y seguros en el tratamiento de la hiponatremia?"
      "tienePdf" => "es"
      "tieneTextoCompleto" => "es"
      "paginas" => array:1 [
        0 => array:2 [
          "paginaInicial" => "21"
          "paginaFinal" => "26"
        ]
      ]
      "contieneTextoCompleto" => array:1 [
        "es" => true
      ]
      "contienePdf" => array:1 [
        "es" => true
      ]
      "autores" => array:1 [
        0 => array:2 [
          "autoresLista" => "Patricia de Sequera Ortiz, Marta Albalate Ramón, Roberto Alcázar Arroyo"
          "autores" => array:3 [
            0 => array:2 [
              "nombre" => "Patricia"
              "apellidos" => "de Sequera Ortiz"
            ]
            1 => array:2 [
              "nombre" => "Marta"
              "apellidos" => "Albalate Ramón"
            ]
            2 => array:2 [
              "nombre" => "Roberto"
              "apellidos" => "Alcázar Arroyo"
            ]
          ]
        ]
      ]
    ]
    "idiomaDefecto" => "es"
    "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/X2013757509002081?idApp=UINPBA000064"
    "url" => "/20137575/0000002900000006/v0_201502101234/X2013757509002081/v0_201502101235/es/main.assets"
  ]
  "itemAnterior" => array:15 [
    "pii" => "X2013757509002253"
    "issn" => "20137575"
    "doi" => "10.3265/NEFROLOGIA.2009.29.S.E.noID.36.free"
    "estado" => "S300"
    "fechaPublicacion" => "2009-12-01"
    "documento" => "article"
    "subdocumento" => "fla"
    "cita" => "Nefrología Suplemento Extraordinario. 2009;29:7-14"
    "abierto" => array:3 [
      "ES" => true
      "ES2" => true
      "LATM" => true
    ]
    "gratuito" => true
    "lecturas" => array:2 [
      "total" => 8169
      "formatos" => array:3 [
        "EPUB" => 128
        "HTML" => 7391
        "PDF" => 650
      ]
    ]
    "es" => array:8 [
      "idiomaDefecto" => true
      "titulo" => "Jerarquización del conocimiento científico. El sistema GRADE"
      "tienePdf" => "es"
      "tieneTextoCompleto" => "es"
      "paginas" => array:1 [
        0 => array:2 [
          "paginaInicial" => "7"
          "paginaFinal" => "14"
        ]
      ]
      "contieneTextoCompleto" => array:1 [
        "es" => true
      ]
      "contienePdf" => array:1 [
        "es" => true
      ]
      "autores" => array:1 [
        0 => array:2 [
          "autoresLista" => " Grupo de Nefrología Basada en la Evidencia de la Sociedad Española de Nefrología, Carlos Quereda Rodríguez-Navarro, Vicente Barrio Lucia, Fernando García López"
          "autores" => array:4 [
            0 => array:1 [
              "apellidos" => "Grupo de Nefrología Basada en la Evidencia de la Sociedad Española de Nefrología"
            ]
            1 => array:2 [
              "nombre" => "Carlos"
              "apellidos" => "Quereda Rodríguez-Navarro"
            ]
            2 => array:2 [
              "nombre" => "Vicente"
              "apellidos" => "Barrio Lucia"
            ]
            3 => array:2 [
              "nombre" => "Fernando"
              "apellidos" => "García López"
            ]
          ]
        ]
      ]
    ]
    "idiomaDefecto" => "es"
    "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/X2013757509002253?idApp=UINPBA000064"
    "url" => "/20137575/0000002900000006/v0_201502101234/X2013757509002253/v0_201502101234/es/main.assets"
  ]
  "es" => array:13 [
    "idiomaDefecto" => true
    "titulo" => "Estudios de evaluación de la validez de una prueba diagnóstica: revisión sistemática y metanálisis"
    "tieneTextoCompleto" => true
    "paginas" => array:1 [
      0 => array:2 [
        "paginaInicial" => "15"
        "paginaFinal" => "20"
      ]
    ]
    "autores" => array:1 [
      0 => array:3 [
        "autoresLista" => "Javier Zamora Romero, María Nieves Plana, Víctor Abraira Santos"
        "autores" => array:3 [
          0 => array:4 [
            "nombre" => "Javier"
            "apellidos" => "Zamora Romero"
            "email" => array:1 [
              0 => "jzamora.hrc@salud.madrid.org"
            ]
            "referencia" => array:1 [
              0 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">a</span>"
                "identificador" => "affa"
              ]
            ]
          ]
          1 => array:3 [
            "nombre" => "Mar&#237;a Nieves"
            "apellidos" => "Plana"
            "referencia" => array:1 [
              0 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">a</span>"
                "identificador" => "affa"
              ]
            ]
          ]
          2 => array:3 [
            "nombre" => "V&#237;ctor"
            "apellidos" => "Abraira Santos"
            "referencia" => array:1 [
              0 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">a</span>"
                "identificador" => "affa"
              ]
            ]
          ]
        ]
        "afiliaciones" => array:1 [
          0 => array:3 [
            "entidad" => "Unidad de Bioestad&#237;stica Cl&#237;nica&#44; Hospital Ram&#243;n y Cajal y CIBER Epidemiolog&#237;a y Salud P&#250;blica &#40;CIBERESP&#41;&#44; Madrid&#44; Madrid&#44; Espa&#241;a&#44; "
            "etiqueta" => "<span class="elsevierStyleSup">a</span>"
            "identificador" => "affa"
          ]
        ]
      ]
    ]
    "resumenGrafico" => array:2 [
      "original" => 0
      "multimedia" => array:7 [
        "identificador" => "fig1"
        "etiqueta" => "Fig. 1"
        "tipo" => "MULTIMEDIAFIGURA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "copyright" => "Elsevier Espa&#241;a"
        "figura" => array:1 [
          0 => array:4 [
            "imagen" => "10089127_figura1.jpg"
            "Alto" => 327
            "Ancho" => 843
            "Tamanyo" => 42831
          ]
        ]
      ]
    ]
    "textoCompleto" => "<p class="elsevierStylePara"><span class="elsevierStyleBold">INTRODUCCI&#211;N</span></p><p class="elsevierStylePara">Desde que se propone la utilizaci&#243;n de una prueba o estrategia&#160; diagn&#243;stica&#160; hasta&#160; que&#160; se&#160; incorpora&#160; finalmente&#160; a&#160; la pr&#225;ctica&#160; cl&#237;nica&#160; debiera&#160; existir&#160; un proceso&#160; sistem&#225;tico&#160; de evaluaci&#243;n&#46; El marco conceptual para la evaluaci&#243;n de pruebas&#160; diagn&#243;sticas&#160; ha&#160; ido&#160; evolucionando&#160; a&#160; lo&#160; largo&#160; de&#160; los a&#241;os&#46; Ha pasado de considerarse un proceso secuencial en fases<span class="elsevierStyleSup">1</span>&#44; mimetizando en mayor o menor medida las fases I a IV&#160; del&#160; ensayo&#160; cl&#237;nico&#44;&#160; a&#160; ser&#160; una&#160; evaluaci&#243;n globalizadora que considera&#160; los aspectos t&#233;cnicos de factibilidad&#44; reproducibilidad&#44; validez e impacto socioecon&#243;mico&#44; y el contexto cl&#237;nico donde se aplicar&#225; la prueba<span class="elsevierStyleSup">2</span>&#46; Este &#250;ltimo aspecto es de vital importancia para determinar las dimensiones m&#225;s adecuadas de evaluaci&#243;n de la prueba o estrategia diagn&#243;stica&#46; El&#160; rol reservado para&#160; la prueba&#44; bien sea el de&#160; reemplazar a una existente&#44;&#160; incorporarla como una prueba previa de cribado &#191;o triage&#191;&#44; o bien utilizarla como una prueba a&#241;adida a&#160; las que ya se realizan&#44; determinar&#225;&#160; la dimensi&#243;n de evaluaci&#243;n m&#225;s relevante&#44; as&#237; como el mejor dise&#241;o para determinar sus ventajas<span class="elsevierStyleSup">3&#44;4</span>&#46;</p><p class="elsevierStylePara">En los &#250;ltimos tiempos estamos asistiendo a un periodo de profunda reflexi&#243;n entre la comunidad cient&#237;fica dedicada a la evaluaci&#243;n de pruebas diagn&#243;sticas&#46; Por un lado&#44; la reciente publicaci&#243;n de la gu&#237;a de graduaci&#243;n de la calidad de evidencias sobre pruebas y estrategias diagn&#243;sticas &#40;GRADE&#41;<span class="elsevierStyleSup">5</span> y&#44; por otro&#44; la inclusi&#243;n de Revisiones Sistem&#225;ticas de validez de pruebas diagn&#243;sticas en la Biblioteca de la Colaboraci&#243;n Cochrane<span class="elsevierStyleSup">6</span> son dos hitos dignos de destacar&#46;</p><p class="elsevierStylePara">En el presente art&#237;culo expondremos&#160; las caracter&#237;sticas de las revisiones sistem&#225;ticas y metan&#225;lisis de estudios de validez de una prueba diagn&#243;stica&#46; Asumiendo que&#160; el&#160; lector est&#225; m&#225;s familiarizado con las revisiones sistem&#225;ticas de intervenciones terap&#233;uticas&#44; durante los siguientes apartados ocasionalmente trazaremos el paralelismo entre ambos tipos de revisi&#243;n para enfatizar las peculiaridades de las revisiones de diagn&#243;stico&#46;</p><p class="elsevierStylePara"><span class="elsevierStyleBold">REVISI&#211;N SISTEM&#193;TICA</span></p><p class="elsevierStylePara">El proceso de la revisi&#243;n sistem&#225;tica sigue las habituales fases que se inician con el planteamiento del objetivo de la revisi&#243;n&#44; la b&#250;squeda bibliogr&#225;fica y selecci&#243;n de art&#237;culos a incluir en la revisi&#243;n&#44; la evaluaci&#243;n de sus caracter&#237;sticas y su calidad metodol&#243;gica y el posterior an&#225;lisis estad&#237;stico o metan&#225;lisis de sus resultados&#46;</p><p class="elsevierStylePara">En cuanto al objetivo&#44; las revisiones de diagn&#243;stico con frecuencia&#160; se&#160; limitan a evaluar el&#160; rendimiento de una prueba diagn&#243;stica&#160; respecto a un patr&#243;n de referencia&#160; &#40;gold&#160; standard&#41; sin abordar una comparaci&#243;n expl&#237;cita con otras pruebas alternativas&#46; El contexto cl&#237;nico donde se aplicar&#225;n los resultados&#160; de&#160; la revisi&#243;n&#160; a&#160; veces&#160; no&#160; es&#160; expl&#237;cito&#44;&#160; lo&#160; que dificultar&#225; su aplicabilidad&#46; Es relativamente f&#225;cil utilizar los resultados de una&#160; revisi&#243;n de&#160; tratamiento para&#160; la&#160; toma de decisiones para un paciente en concreto&#44; mientras que en el caso del diagn&#243;stico&#44; esto es m&#225;s complejo&#46; Por ello&#44; con frecuencia las evidencias arrojadas por la revisi&#243;n sistem&#225;tica se utilizan para la toma de decisiones a nivel de gestores y decisores con un punto de vista m&#225;s cercano a la evaluaci&#243;n de tecnolog&#237;as sanitarias que a la pr&#225;ctica cl&#237;nica&#46;</p><p class="elsevierStylePara">Como en las revisiones de tratamiento&#44; otro de los objetivos de la revisi&#243;n es analizar los factores que afectan al rendimiento diagn&#243;stico de una determinada prueba&#44; como pueden ser factores relacionados con la poblaci&#243;n estudiada &#40;espectro de la enfermedad&#44; &#225;mbito de estudio&#44; etc&#46;&#41;&#44; caracter&#237;sticas de la prueba y con el dise&#241;o del estudio&#46;</p><p class="elsevierStylePara"><span class="elsevierStyleBold">B&#250;squeda y selecci&#243;n de art&#237;culos</span></p><p class="elsevierStylePara">Como en cualquier revisi&#243;n sistem&#225;tica&#44; debe realizarse una b&#250;squeda de estudios exhaustiva&#44; objetiva y reproducible de la investigaci&#243;n primaria&#46; &#201;sta no debe limitarse s&#243;lo a las bases de datos electr&#243;nicas&#44; sino que debe complementarse con b&#250;squedas manuales en las listas de referencias bibliogr&#225;ficas de los art&#237;culos incluidos&#44; en los res&#250;menes de congresos relevantes&#44; consultas con investigadores&#44; registros de organismos evaluadores de investigaci&#243;n&#44; etc&#46; Adem&#225;s de las bases electr&#243;nicas habituales &#40;MEDLINE y EMBASE&#41; existen bases de datos espec&#237;ficas de estudios de diagn&#243;stico&#44; como la base MEDION<span class="elsevierStyleSup">7</span> que recoge revisiones publicadas de estudios de diagn&#243;stico y de cribado&#46;</p><p class="elsevierStylePara">La identificaci&#243;n de art&#237;culos de diagn&#243;stico presenta m&#225;s dificultades que la b&#250;squeda de ensayos cl&#237;nicos&#46; No existe como tal un t&#233;rmino MeSH &#40;Medical Subject Heading&#41; espec&#237;fico que sea comparable al&#160; t&#233;rmino &#171;randomized controlled&#160; trial&#187;&#46; El t&#233;rmino &#171;sensitivity and specificity&#187; puede ser el m&#225;s adecuado&#44; pero no en todas las bases de datos est&#225; bien indexado&#46; Muchos de&#160; los estudios de diagn&#243;stico se realizan alrededor de la propia pr&#225;ctica cl&#237;nica sin la existencia de un protocolo registrado y&#47;o aprobado por comit&#233;s &#233;ticos de investigaci&#243;n&#44; con lo que se dificulta su seguimiento&#46; No existe una base de datos centralizada de estudios de diagn&#243;stico equivalente a la de ensayos cl&#237;nicos&#46; Adem&#225;s&#44; hay estudios que presentan resultados de validez diagn&#243;stica de una prueba sin que &#233;ste sea su objetivo principal&#46; Todo esto dificulta el proceso de b&#250;squeda y conlleva que no sea recomendable el uso de filtros metodol&#243;gicos para intentar restringir y focalizar la b&#250;squeda<span class="elsevierStyleSup">8</span>&#46;</p><p class="elsevierStylePara">La valoraci&#243;n del sesgo de publicaci&#243;n en los estudios de diagn&#243;stico es mucho m&#225;s compleja que su equivalente en estudios de tratamiento&#46; Los funnel plot y dem&#225;s m&#233;todos utilizados para evaluar dicho sesgo de publicaci&#243;n en las revisiones de tratamiento son discutidos para los estudios de diagn&#243;stico<span class="elsevierStyleSup">9&#44;10</span>&#46; Por otro lado&#44; dado que habitualmente los estudios de diagn&#243;stico no comparan pruebas diagn&#243;sticas entre s&#237;&#44; la publicaci&#243;n no suele estar condicionada por la presencia o no de una significaci&#243;n estad&#237;stica asociada a dicha comparaci&#243;n&#46;</p><p class="elsevierStylePara">En cualquier caso&#44; como en las revisiones sistem&#225;ticas hom&#243;logas de tratamiento&#44; el flujo de los estudios desde la b&#250;squeda inicial hasta la realizaci&#243;n del metan&#225;lisis deber&#237;a representarse siguiendo la recomendaci&#243;n de las gu&#237;as QUOROM<span class="elsevierStyleSup">11</span>&#44; es decir&#44; mediante una gr&#225;fica donde consten los distintos estadios con sus exclusiones descritas de acuerdo a las causas&#46;</p><p class="elsevierStylePara"><span class="elsevierStyleBold">Evaluaci&#243;n de la calidad de los estudios</span></p><p class="elsevierStylePara">Un aspecto clave en toda revisi&#243;n sistem&#225;tica es la evaluaci&#243;n de la calidad metodol&#243;gica de los estudios incluidos con la finalidad de identificar posibles fuentes de sesgos&#46; Vinculado al an&#225;lisis de la calidad metodol&#243;gica con que se dise&#241;&#243; y realiz&#243; el estudio&#44; se encuentra el an&#225;lisis de la forma en que se comunican los resultados del estudio&#46; Es dif&#237;cil distinguir entre ambos aspectos de la calidad dado que ambos est&#225;n &#237;ntimamente relacionados&#46; Para uno y otro an&#225;lisis existen dos herramientas muy populares en la actualidad&#46; Por una parte&#44; la iniciativa STARD para la publicaci&#243;n de estudios de validez diagn&#243;stica est&#225; dirigida a editores de revistas y a los autores de art&#237;culos y pretende mejorar la calidad de las publicaciones para permitir as&#237; a los lectores evaluar los potenciales sesgos del estudio y juzgar sobre su generalizaci&#243;n<span class="elsevierStyleSup">12&#44;13</span>&#46; Esta iniciativa es al &#225;rea de investigaci&#243;n sobre diagn&#243;stico lo que el CONSORT fue a la investigaci&#243;n en tratamiento<span class="elsevierStyleSup">14</span>&#46; Por otra parte&#44; se encuentra el cuestionario QUADAS&#44; ideado espec&#237;ficamente para la evaluaci&#243;n de la calidad de los estudios primarios incluidos en revisiones sistem&#225;ticas de diagn&#243;stico<span class="elsevierStyleSup">15-17</span>&#46; El cuestionario contiene una serie de &#237;tems relacionados con aspectos del dise&#241;o y el an&#225;lisis del estudio que cubren desde el espectro de pacientes incluido hasta la presencia de los sesgos m&#225;s frecuentes&#46;</p><p class="elsevierStylePara">El uso que se puede dar a los resultados de este an&#225;lisis de calidad es un tema de debate&#46; Se propone desde una simple descripci&#243;n de esta calidad con el objeto de valorar el alcance de las evidencias disponibles&#44; hasta la propuesta m&#225;s dr&#225;stica de excluir del an&#225;lisis a los estudios de m&#225;s baja calidad&#46; En lo que s&#237; parece haber un cierto consenso es en desaconsejar resumir&#160; la calidad en una &#250;nica puntuaci&#243;n num&#233;rica y en la dificultad de incorporar expl&#237;citamente la calidad en la ponderaci&#243;n de los estudios primarios a la hora de analizar los datos<span class="elsevierStyleSup">18</span>&#46; Una alternativa com&#250;n es la realizaci&#243;n de an&#225;lisis de sensibilidad comparando los resultados que se obtienen incluyendo y excluyendo&#160; determinados&#160; estudios&#160; en&#160; funci&#243;n&#160; de&#160; su&#160; calidad&#160; o&#160; de determinadas caracter&#237;sticas del dise&#241;o&#46;</p><p class="elsevierStylePara">A partir de las publicaciones de Lijmer<span class="elsevierStyleSup">19</span> inicialmente&#44; y Rutjes<span class="elsevierStyleSup">20</span> m&#225;s tarde&#44; existe un consenso generalizado en recomendar la exclusi&#243;n de los estudios con dise&#241;o de casos y controles&#44; dado que sobrestiman la validez de las pruebas y pueden considerarse fases previas de la evaluaci&#243;n de la validez<span class="elsevierStyleSup">1</span>&#46;</p><p class="elsevierStylePara"><span class="elsevierStyleBold">An&#225;lisis estad&#237;stico</span></p><p class="elsevierStylePara">En general&#44; el metan&#225;lisis es un proceso en dos etapas<span class="elsevierStyleSup">21</span>&#46; En un primer paso se estiman los resultados de cada estudio&#44; aunque en el caso de la evaluaci&#243;n de pruebas diagn&#243;sticas cada estudio es resumido no por un &#237;ndice&#44; como en los estudios de evaluaci&#243;n de&#160; tratamientos&#44; sino por una pareja de&#160; &#237;ndices que describen la validez de la prueba&#46; Habitualmente&#44; estos dos &#237;ndices son sensibilidad y especificidad&#44; o bien los cocientes de probabilidad positivo y negativo<span class="elsevierStyleSup">22</span>&#46; Debe huirse&#44; en la medida de lo posible&#44; de utilizar los valores predictivos pues&#44; como es bien sabido&#44; dependen de la prevalencia de la condici&#243;n cl&#237;nica que se diagnostica y &#233;sta puede ser muy variable de estudio a estudio&#46; Sin embargo&#44; a veces es el &#250;nico &#237;ndice que se puede obtener por las caracter&#237;sticas del m&#233;todo de referencia<span class="elsevierStyleSup">23</span>&#46; En un segundo paso se deben calcular &#237;ndices globales de validez para lo que se han propuesto diversos m&#233;todos&#44; que se expondr&#225;n m&#225;s adelante&#46;</p><p class="elsevierStylePara">Abordar un metan&#225;lisis s&#243;lo es apropiado en el caso de que exista homogeneidad metodol&#243;gica en los estudios incluidos en la revisi&#243;n&#44; es decir&#44; que todos ellos hayan evaluado la misma prueba diagn&#243;stica&#44; usando un mismo m&#233;todo de referencia y en pacientes similares&#46; Para valorar estos aspectos se deben extraer los datos pertinentes de los estudios&#44; utilizando formularios ad hoc y en la medida de lo posible por duplicado&#44; para incrementar el grado de objetividad del proceso&#46; Estos datos se referir&#225;n a las caracter&#237;sticas del dise&#241;o del estudio&#44; su calidad metodol&#243;gica&#44; las caracter&#237;sticas de los pacientes y del &#225;mbito del estudio&#44; de la prueba evaluada y de referencia y&#44; finalmente&#44; los resultados observados&#46; Es importante destacar que este &#250;ltimo aspecto a veces limita la inclusi&#243;n de un estudio en el an&#225;lisis&#46; Si no fuera posible extraer los datos de validez diagn&#243;stica de un estudio individual en forma de tabla de clasificaci&#243;n cruzada&#44; el estudio debe ser excluido de la revisi&#243;n&#46;</p><p class="elsevierStylePara"><span class="elsevierStyleBold">Evaluaci&#243;n de la heterogeneidad</span></p><p class="elsevierStylePara">Adem&#225;s de&#160; la homogeneidad metodol&#243;gica mencionada&#44; se debe valorar&#160; la eventual presencia de heterogeneidad estad&#237;stica en los resultados&#46; Esta evaluaci&#243;n puede hacerse gr&#225;ficamente presentando&#160; la&#160; sensibilidad&#160; y especificidad de cada estudio en un forest plot &#40;figura 1&#41;&#46; En estos gr&#225;ficos se representan los estimadores de los &#237;ndices junto&#160; con&#160; sus&#160; intervalos de&#160; confianza&#44;&#160; y&#160; suelen presentarse pareados y ordenados de acuerdo a uno de los &#237;ndices&#46; Lo habitual es encontrar cierta dispersi&#243;n por el azar en la selecci&#243;n de&#160; las muestras de&#160; los estudios&#44; pero otros&#160; factores&#160; la pueden aumentar y el metan&#225;lisis debe explorar e identificar estas posibles&#160; fuentes de heterogeneidad&#46; Una evaluaci&#243;n estad&#237;stica de la &#171;cantidad&#187; de heterogeneidad presente se puede realizar mediante una prueba de la ji al cuadrado&#46; Es&#160; frecuente cuantificar su magnitud mediante el &#237;ndice de inconsistencia &#40;I2&#41; y una gu&#237;a&#44; no exenta de cr&#237;ticas&#44; para su interpretaci&#243;n clasifica el &#237;ndice en baja &#40;25-50&#37;&#41;&#44; media &#40;51-75&#37;&#41; y sustancial &#40;&#62;75&#37;&#41;<span class="elsevierStyleSup">24</span>&#46;</p><p class="elsevierStylePara">Una&#160; fuente caracter&#237;stica de heterogeneidad en&#160; los metan&#225;lisis de validez de las pruebas diagn&#243;sticas es la que surge porque&#160; los estudios&#160; incluidos pueden haber usado diferentes umbrales para definir qu&#233; es un resultado positivo de la prueba&#46; Este efecto es conocido como &#171;efecto umbral&#187;&#46; La definici&#243;n del umbral de positividad a veces puede&#160; ser expl&#237;cita&#44; como en el caso de&#160; la prote&#237;na C reactiva&#44; o&#160; impl&#237;cita como en el caso de pruebas con&#160; interpretaci&#243;n subjetiva &#40;pruebas de&#160; imagen&#41; o&#160; cuando&#160; los&#160; resultados de&#160; la prueba puedan verse afectados por&#160; la calibraci&#243;n del aparato de medida&#46; Desafortunadamente&#44; este efecto est&#225; presente&#160; con mucha&#160; frecuencia&#160; en&#160; la&#160; evaluaci&#243;n de pruebas diagn&#243;sticas&#46;</p><p class="elsevierStylePara"><span class="elsevierStyleBold">Efecto umbral</span></p><p class="elsevierStylePara">Para explorar esta&#160; fuente de variaci&#243;n es &#250;til&#160; representar en una gr&#225;fica las parejas de sensibilidad y especificidad de cada estudio en un plano ROC &#40;figura 2&#41;&#46; En este plano&#44; la zona m&#225;s cercana a la esquina superior izquierda supone un buen rendimiento diagn&#243;stico mientras que la zona central&#44; la diagonal en la que sensibilidad y especificidad son iguales&#44; representa una nula capacidad diagn&#243;stica&#46; Si existiera &#171;efecto umbral&#187;&#44; los puntos en el plano mostrar&#237;an un patr&#243;n curvil&#237;neo&#46; Cambiando el umbral de positividad de una prueba se obtendr&#237;a una mayor &#40;o menor&#41; sensibilidad con el consiguiente efecto contrario sobre la especificidad&#46; Adem&#225;s de gr&#225;ficamente&#44; este &#171;efecto umbral&#187; puede evaluarse mediante el coeficiente de correlaci&#243;n de Spearman entre la sensibilidad y la especificidad&#44; ya que de existir dicho efecto mostrar&#237;a una correlaci&#243;n inversa<span class="elsevierStyleSup">25</span>&#46;</p><p class="elsevierStylePara">Los m&#233;todos estad&#237;sticos m&#225;s robustos propuestos para el metan&#225;lisis tienen en cuenta esta correlaci&#243;n entre sensibilidad y especificidad&#44; y lo hacen mediante la estimaci&#243;n de una curva ROC resumen&#160; &#40;sROC&#41; de&#160; los estudios&#160; incluidos&#46; En presencia de &#171;efecto umbral&#187;&#44; no es adecuado aglomerar los &#237;ndices de sensibilidad y especificidad &#40;o cocientes de probabilidad&#41; independientemente uno del otro ignorando su correlaci&#243;n&#46;</p><p class="elsevierStylePara">Sin embargo&#44; en limitadas ocasiones los resultados de los estudios primarios son homog&#233;neos y puede descartarse la presencia tanto de efecto umbral como de otras fuentes de heterogeneidad&#46; En esta situaci&#243;n&#44; el resultado global de la revisi&#243;n podr&#237;a obtenerse a partir de la combinaci&#243;n ponderada de los &#237;ndices de los estudios individuales&#46; Como siempre&#44; esta combinaci&#243;n puede hacerse mediante un modelo de efectos fijos o bien mediante un modelo de efectos aleatorios&#44; dependiendo de la magnitud de la heterogeneidad&#46;</p><p class="elsevierStylePara">Se han propuesto varios m&#233;todos para estimar la curva sROC&#46; El primero de ellos&#44; debido a Moses&#44; et al&#46;<span class="elsevierStyleSup">26</span>&#44; se basa en estimar la regresi&#243;n lineal entre dos variables creadas a partir de los &#237;ndices de validez de cada estudio&#46; Estas variables son D y S&#44; que representan&#44; respectivamente&#44; el logaritmo del odds ratio diagn&#243;stico &#40;ORD&#41;<span class="elsevierStyleSup">27</span> y una medida indirecta del umbral de positividad de la prueba calculada como&#58;</p><p class="elsevierStylePara"><span class="elsevierStyleBold">S &#61; logit&#40;TVP&#41; &#43; logit&#40;TFP&#41;</span>&#46;</p><p class="elsevierStylePara">TVP y TFP son las tasas de verdaderos y falsos positivos&#44; respectivamente&#44; y logit&#40;TVP&#41; es el logaritmo de TVP dividido por su complementario &#40;1&#191;TVP&#41;&#46; Es f&#225;cil ver que ambas tasas de resultados positivos cambian con el umbral de positividad de la prueba&#46;</p><p class="elsevierStylePara">La propuesta de Moses consiste en ajustar el modelo D &#61; a &#43; bS&#46; El contraste sobre si hay variaci&#243;n del rendimiento diagn&#243;stico &#40;medido por el ORD&#41; con el umbral es equivalente al realizado sobre el par&#225;metro b del modelo&#46; Si b &#61; 0 no hay variaci&#243;n y el m&#233;todo da&#160; lugar a una curva&#160; sROC&#160; sim&#233;trica mientras que si b &#8800; 0 existe variaci&#243;n del rendimiento con el umbral y la curva sROC es asim&#233;trica y se obtiene deshaciendo la transformaci&#243;n a los ejes originales del plano ROC&#46;</p><p class="elsevierStylePara">El modelo puede extenderse para analizar el efecto de otros factores sobre el rendimiento diagn&#243;stico &#40;ORD&#41;&#46; Estos factores pueden ser relativos al dise&#241;o del estudio&#44; caracter&#237;sticas de los pacientes o del&#160; test y se&#160; incluir&#237;an en el modelo anterior como covariables<span class="elsevierStyleSup">28</span>&#46;</p><p class="elsevierStylePara">Se han propuesto distintos estad&#237;sticos &#250;tiles para resumir una curva sROC&#46; El m&#225;s habitual es el &#225;rea bajo la curva &#40;ABC&#41; que resume el rendimiento diagn&#243;stico de la prueba en un solo n&#250;mero<span class="elsevierStyleSup">29</span>&#58; las pruebas perfectas tienen un ABC cercano a 1 y las in&#250;tiles cercano a 0&#44;5&#46; Este n&#250;mero puede interpretarse como la probabilidad de clasificar correctamente a dos sujetos seleccionados al azar&#44; uno con la enfermedad y otro sin ella&#46; Finalmente&#44; puede usarse el &#225;rea para comparar el rendimiento de distintas pruebas diagn&#243;sticas&#46; Otro estad&#237;stico &#250;til es el &#237;ndice Q&#42;&#44; definido como el punto en el que la sensibilidad y la especificidad son&#160; iguales&#46; En una curva sim&#233;trica este punto es el m&#225;s cercano al extremo superior izquierdo del plano ROC&#46; Por &#250;ltimo&#44; la curva sROC ajustada puede utilizarse para extrapolar una sensibilidad a partir de una especificidad dada o viceversa&#46;</p><p class="elsevierStylePara"><span class="elsevierStyleBold">Modelos bivariantes y jer&#225;rquicos</span></p><p class="elsevierStylePara">El modelo de Moses presenta algunas&#160; limitaciones&#46; Por una parte&#44; no tiene en cuenta la distinta precisi&#243;n con la que se estimaron la sensibilidad y la especificidad en cada estudio&#44; tampoco incorpora la heterogeneidad entre estudios y&#44; por &#250;ltimo&#44; la variable independiente del modelo es aleatoria y&#44; por tanto&#44; tiene error de medici&#243;n<span class="elsevierStyleSup">30</span>&#46; Para superar estas&#160; limitaciones&#44; se han propuesto recientemente modelos de regresi&#243;n m&#225;s complejos para estimar la curva sROC&#46;</p><p class="elsevierStylePara">El primero de ellos es un modelo de efectos aleatorios&#44; bivariante&#44; que parte de la asunci&#243;n de que los logit de sensibilidad y especificidad siguen una distribuci&#243;n normal bivariante&#46; El modelo contempla&#160; la eventual correlaci&#243;n entre ambos &#237;ndices&#44; modeliza la distinta precisi&#243;n con la que han sido estimadas la sensibilidad y la especificidad e incorpora una fuente de heterogeneidad adicional debida a la varianza entre estudios<span class="elsevierStyleSup">31</span>&#46;</p><p class="elsevierStylePara">La&#160; segunda&#160; propuesta&#160; se&#160; refiere&#160; al modelo&#160; conocido&#160; como HSROC o modelo jer&#225;rquico&#46; Es similar al modelo anterior&#44; salvo que hace expl&#237;cita la relaci&#243;n existente entre sensibilidad y especificidad a trav&#233;s del umbral&#46; Como el anterior&#44; tambi&#233;n tiene en cuenta la heterogeneidad entre estudios<span class="elsevierStyleSup">1&#44;32</span>&#46;</p><p class="elsevierStylePara">Ambos modelos&#44; bivariante y jer&#225;rquico&#44; permiten obtener estimaciones promedio de sensibilidad y especificidad con sus correspondientes regiones de confianza y predicci&#243;n&#46; Las diferencias entre ambos modelos son peque&#241;as y recientemente se ha demostrado que&#44; en ausencia de covariables&#44; ambos abordajes son distintas parametrizaciones del mismo modelo<span class="elsevierStyleSup">33</span>&#46; Aunque recientemente se ha abogado por la necesidad de utilizar estos m&#233;todos<span class="elsevierStyleSup">34</span>&#44; los resultados proporcionados por estos m&#233;todos m&#225;s sofisticados son muy similares a los obtenidos por el modelo de Moses<span class="elsevierStyleSup">35</span>&#46;</p><p class="elsevierStylePara">Existe una gran variedad de paquetes estad&#237;sticos que pueden utilizarse para realizar los an&#225;lisis descritos&#46; Unos son de prop&#243;sito general&#44; como el SAS y el Stata&#44; que a trav&#233;s de una serie de macros programadas por usuarios facilitan la obtenci&#243;n de los modelos descritos&#46; Las m&#225;s populares son las macros de Stata denominadas midas<span class="elsevierStyleSup">36</span> y metandi<span class="elsevierStyleSup">37</span>&#44; y la macro desarrollada para SAS denominada metadas<span class="elsevierStyleSup">38</span>&#46; Otros programas espec&#237;ficos para el metan&#225;lisis de estudios de pruebas diagn&#243;sticas son el Meta-DiSc<span class="elsevierStyleSup">39</span> y el RevMan<span class="elsevierStyleSup">40</span> en su versi&#243;n 5&#46; Ambos realizan&#160; los an&#225;lisis b&#225;sicos mencionados en este art&#237;culo&#44;&#160; si bien RevMan permite incorporar los resultados obtenidos con los modelos bivariantes&#46;</p><p class="elsevierStylePara">Aunque nos hallamos en una &#233;poca muy activa en el dise&#241;o de m&#233;todos para realizar las revisiones sistem&#225;ticas de pruebas diagn&#243;sticas&#44; queda mucho camino por andar hasta&#160; llegar a equiparar estos m&#233;todos con los desarrollados en el &#225;mbito de las revisiones de tratamiento&#46; Estamos seguros de que en un futuro cercano ir&#225;n apareciendo m&#225;s desarrollos metodol&#243;gicos que situar&#225;n a la investigaci&#243;n sobre pruebas diagn&#243;sticas en el lugar que le corresponde por su importancia en el proceso cl&#237;nico-asistencial&#46; <br></br></p><p class="elsevierStylePara"><a href="grande&#47;10089127&#95;figura1&#46;jpg" class="elsevierStyleCrossRefs"><img src="10089127_figura1.jpg"></img></a></p><p class="elsevierStylePara">Figura 1&#46; </p><p class="elsevierStylePara"><a href="grande&#47;10089127&#95;figura2&#46;jpg" class="elsevierStyleCrossRefs"><img src="10089127_figura2.jpg"></img></a></p><p class="elsevierStylePara">Figura 2&#46; </p>"
    "pdfFichero" => "P4-E37-S1493-A10089.pdf"
    "tienePdf" => true
    "tieneResumen" => true
    "resumen" => array:1 [
      "es" => array:1 [
        "resumen" => "Cada vez con mayor frecuencia se encuentran en la literatura revisiones sistem&#225;ticas y metan&#225;lisis que eval&#250;an la validez de las pruebas diagn&#243;sticas&#46; Si bien existe un cierto paralelismo con las hom&#243;logas revisiones de la eficacia de intervenciones terap&#233;uticas&#44; estas revisiones tienen peculiaridades que es preciso enfatizar&#46; En este art&#237;culo se presenta&#44; de forma divulgativa&#44; el proceso de realizaci&#243;n de una revisi&#243;n sistem&#225;tica de estudios de validez diagn&#243;stica y su posterior metan&#225;lisis&#46;"
      ]
    ]
    "multimedia" => array:2 [
      0 => array:7 [
        "identificador" => "fig1"
        "etiqueta" => "Fig. 1"
        "tipo" => "MULTIMEDIAFIGURA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "copyright" => "Elsevier Espa&#241;a"
        "figura" => array:1 [
          0 => array:4 [
            "imagen" => "10089127_figura1.jpg"
            "Alto" => 327
            "Ancho" => 843
            "Tamanyo" => 42831
          ]
        ]
      ]
      1 => array:7 [
        "identificador" => "fig2"
        "etiqueta" => "Fig. 2"
        "tipo" => "MULTIMEDIAFIGURA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "copyright" => "Elsevier Espa&#241;a"
        "figura" => array:1 [
          0 => array:4 [
            "imagen" => "10089127_figura2.jpg"
            "Alto" => 338
            "Ancho" => 419
            "Tamanyo" => 17809
          ]
        ]
      ]
    ]
    "bibliografia" => array:2 [
      "titulo" => "Bibliograf&#237;a"
      "seccion" => array:1 [
        0 => array:1 [
          "bibliografiaReferencia" => array:40 [
            0 => array:3 [
              "identificador" => "bib1"
              "etiqueta" => "1"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Sackett\u{A0} DL,\u{A0} Haynes\u{A0} RB.The\u{A0} architecture\u{A0} of\u{A0} diagnostic research. BMJ 2002;324:539-41. <a href="http://www.ncbi.nlm.nih.gov/pubmed/11872558" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            1 => array:3 [
              "identificador" => "bib2"
              "etiqueta" => "2"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Van\u{A0} den\u{A0} BA,\u{A0} Cleemput\u{A0} I,\u{A0} Aertgeerts\u{A0} B,\u{A0} Ramaekers\u{A0} D, Buntinx F. The evaluation of diagnostic tests: evidence on technical\u{A0} and\u{A0} diagnostic\u{A0} accuracy, impact\u{A0} on\u{A0} patient outcome and cost-effectiveness is needed. J Clin Epidemiol 2007;60:1116-22. <a href="http://www.ncbi.nlm.nih.gov/pubmed/17938052" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            2 => array:3 [
              "identificador" => "bib3"
              "etiqueta" => "3"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Bossuyt\u{A0} PM,\u{A0} Irwig\u{A0} L,\u{A0} Craig\u{A0} J,\u{A0} Glasziou\u{A0} P.\u{A0} Comparative accuracy: assessing new tests against existing diagnostic pathways. BMJ 2006;332:1089-92. <a href="http://www.ncbi.nlm.nih.gov/pubmed/16675820" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            3 => array:3 [
              "identificador" => "bib4"
              "etiqueta" => "4"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Lijmer JG, Bossuyt PM. Various randomized designs can be used\u{A0} to\u{A0} evaluate\u{A0} medical\u{A0} tests.\u{A0} J\u{A0} Clin\u{A0} Epidemiol 2009;62:364-73."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            4 => array:3 [
              "identificador" => "bib5"
              "etiqueta" => "5"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Schunemann HJ, Oxman AD, Brozek J, Glasziou P, Jaeschke R, Vist GE, et al. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ 2008;336:1106-10. <a href="http://www.ncbi.nlm.nih.gov/pubmed/18483053" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            5 => array:3 [
              "identificador" => "bib6"
              "etiqueta" => "6"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Leeflang MM, Bets-Ossenkopp YJ, Visser CE, Scholten RJ, Hooft L, Bijlmer HA, et al. Galactomannan detection for invasive\u{A0} aspergillosis\u{A0} in immunocompromized patients. Cochrane.Database.Syst.Rev.CD007394, 2008."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            6 => array:3 [
              "identificador" => "bib7"
              "etiqueta" => "7"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "MEDION Database. Disponible en: http://www.mediondatabase.nl/.\u{A0} [Consultado el 3 de julio 2009.] Ref Type: Computer Program."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            7 => array:3 [
              "identificador" => "bib8"
              "etiqueta" => "8"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Leeflang MM, Scholten RJ, Rutjes AW, Reitsma JB, Bossuyt PM.\u{A0} Use\u{A0} of\u{A0} methodological\u{A0} search\u{A0} filters\u{A0} to\u{A0} identify diagnostic accuracy studies can\u{A0} lead\u{A0} to\u{A0} the omission of relevant studies. J Clin Epidemiol 2006;59:234-40. <a href="http://www.ncbi.nlm.nih.gov/pubmed/16488353" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            8 => array:3 [
              "identificador" => "bib9"
              "etiqueta" => "9"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Deeks JJ, Macaskill P, Irwig L.The performance of tests of publication bias and other sample size effects in systematic reviews of diagnostic test accuracy was assessed. J Clin Epidemiol 2005;58:882-93. <a href="http://www.ncbi.nlm.nih.gov/pubmed/16085191" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            9 => array:3 [
              "identificador" => "bib10"
              "etiqueta" => "10"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Song F, Khan KS, Dinnes J, Sutton AJ. Asymetric funnel plots and publication bias in meta-analyses of diagnostic accuracy. Int J Epidemiol 2002;31:88-95. <a href="http://www.ncbi.nlm.nih.gov/pubmed/11914301" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            10 => array:3 [
              "identificador" => "bib11"
              "etiqueta" => "11"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "11.Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF. Improving\u{A0} the\u{A0} quality\u{A0} of\u{A0} reports\u{A0} of\u{A0} meta-analyses\u{A0} of randomised controlled trials: the QUOROM statement. Quality of Reporting of Meta-analyses. Lancet 1999;354:1896-900. <a href="http://www.ncbi.nlm.nih.gov/pubmed/10584742" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            11 => array:3 [
              "identificador" => "bib12"
              "etiqueta" => "12"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP,\u{A0} Irwig\u{A0} LM,\u{A0} et\u{A0} al.\u{A0} The\u{A0} STARD\u{A0} statement\u{A0} for\u{A0} reporting studies of diagnostic accuracy: explanation and elaboration. Ann Intern Med 2003;138:W1-12. <a href="http://www.ncbi.nlm.nih.gov/pubmed/12513067" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            12 => array:3 [
              "identificador" => "bib13"
              "etiqueta" => "13"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP,\u{A0} Irwig\u{A0} LM,\u{A0} et\u{A0} al.\u{A0} Towards\u{A0} complete\u{A0} and\u{A0} accurate reporting of\u{A0} studies of diagnostic accuracy: The STARD Initiative. Ann Intern Med 2003;138:40-4."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            13 => array:3 [
              "identificador" => "bib14"
              "etiqueta" => "14"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "14.Moher D, Schulz KF, Altman DG. The CONSORT statement: revised\u{A0} recommendations\u{A0} for\u{A0} improving\u{A0} the\u{A0} quality\u{A0} of reports of parallel group randomized trials. BMC Med Res Methodol 2001;1:2."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            14 => array:3 [
              "identificador" => "bib15"
              "etiqueta" => "15"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "15.Whiting P, Rutjes AW, Reitsma JB, Bossuyt PM, Kleijnen J. The\u{A0} development\u{A0} of\u{A0} QUADAS:\u{A0} a\u{A0} tool\u{A0} for\u{A0} the\u{A0} quality assessment of studies of diagnostic accuracy included in systematic reviews. BMC Med Res Methodol 2003;3:25. <a href="http://www.ncbi.nlm.nih.gov/pubmed/14606960" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            15 => array:3 [
              "identificador" => "bib16"
              "etiqueta" => "16"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "16.Whiting PF, Weswood ME, Rutjes AW, Reitsma JB, Bossuyt PN, Kleijnen J. Evaluation of QUADAS, a tool for the quality assessment of diagnostic accuracy studies. BMC Med Res Methodol 2006;6:9."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            16 => array:3 [
              "identificador" => "bib17"
              "etiqueta" => "17"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Zamora\u{A0} J, Abraira V.\u{A0} [Analysis of\u{A0} the quality of\u{A0} studies assessing diagnostic tests]. Nefrología 2008;28 Suppl 2:42-5. <a href="http://www.ncbi.nlm.nih.gov/pubmed/18457564" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            17 => array:3 [
              "identificador" => "bib18"
              "etiqueta" => "18"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "18.Whiting P, Harbord R, Kleijnen J. No role for quality scores in systematic reviews of diagnostic accuracy studies. BMC Med Res Methodol 2005;5:19. <a href="http://www.ncbi.nlm.nih.gov/pubmed/15918898" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            18 => array:3 [
              "identificador" => "bib19"
              "etiqueta" => "19"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Lijmer JG, Mol BW, Heisterkamp S, Bonsel GJ, Prins MH, Van der Meulen\u{A0} JH, Bossuyt\u{A0} PM.\u{A0} Empirical\u{A0} evidence of design-related bias\u{A0} in studies of diagnostic tests.\u{A0} JAMA 1999;282:1061-6. <a href="http://www.ncbi.nlm.nih.gov/pubmed/10493205" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            19 => array:3 [
              "identificador" => "bib20"
              "etiqueta" => "20"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Rutjes\u{A0} AW,\u{A0} Reitsma\u{A0} JB,\u{A0} Di\u{A0} NM,\u{A0} Smidt\u{A0} N,\u{A0} van\u{A0} Rijn\u{A0} JC, Bossuyt PM. Evidence of bias and variation in diagnostic accuracy studies. CMAJ 2006;174:469-76. <a href="http://www.ncbi.nlm.nih.gov/pubmed/16477057" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            20 => array:3 [
              "identificador" => "bib21"
              "etiqueta" => "21"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Deeks\u{A0} JJ.\u{A0} Systematic\u{A0} reviews\u{A0} in health\u{A0} care:\u{A0} Systematic reviews of evaluations of diagnostic and screening tests. BMJ 2001;323:157-62. <a href="http://www.ncbi.nlm.nih.gov/pubmed/11463691" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            21 => array:3 [
              "identificador" => "bib22"
              "etiqueta" => "22"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Abraira\u{A0} V.\u{A0} Índices\u{A0} de\u{A0} rendimiento\u{A0} de\u{A0} las\u{A0} pruebas diagnósticas. SEMERGEN 2008;28:93-194."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            22 => array:3 [
              "identificador" => "bib23"
              "etiqueta" => "23"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Houssami N, Ciatto S, Macaskill P, Lord SJ, Warren RM, Dixon\u{A0} JM,\u{A0} Irwig\u{A0} L.\u{A0} Accuracy\u{A0} and\u{A0} surgical\u{A0} impact\u{A0} of magnetic\u{A0} resonance\u{A0} imaging\u{A0} in\u{A0} breast cancer\u{A0} staging: systematic\u{A0} review\u{A0} and\u{A0} meta-analysis\u{A0} in\u{A0} detection\u{A0} of multifocal\u{A0} and\u{A0} multicentric\u{A0} cancer.\u{A0} J\u{A0} Clin\u{A0} Oncol 2008;26:3248-58. <a href="http://www.ncbi.nlm.nih.gov/pubmed/18474876" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            23 => array:3 [
              "identificador" => "bib24"
              "etiqueta" => "24"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Higgins JP, Thompson SG, Deeks JJ, Altman DG. Measuring inconsistency in meta-analyses. BMJ 2003;327:557-60. <a href="http://www.ncbi.nlm.nih.gov/pubmed/12958120" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            24 => array:3 [
              "identificador" => "bib25"
              "etiqueta" => "25"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Deville WL, Buntinx F, Bouter LM, Montori VM, de Vet HC, van der Windt DA, Bezemer PD. Conducting systematic reviews of diagnostic\u{A0} studies: didactic guidelines. BMC Med Res Methodol 2002;2:9."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            25 => array:3 [
              "identificador" => "bib26"
              "etiqueta" => "26"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "26.Moses LE, Shapiro D, Littenberg B. Combining independent studies of a diagnostic test into a summary ROC curve: data-analytic approaches and some additional considerations. Stat Med 1993;12:1293-316. <a href="http://www.ncbi.nlm.nih.gov/pubmed/8210827" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            26 => array:3 [
              "identificador" => "bib27"
              "etiqueta" => "27"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Glas AS, Lijmer JG, Prins MH, Bonsel GJ, Bossuyt PM. The diagnostic odds ratio: a single indicator of test performance. J Clin Epidemiol 2003;56:1129-35. <a href="http://www.ncbi.nlm.nih.gov/pubmed/14615004" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:1 [
                        "itemHostRev" => array:3 [
                          "pii" => "S0300893211007329"
                          "estado" => "S300"
                          "issn" => "03008932"
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            27 => array:3 [
              "identificador" => "bib28"
              "etiqueta" => "28"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Lijmer JG, Bossuyt PM, Heisterkamp SH. Exploring sources of heterogeneity in systematic reviews of diagnostic tests. Stat Med 2002;21:1525-37. <a href="http://www.ncbi.nlm.nih.gov/pubmed/12111918" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            28 => array:3 [
              "identificador" => "bib29"
              "etiqueta" => "29"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "29.Walter SD. The partial area under the summary ROC curve. Stat Med 2005;24:2025-40. <a href="http://www.ncbi.nlm.nih.gov/pubmed/15900606" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            29 => array:3 [
              "identificador" => "bib30"
              "etiqueta" => "30"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Gatsonis\u{A0} C,\u{A0} Paliwal\u{A0} P. Meta-analysis\u{A0} of\u{A0} diagnostic\u{A0} and screening test accuracy evaluations: methodologic primer. Am J Roentgenol 2006;187:271-81."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            30 => array:3 [
              "identificador" => "bib31"
              "etiqueta" => "31"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Reitsma JB, Glas AS, Rutjes AW, Scholten RJ, Bossuyt PM, Zwinderman\u{A0} AH.\u{A0} Bivariate\u{A0} analysis\u{A0} of\u{A0} sensitivity\u{A0} and specificity\u{A0} produces\u{A0} informative summary measures\u{A0} in diagnostic reviews. J Clin Epidemiol 2005;58:982-90. <a href="http://www.ncbi.nlm.nih.gov/pubmed/16168343" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            31 => array:3 [
              "identificador" => "bib32"
              "etiqueta" => "32"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Rutter\u{A0} CM,\u{A0} Gatsonis\u{A0} CA.\u{A0} A\u{A0} hierarchical\u{A0} regression approach\u{A0} to\u{A0} meta-analysis\u{A0} of\u{A0} diagnostic\u{A0} test\u{A0} accuracy evaluations. Stat Med 2001;20:2865-84. <a href="http://www.ncbi.nlm.nih.gov/pubmed/11568945" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            32 => array:3 [
              "identificador" => "bib33"
              "etiqueta" => "33"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Harbord RM, Deeks JJ, Egger M, Whiting P, Sterne JA. A unification\u{A0} of\u{A0} models\u{A0} for\u{A0} meta-analysis\u{A0} of\u{A0} diagnostic accuracy studies. Biostatistics 2007;8:239-51. <a href="http://www.ncbi.nlm.nih.gov/pubmed/16698768" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            33 => array:3 [
              "identificador" => "bib34"
              "etiqueta" => "34"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Harbord RM, Whiting P, Sterne JA, Egger M, Deeks JJ, Shang A, Bachmann LM. An empirical comparison of methods for meta-analysis of diagnostic accuracy showed hierarchical models are necessary. J Clin Epidemiol 2008;61:1095-103. <a href="http://www.ncbi.nlm.nih.gov/pubmed/19208372" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            34 => array:3 [
              "identificador" => "bib35"
              "etiqueta" => "35"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Simel DL, Bossuyt PM. Differences between univariate and\u{A0} bivariate\u{A0} models\u{A0} for\u{A0} summarizing\u{A0} diagnostic accuracy may\u{A0} not\u{A0} be\u{A0} large.\u{A0} J Cl in\u{A0} Epidemiol 2009; doi:10.1016/j.jclinepi.2009.02.007."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            35 => array:3 [
              "identificador" => "bib36"
              "etiqueta" => "36"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Dwamena\u{A0} BA.\u{A0} Midas:\u{A0} A\u{A0} program\u{A0} for\u{A0} Meta-analytical Integration of Diagnostic Accuracy Studies in Stata. Division of Nuclear Medicine, Department of Radiology, University of Michigan Medical School, Ann Arbor, Michigan. 2007. Ref Type: Computer Program."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:1 [
                        "itemHostRev" => array:3 [
                          "pii" => "S0140673607612331"
                          "estado" => "S300"
                          "issn" => "01406736"
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            36 => array:3 [
              "identificador" => "bib37"
              "etiqueta" => "37"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Harbord RM. Metandi. Stata module for meta-analysis of diagnostic\u{A0} accuracy.\u{A0} Statistical\u{A0} Software\u{A0} Components, Boston College Department of Economics. Revisado el 15 abril 2008. Ref Type: Computer Program."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            37 => array:3 [
              "identificador" => "bib38"
              "etiqueta" => "38"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "38.METADAS: A SAS macro\u{A0} for meta-analysis of diagnostic accuracy studies. User guide version 1.0 beta. Diciembre 2008. Disponible en: http://srdta.cochrane.org/en/clib.html.\u{A0} [Consultado 3 julio2009.] Ref Type: Computer Program."
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:1 [
                        "itemHostRev" => array:3 [
                          "pii" => "S0735109706028580"
                          "estado" => "S300"
                          "issn" => "07351097"
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            38 => array:3 [
              "identificador" => "bib39"
              "etiqueta" => "39"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Zamora J, Abraira V, Muriel A, Khan K, Coomarasamy A. Meta-DiSc: a software for meta-analysis of test accuracy data. BMC Med Res Methodol 2006;6:31. <a href="http://www.ncbi.nlm.nih.gov/pubmed/16836745" target="_blank">[Pubmed]</a>"
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
            39 => array:3 [
              "identificador" => "bib40"
              "etiqueta" => "40"
              "referencia" => array:1 [
                0 => array:3 [
                  "referenciaCompleta" => "Review Manager\u{A0} (RevMan)\u{A0} [Programa para ordenador]. Version 5.0. Copenhague: The Nordic Cochrane Centre, The Cochrane Collaboration. 2008. Ref Type: Computer Program. "
                  "contribucion" => array:1 [
                    0 => null
                  ]
                  "host" => array:1 [
                    0 => null
                  ]
                ]
              ]
            ]
          ]
        ]
      ]
    ]
  ]
  "idiomaDefecto" => "es"
  "url" => "/20137575/0000002900000006/v0_201502101234/X2013757509002245/v0_201502101235/es/main.assets"
  "Apartado" => null
  "PDF" => "https://static.elsevier.es/multimedia/20137575/0000002900000006/v0_201502101234/X2013757509002245/v0_201502101235/es/P4-E37-S1493-A10089.pdf?idApp=UINPBA000064&text.app=https://revistanefrologia.com/"
  "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/X2013757509002245?idApp=UINPBA000064"
]
Compartir
Información de la revista
Vol. 29. Núm. 6.diciembre 2009
Suplemento de NEFROLOGÍA BASADA EN LA EVIDENCIA
Páginas 7-89
Compartir
Compartir
Descargar PDF
Más opciones de artículo
Vol. 29. Núm. 6.diciembre 2009
Suplemento de NEFROLOGÍA BASADA EN LA EVIDENCIA
Páginas 7-89
Acceso a texto completo
Estudios de evaluación de la validez de una prueba diagnóstica: revisión sistemática y metanálisis
Visitas
4633
Javier Zamora Romeroa, María Nieves Planaa, Víctor Abraira Santosa
a Unidad de Bioestadística Clínica, Hospital Ramón y Cajal y CIBER Epidemiología y Salud Pública (CIBERESP), Madrid, Madrid, España,
Este artículo ha recibido
Información del artículo
Resumen
Texto completo
Bibliografía
Descargar PDF
Estadísticas
Figuras (2)
Cada vez con mayor frecuencia se encuentran en la literatura revisiones sistemáticas y metanálisis que evalúan la validez de las pruebas diagnósticas. Si bien existe un cierto paralelismo con las homólogas revisiones de la eficacia de intervenciones terapéuticas, estas revisiones tienen peculiaridades que es preciso enfatizar. En este artículo se presenta, de forma divulgativa, el proceso de realización de una revisión sistemática de estudios de validez diagnóstica y su posterior metanálisis.
Texto completo

INTRODUCCIÓN

Desde que se propone la utilización de una prueba o estrategia  diagnóstica  hasta  que  se  incorpora  finalmente  a  la práctica  clínica  debiera  existir  un proceso  sistemático  de evaluación. El marco conceptual para la evaluación de pruebas  diagnósticas  ha  ido  evolucionando  a  lo  largo  de  los años. Ha pasado de considerarse un proceso secuencial en fases1, mimetizando en mayor o menor medida las fases I a IV  del  ensayo  clínico,  a  ser  una  evaluación globalizadora que considera  los aspectos técnicos de factibilidad, reproducibilidad, validez e impacto socioeconómico, y el contexto clínico donde se aplicará la prueba2. Este último aspecto es de vital importancia para determinar las dimensiones más adecuadas de evaluación de la prueba o estrategia diagnóstica. El  rol reservado para  la prueba, bien sea el de  reemplazar a una existente,  incorporarla como una prueba previa de cribado ¿o triage¿, o bien utilizarla como una prueba añadida a  las que ya se realizan, determinará  la dimensión de evaluación más relevante, así como el mejor diseño para determinar sus ventajas3,4.

En los últimos tiempos estamos asistiendo a un periodo de profunda reflexión entre la comunidad científica dedicada a la evaluación de pruebas diagnósticas. Por un lado, la reciente publicación de la guía de graduación de la calidad de evidencias sobre pruebas y estrategias diagnósticas (GRADE)5 y, por otro, la inclusión de Revisiones Sistemáticas de validez de pruebas diagnósticas en la Biblioteca de la Colaboración Cochrane6 son dos hitos dignos de destacar.

En el presente artículo expondremos  las características de las revisiones sistemáticas y metanálisis de estudios de validez de una prueba diagnóstica. Asumiendo que  el  lector está más familiarizado con las revisiones sistemáticas de intervenciones terapéuticas, durante los siguientes apartados ocasionalmente trazaremos el paralelismo entre ambos tipos de revisión para enfatizar las peculiaridades de las revisiones de diagnóstico.

REVISIÓN SISTEMÁTICA

El proceso de la revisión sistemática sigue las habituales fases que se inician con el planteamiento del objetivo de la revisión, la búsqueda bibliográfica y selección de artículos a incluir en la revisión, la evaluación de sus características y su calidad metodológica y el posterior análisis estadístico o metanálisis de sus resultados.

En cuanto al objetivo, las revisiones de diagnóstico con frecuencia  se  limitan a evaluar el  rendimiento de una prueba diagnóstica  respecto a un patrón de referencia  (gold  standard) sin abordar una comparación explícita con otras pruebas alternativas. El contexto clínico donde se aplicarán los resultados  de  la revisión  a  veces  no  es  explícito,  lo  que dificultará su aplicabilidad. Es relativamente fácil utilizar los resultados de una  revisión de  tratamiento para  la  toma de decisiones para un paciente en concreto, mientras que en el caso del diagnóstico, esto es más complejo. Por ello, con frecuencia las evidencias arrojadas por la revisión sistemática se utilizan para la toma de decisiones a nivel de gestores y decisores con un punto de vista más cercano a la evaluación de tecnologías sanitarias que a la práctica clínica.

Como en las revisiones de tratamiento, otro de los objetivos de la revisión es analizar los factores que afectan al rendimiento diagnóstico de una determinada prueba, como pueden ser factores relacionados con la población estudiada (espectro de la enfermedad, ámbito de estudio, etc.), características de la prueba y con el diseño del estudio.

Búsqueda y selección de artículos

Como en cualquier revisión sistemática, debe realizarse una búsqueda de estudios exhaustiva, objetiva y reproducible de la investigación primaria. Ésta no debe limitarse sólo a las bases de datos electrónicas, sino que debe complementarse con búsquedas manuales en las listas de referencias bibliográficas de los artículos incluidos, en los resúmenes de congresos relevantes, consultas con investigadores, registros de organismos evaluadores de investigación, etc. Además de las bases electrónicas habituales (MEDLINE y EMBASE) existen bases de datos específicas de estudios de diagnóstico, como la base MEDION7 que recoge revisiones publicadas de estudios de diagnóstico y de cribado.

La identificación de artículos de diagnóstico presenta más dificultades que la búsqueda de ensayos clínicos. No existe como tal un término MeSH (Medical Subject Heading) específico que sea comparable al  término «randomized controlled  trial». El término «sensitivity and specificity» puede ser el más adecuado, pero no en todas las bases de datos está bien indexado. Muchos de  los estudios de diagnóstico se realizan alrededor de la propia práctica clínica sin la existencia de un protocolo registrado y/o aprobado por comités éticos de investigación, con lo que se dificulta su seguimiento. No existe una base de datos centralizada de estudios de diagnóstico equivalente a la de ensayos clínicos. Además, hay estudios que presentan resultados de validez diagnóstica de una prueba sin que éste sea su objetivo principal. Todo esto dificulta el proceso de búsqueda y conlleva que no sea recomendable el uso de filtros metodológicos para intentar restringir y focalizar la búsqueda8.

La valoración del sesgo de publicación en los estudios de diagnóstico es mucho más compleja que su equivalente en estudios de tratamiento. Los funnel plot y demás métodos utilizados para evaluar dicho sesgo de publicación en las revisiones de tratamiento son discutidos para los estudios de diagnóstico9,10. Por otro lado, dado que habitualmente los estudios de diagnóstico no comparan pruebas diagnósticas entre sí, la publicación no suele estar condicionada por la presencia o no de una significación estadística asociada a dicha comparación.

En cualquier caso, como en las revisiones sistemáticas homólogas de tratamiento, el flujo de los estudios desde la búsqueda inicial hasta la realización del metanálisis debería representarse siguiendo la recomendación de las guías QUOROM11, es decir, mediante una gráfica donde consten los distintos estadios con sus exclusiones descritas de acuerdo a las causas.

Evaluación de la calidad de los estudios

Un aspecto clave en toda revisión sistemática es la evaluación de la calidad metodológica de los estudios incluidos con la finalidad de identificar posibles fuentes de sesgos. Vinculado al análisis de la calidad metodológica con que se diseñó y realizó el estudio, se encuentra el análisis de la forma en que se comunican los resultados del estudio. Es difícil distinguir entre ambos aspectos de la calidad dado que ambos están íntimamente relacionados. Para uno y otro análisis existen dos herramientas muy populares en la actualidad. Por una parte, la iniciativa STARD para la publicación de estudios de validez diagnóstica está dirigida a editores de revistas y a los autores de artículos y pretende mejorar la calidad de las publicaciones para permitir así a los lectores evaluar los potenciales sesgos del estudio y juzgar sobre su generalización12,13. Esta iniciativa es al área de investigación sobre diagnóstico lo que el CONSORT fue a la investigación en tratamiento14. Por otra parte, se encuentra el cuestionario QUADAS, ideado específicamente para la evaluación de la calidad de los estudios primarios incluidos en revisiones sistemáticas de diagnóstico15-17. El cuestionario contiene una serie de ítems relacionados con aspectos del diseño y el análisis del estudio que cubren desde el espectro de pacientes incluido hasta la presencia de los sesgos más frecuentes.

El uso que se puede dar a los resultados de este análisis de calidad es un tema de debate. Se propone desde una simple descripción de esta calidad con el objeto de valorar el alcance de las evidencias disponibles, hasta la propuesta más drástica de excluir del análisis a los estudios de más baja calidad. En lo que sí parece haber un cierto consenso es en desaconsejar resumir  la calidad en una única puntuación numérica y en la dificultad de incorporar explícitamente la calidad en la ponderación de los estudios primarios a la hora de analizar los datos18. Una alternativa común es la realización de análisis de sensibilidad comparando los resultados que se obtienen incluyendo y excluyendo  determinados  estudios  en  función  de  su  calidad  o  de determinadas características del diseño.

A partir de las publicaciones de Lijmer19 inicialmente, y Rutjes20 más tarde, existe un consenso generalizado en recomendar la exclusión de los estudios con diseño de casos y controles, dado que sobrestiman la validez de las pruebas y pueden considerarse fases previas de la evaluación de la validez1.

Análisis estadístico

En general, el metanálisis es un proceso en dos etapas21. En un primer paso se estiman los resultados de cada estudio, aunque en el caso de la evaluación de pruebas diagnósticas cada estudio es resumido no por un índice, como en los estudios de evaluación de  tratamientos, sino por una pareja de  índices que describen la validez de la prueba. Habitualmente, estos dos índices son sensibilidad y especificidad, o bien los cocientes de probabilidad positivo y negativo22. Debe huirse, en la medida de lo posible, de utilizar los valores predictivos pues, como es bien sabido, dependen de la prevalencia de la condición clínica que se diagnostica y ésta puede ser muy variable de estudio a estudio. Sin embargo, a veces es el único índice que se puede obtener por las características del método de referencia23. En un segundo paso se deben calcular índices globales de validez para lo que se han propuesto diversos métodos, que se expondrán más adelante.

Abordar un metanálisis sólo es apropiado en el caso de que exista homogeneidad metodológica en los estudios incluidos en la revisión, es decir, que todos ellos hayan evaluado la misma prueba diagnóstica, usando un mismo método de referencia y en pacientes similares. Para valorar estos aspectos se deben extraer los datos pertinentes de los estudios, utilizando formularios ad hoc y en la medida de lo posible por duplicado, para incrementar el grado de objetividad del proceso. Estos datos se referirán a las características del diseño del estudio, su calidad metodológica, las características de los pacientes y del ámbito del estudio, de la prueba evaluada y de referencia y, finalmente, los resultados observados. Es importante destacar que este último aspecto a veces limita la inclusión de un estudio en el análisis. Si no fuera posible extraer los datos de validez diagnóstica de un estudio individual en forma de tabla de clasificación cruzada, el estudio debe ser excluido de la revisión.

Evaluación de la heterogeneidad

Además de  la homogeneidad metodológica mencionada, se debe valorar  la eventual presencia de heterogeneidad estadística en los resultados. Esta evaluación puede hacerse gráficamente presentando  la  sensibilidad  y especificidad de cada estudio en un forest plot (figura 1). En estos gráficos se representan los estimadores de los índices junto  con  sus  intervalos de  confianza,  y  suelen presentarse pareados y ordenados de acuerdo a uno de los índices. Lo habitual es encontrar cierta dispersión por el azar en la selección de  las muestras de  los estudios, pero otros  factores  la pueden aumentar y el metanálisis debe explorar e identificar estas posibles  fuentes de heterogeneidad. Una evaluación estadística de la «cantidad» de heterogeneidad presente se puede realizar mediante una prueba de la ji al cuadrado. Es  frecuente cuantificar su magnitud mediante el índice de inconsistencia (I2) y una guía, no exenta de críticas, para su interpretación clasifica el índice en baja (25-50%), media (51-75%) y sustancial (>75%)24.

Una  fuente característica de heterogeneidad en  los metanálisis de validez de las pruebas diagnósticas es la que surge porque  los estudios  incluidos pueden haber usado diferentes umbrales para definir qué es un resultado positivo de la prueba. Este efecto es conocido como «efecto umbral». La definición del umbral de positividad a veces puede  ser explícita, como en el caso de  la proteína C reactiva, o  implícita como en el caso de pruebas con  interpretación subjetiva (pruebas de  imagen) o  cuando  los  resultados de  la prueba puedan verse afectados por  la calibración del aparato de medida. Desafortunadamente, este efecto está presente  con mucha  frecuencia  en  la  evaluación de pruebas diagnósticas.

Efecto umbral

Para explorar esta  fuente de variación es útil  representar en una gráfica las parejas de sensibilidad y especificidad de cada estudio en un plano ROC (figura 2). En este plano, la zona más cercana a la esquina superior izquierda supone un buen rendimiento diagnóstico mientras que la zona central, la diagonal en la que sensibilidad y especificidad son iguales, representa una nula capacidad diagnóstica. Si existiera «efecto umbral», los puntos en el plano mostrarían un patrón curvilíneo. Cambiando el umbral de positividad de una prueba se obtendría una mayor (o menor) sensibilidad con el consiguiente efecto contrario sobre la especificidad. Además de gráficamente, este «efecto umbral» puede evaluarse mediante el coeficiente de correlación de Spearman entre la sensibilidad y la especificidad, ya que de existir dicho efecto mostraría una correlación inversa25.

Los métodos estadísticos más robustos propuestos para el metanálisis tienen en cuenta esta correlación entre sensibilidad y especificidad, y lo hacen mediante la estimación de una curva ROC resumen  (sROC) de  los estudios  incluidos. En presencia de «efecto umbral», no es adecuado aglomerar los índices de sensibilidad y especificidad (o cocientes de probabilidad) independientemente uno del otro ignorando su correlación.

Sin embargo, en limitadas ocasiones los resultados de los estudios primarios son homogéneos y puede descartarse la presencia tanto de efecto umbral como de otras fuentes de heterogeneidad. En esta situación, el resultado global de la revisión podría obtenerse a partir de la combinación ponderada de los índices de los estudios individuales. Como siempre, esta combinación puede hacerse mediante un modelo de efectos fijos o bien mediante un modelo de efectos aleatorios, dependiendo de la magnitud de la heterogeneidad.

Se han propuesto varios métodos para estimar la curva sROC. El primero de ellos, debido a Moses, et al.26, se basa en estimar la regresión lineal entre dos variables creadas a partir de los índices de validez de cada estudio. Estas variables son D y S, que representan, respectivamente, el logaritmo del odds ratio diagnóstico (ORD)27 y una medida indirecta del umbral de positividad de la prueba calculada como:

S = logit(TVP) + logit(TFP).

TVP y TFP son las tasas de verdaderos y falsos positivos, respectivamente, y logit(TVP) es el logaritmo de TVP dividido por su complementario (1¿TVP). Es fácil ver que ambas tasas de resultados positivos cambian con el umbral de positividad de la prueba.

La propuesta de Moses consiste en ajustar el modelo D = a + bS. El contraste sobre si hay variación del rendimiento diagnóstico (medido por el ORD) con el umbral es equivalente al realizado sobre el parámetro b del modelo. Si b = 0 no hay variación y el método da  lugar a una curva  sROC  simétrica mientras que si b ≠ 0 existe variación del rendimiento con el umbral y la curva sROC es asimétrica y se obtiene deshaciendo la transformación a los ejes originales del plano ROC.

El modelo puede extenderse para analizar el efecto de otros factores sobre el rendimiento diagnóstico (ORD). Estos factores pueden ser relativos al diseño del estudio, características de los pacientes o del  test y se  incluirían en el modelo anterior como covariables28.

Se han propuesto distintos estadísticos útiles para resumir una curva sROC. El más habitual es el área bajo la curva (ABC) que resume el rendimiento diagnóstico de la prueba en un solo número29: las pruebas perfectas tienen un ABC cercano a 1 y las inútiles cercano a 0,5. Este número puede interpretarse como la probabilidad de clasificar correctamente a dos sujetos seleccionados al azar, uno con la enfermedad y otro sin ella. Finalmente, puede usarse el área para comparar el rendimiento de distintas pruebas diagnósticas. Otro estadístico útil es el índice Q*, definido como el punto en el que la sensibilidad y la especificidad son  iguales. En una curva simétrica este punto es el más cercano al extremo superior izquierdo del plano ROC. Por último, la curva sROC ajustada puede utilizarse para extrapolar una sensibilidad a partir de una especificidad dada o viceversa.

Modelos bivariantes y jerárquicos

El modelo de Moses presenta algunas  limitaciones. Por una parte, no tiene en cuenta la distinta precisión con la que se estimaron la sensibilidad y la especificidad en cada estudio, tampoco incorpora la heterogeneidad entre estudios y, por último, la variable independiente del modelo es aleatoria y, por tanto, tiene error de medición30. Para superar estas  limitaciones, se han propuesto recientemente modelos de regresión más complejos para estimar la curva sROC.

El primero de ellos es un modelo de efectos aleatorios, bivariante, que parte de la asunción de que los logit de sensibilidad y especificidad siguen una distribución normal bivariante. El modelo contempla  la eventual correlación entre ambos índices, modeliza la distinta precisión con la que han sido estimadas la sensibilidad y la especificidad e incorpora una fuente de heterogeneidad adicional debida a la varianza entre estudios31.

La  segunda  propuesta  se  refiere  al modelo  conocido  como HSROC o modelo jerárquico. Es similar al modelo anterior, salvo que hace explícita la relación existente entre sensibilidad y especificidad a través del umbral. Como el anterior, también tiene en cuenta la heterogeneidad entre estudios1,32.

Ambos modelos, bivariante y jerárquico, permiten obtener estimaciones promedio de sensibilidad y especificidad con sus correspondientes regiones de confianza y predicción. Las diferencias entre ambos modelos son pequeñas y recientemente se ha demostrado que, en ausencia de covariables, ambos abordajes son distintas parametrizaciones del mismo modelo33. Aunque recientemente se ha abogado por la necesidad de utilizar estos métodos34, los resultados proporcionados por estos métodos más sofisticados son muy similares a los obtenidos por el modelo de Moses35.

Existe una gran variedad de paquetes estadísticos que pueden utilizarse para realizar los análisis descritos. Unos son de propósito general, como el SAS y el Stata, que a través de una serie de macros programadas por usuarios facilitan la obtención de los modelos descritos. Las más populares son las macros de Stata denominadas midas36 y metandi37, y la macro desarrollada para SAS denominada metadas38. Otros programas específicos para el metanálisis de estudios de pruebas diagnósticas son el Meta-DiSc39 y el RevMan40 en su versión 5. Ambos realizan  los análisis básicos mencionados en este artículo,  si bien RevMan permite incorporar los resultados obtenidos con los modelos bivariantes.

Aunque nos hallamos en una época muy activa en el diseño de métodos para realizar las revisiones sistemáticas de pruebas diagnósticas, queda mucho camino por andar hasta  llegar a equiparar estos métodos con los desarrollados en el ámbito de las revisiones de tratamiento. Estamos seguros de que en un futuro cercano irán apareciendo más desarrollos metodológicos que situarán a la investigación sobre pruebas diagnósticas en el lugar que le corresponde por su importancia en el proceso clínico-asistencial.

Figura 1.

Figura 2.

Bibliografía
[1]
Sackett  DL,  Haynes  RB.The  architecture  of  diagnostic research. BMJ 2002;324:539-41. [Pubmed]
[2]
Van  den  BA,  Cleemput  I,  Aertgeerts  B,  Ramaekers  D, Buntinx F. The evaluation of diagnostic tests: evidence on technical  and  diagnostic  accuracy, impact  on  patient outcome and cost-effectiveness is needed. J Clin Epidemiol 2007;60:1116-22. [Pubmed]
[3]
Bossuyt  PM,  Irwig  L,  Craig  J,  Glasziou  P.  Comparative accuracy: assessing new tests against existing diagnostic pathways. BMJ 2006;332:1089-92. [Pubmed]
[4]
Lijmer JG, Bossuyt PM. Various randomized designs can be used  to  evaluate  medical  tests.  J  Clin  Epidemiol 2009;62:364-73.
[5]
Schunemann HJ, Oxman AD, Brozek J, Glasziou P, Jaeschke R, Vist GE, et al. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ 2008;336:1106-10. [Pubmed]
[6]
Leeflang MM, Bets-Ossenkopp YJ, Visser CE, Scholten RJ, Hooft L, Bijlmer HA, et al. Galactomannan detection for invasive  aspergillosis  in immunocompromized patients. Cochrane.Database.Syst.Rev.CD007394, 2008.
[7]
MEDION Database. Disponible en: http://www.mediondatabase.nl/.  [Consultado el 3 de julio 2009.] Ref Type: Computer Program.
[8]
Leeflang MM, Scholten RJ, Rutjes AW, Reitsma JB, Bossuyt PM.  Use  of  methodological  search  filters  to  identify diagnostic accuracy studies can  lead  to  the omission of relevant studies. J Clin Epidemiol 2006;59:234-40. [Pubmed]
[9]
Deeks JJ, Macaskill P, Irwig L.The performance of tests of publication bias and other sample size effects in systematic reviews of diagnostic test accuracy was assessed. J Clin Epidemiol 2005;58:882-93. [Pubmed]
[10]
Song F, Khan KS, Dinnes J, Sutton AJ. Asymetric funnel plots and publication bias in meta-analyses of diagnostic accuracy. Int J Epidemiol 2002;31:88-95. [Pubmed]
[11]
11.Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF. Improving  the  quality  of  reports  of  meta-analyses  of randomised controlled trials: the QUOROM statement. Quality of Reporting of Meta-analyses. Lancet 1999;354:1896-900. [Pubmed]
[12]
Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP,  Irwig  LM,  et  al.  The  STARD  statement  for  reporting studies of diagnostic accuracy: explanation and elaboration. Ann Intern Med 2003;138:W1-12. [Pubmed]
[13]
Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP,  Irwig  LM,  et  al.  Towards  complete  and  accurate reporting of  studies of diagnostic accuracy: The STARD Initiative. Ann Intern Med 2003;138:40-4.
[14]
14.Moher D, Schulz KF, Altman DG. The CONSORT statement: revised  recommendations  for  improving  the  quality  of reports of parallel group randomized trials. BMC Med Res Methodol 2001;1:2.
[15]
15.Whiting P, Rutjes AW, Reitsma JB, Bossuyt PM, Kleijnen J. The  development  of  QUADAS:  a  tool  for  the  quality assessment of studies of diagnostic accuracy included in systematic reviews. BMC Med Res Methodol 2003;3:25. [Pubmed]
[16]
16.Whiting PF, Weswood ME, Rutjes AW, Reitsma JB, Bossuyt PN, Kleijnen J. Evaluation of QUADAS, a tool for the quality assessment of diagnostic accuracy studies. BMC Med Res Methodol 2006;6:9.
[17]
Zamora  J, Abraira V.  [Analysis of  the quality of  studies assessing diagnostic tests]. Nefrología 2008;28 Suppl 2:42-5. [Pubmed]
[18]
18.Whiting P, Harbord R, Kleijnen J. No role for quality scores in systematic reviews of diagnostic accuracy studies. BMC Med Res Methodol 2005;5:19. [Pubmed]
[19]
Lijmer JG, Mol BW, Heisterkamp S, Bonsel GJ, Prins MH, Van der Meulen  JH, Bossuyt  PM.  Empirical  evidence of design-related bias  in studies of diagnostic tests.  JAMA 1999;282:1061-6. [Pubmed]
[20]
Rutjes  AW,  Reitsma  JB,  Di  NM,  Smidt  N,  van  Rijn  JC, Bossuyt PM. Evidence of bias and variation in diagnostic accuracy studies. CMAJ 2006;174:469-76. [Pubmed]
[21]
Deeks  JJ.  Systematic  reviews  in health  care:  Systematic reviews of evaluations of diagnostic and screening tests. BMJ 2001;323:157-62. [Pubmed]
[22]
Abraira  V.  Índices  de  rendimiento  de  las  pruebas diagnósticas. SEMERGEN 2008;28:93-194.
[23]
Houssami N, Ciatto S, Macaskill P, Lord SJ, Warren RM, Dixon  JM,  Irwig  L.  Accuracy  and  surgical  impact  of magnetic  resonance  imaging  in  breast cancer  staging: systematic  review  and  meta-analysis  in  detection  of multifocal  and  multicentric  cancer.  J  Clin  Oncol 2008;26:3248-58. [Pubmed]
[24]
Higgins JP, Thompson SG, Deeks JJ, Altman DG. Measuring inconsistency in meta-analyses. BMJ 2003;327:557-60. [Pubmed]
[25]
Deville WL, Buntinx F, Bouter LM, Montori VM, de Vet HC, van der Windt DA, Bezemer PD. Conducting systematic reviews of diagnostic  studies: didactic guidelines. BMC Med Res Methodol 2002;2:9.
[26]
26.Moses LE, Shapiro D, Littenberg B. Combining independent studies of a diagnostic test into a summary ROC curve: data-analytic approaches and some additional considerations. Stat Med 1993;12:1293-316. [Pubmed]
[27]
Glas AS, Lijmer JG, Prins MH, Bonsel GJ, Bossuyt PM. The diagnostic odds ratio: a single indicator of test performance. J Clin Epidemiol 2003;56:1129-35. [Pubmed]
[28]
Lijmer JG, Bossuyt PM, Heisterkamp SH. Exploring sources of heterogeneity in systematic reviews of diagnostic tests. Stat Med 2002;21:1525-37. [Pubmed]
[29]
29.Walter SD. The partial area under the summary ROC curve. Stat Med 2005;24:2025-40. [Pubmed]
[30]
Gatsonis  C,  Paliwal  P. Meta-analysis  of  diagnostic  and screening test accuracy evaluations: methodologic primer. Am J Roentgenol 2006;187:271-81.
[31]
Reitsma JB, Glas AS, Rutjes AW, Scholten RJ, Bossuyt PM, Zwinderman  AH.  Bivariate  analysis  of  sensitivity  and specificity  produces  informative summary measures  in diagnostic reviews. J Clin Epidemiol 2005;58:982-90. [Pubmed]
[32]
Rutter  CM,  Gatsonis  CA.  A  hierarchical  regression approach  to  meta-analysis  of  diagnostic  test  accuracy evaluations. Stat Med 2001;20:2865-84. [Pubmed]
[33]
Harbord RM, Deeks JJ, Egger M, Whiting P, Sterne JA. A unification  of  models  for  meta-analysis  of  diagnostic accuracy studies. Biostatistics 2007;8:239-51. [Pubmed]
[34]
Harbord RM, Whiting P, Sterne JA, Egger M, Deeks JJ, Shang A, Bachmann LM. An empirical comparison of methods for meta-analysis of diagnostic accuracy showed hierarchical models are necessary. J Clin Epidemiol 2008;61:1095-103. [Pubmed]
[35]
Simel DL, Bossuyt PM. Differences between univariate and  bivariate  models  for  summarizing  diagnostic accuracy may  not  be  large.  J Cl in  Epidemiol 2009; doi:10.1016/j.jclinepi.2009.02.007.
[36]
Dwamena  BA.  Midas:  A  program  for  Meta-analytical Integration of Diagnostic Accuracy Studies in Stata. Division of Nuclear Medicine, Department of Radiology, University of Michigan Medical School, Ann Arbor, Michigan. 2007. Ref Type: Computer Program.
[37]
Harbord RM. Metandi. Stata module for meta-analysis of diagnostic  accuracy.  Statistical  Software  Components, Boston College Department of Economics. Revisado el 15 abril 2008. Ref Type: Computer Program.
[38]
38.METADAS: A SAS macro  for meta-analysis of diagnostic accuracy studies. User guide version 1.0 beta. Diciembre 2008. Disponible en: http://srdta.cochrane.org/en/clib.html.  [Consultado 3 julio2009.] Ref Type: Computer Program.
[39]
Zamora J, Abraira V, Muriel A, Khan K, Coomarasamy A. Meta-DiSc: a software for meta-analysis of test accuracy data. BMC Med Res Methodol 2006;6:31. [Pubmed]
[40]
Review Manager  (RevMan)  [Programa para ordenador]. Version 5.0. Copenhague: The Nordic Cochrane Centre, The Cochrane Collaboration. 2008. Ref Type: Computer Program.
Descargar PDF
Idiomas
Nefrología
Opciones de artículo
Herramientas
es en

¿Es usted profesional sanitario apto para prescribir o dispensar medicamentos?

Are you a health professional able to prescribe or dispense drugs?