Elaboración de Guías de Práctica Clínica en el Sistema Nacional de Salud

Manual metodológico

  1. Introducción
  2. Alcance y objetivos de una guía de práctica clínica (GPC)
  3. Composición y funcionamiento del grupo elaborador de la GPC
  4. Formulación de las preguntas clínicas de la GPC
  5. Búsqueda y selección de la evidencia científica
  6. Evaluación y síntesis de la evidencia científica
  7. Formulación de las recomendaciones
  8. Claves para facilitar la implementación de las GPC
  9. Implicación de los pacientes/cuidadores en la elaboración de GPC
  10. Revisión externa
  11. Edición de la GPC
  12. Anexos
  13. Listado completo de tablas y figuras

Logo de Adobe pdfDescargar apartado 7 (546 Kb)
Descargar manual metodológico completo (1.95 Mb)

7. Formulación de recomendaciones

Pablo Alonso, Rafael Rotaeche, Arritxu Etxeberria

En este apartado se desarrollan los principales aspectos que se deben tener en cuenta a la hora de formular las recomendaciones de la GPC. Se describe el sistema SIGN modificado (que combina los métodos de SIGN y del Centro de Medicina Basada en la Evidencia de Oxford), para clasificar la calidad de la evidencia y graduar la fuerza de las recomendaciones. También se presenta la propuesta, actualmente en desarrollo, del grupo internacional GRADE (Grading of Recommendations Assessment, Development and Evaluation, Graduación de la valoración, desarrollo y evaluación de las recomendaciones). Además se aporta información para orientar al grupo elaborador de la guía sobre cómo recomendar líneas para futuras investigaciones.

Introducción

Cuando se formulan recomendaciones, el grupo elaborador de la guía (GEG) debe plantearse hasta que punto se puede confiar en que llevar a cabo una recomendación conllevará más beneficios que daños. Esta decisión no es sencilla y está influida por múltiples factores que convierten esta etapa en una de las más complejas de la elaboración de una guía.

El Instrumento AGREE, dentro de la dimensión "Rigor en la elaboración" (criterios 10-12), hace especial hincapié en la etapa de formulación de recomendaciones mediante las siguientes preguntas (ver anexo 1 (versión pdf, 73 kb)):

  • ¿Los métodos para formular las recomendaciones están claramente descritos?
  • ¿Han sido considerados al formular las recomendaciones los beneficios de salud, los efectos secundarios y los riesgos?
  • ¿Hay una relación clara entre cada una de las recomendaciones y las evidencias científicas en las que se basan?

Los sistemas de formulación de recomendaciones se comenzaron a proponer desde hace más de dos décadas. Estos sistemas diferenciaban ya inicialmente el nivel de evidencia científica (la adecuación de los diferentes diseños de estudios para contestar a los diferentes tipos de preguntas) de la fuerza de las recomendaciones. Desde entonces los diferentes sistemas han ido evolucionando e incorporando otros aspectos más allá del diseño de los estudios que hay que tener en cuenta a la hora de formular recomendaciones.

ir arriba

7.1. Etapas para la formulación de recomendaciones

Las etapas para la formulación de recomendaciones son fundamentalmente dos:

  • Evaluación de la calidad global de la evidencia científica.
  • Graduación de la fuerza de las recomendaciones.

La valoración de la importancia de las variables de resultado es una etapa preliminar que debe tener lugar en la fase de formulación de las preguntas clínicas en formato PICO (ver apartado 4, "Formulación de las preguntas clínicas de la GPC").

Las variables de resultado pueden tener una importancia muy diferente a la hora de tomar decisiones. Por ejemplo, los pacientes y cuidadores pueden valorarlas de manera diferente a los clínicos. El hecho de conocer la importancia relativa de las variables de resultado es relevante, ya que como se verá más adelante, las variables de resultado de mayor importancia son las que deberán tener un mayor peso al evaluar la calidad de la evidencia científica disponible para cada pregunta.

ir arriba

7.1.1. Evaluación de la calidad de la evidencia científica

La etapa inicial de la formulación de las recomendaciones es la evaluación de la calidad de la información de la que se dispone. Por calidad de la evidencia científica se entiende la confianza que se tiene en que el efecto que reflejan los estudios es cierto. En el contexto de una GPC, la calidad de la evidencia científica hace referencia a la confianza en que la estimación de un efecto es adecuada para apoyar una recomendación1. Cuanto más alta sea la calidad, mayor será la confianza y por tanto, menor será la probabilidad de que estudios posteriores modifiquen el efecto observado.

Para llevar a cabo la evaluación de la calidad (ver apartado 6. "Evaluación y síntesis de la evidencia") es necesario contar con las tablas de evidencia de los estudios que se han seleccionado, y priorizar los diseños más apropiados para cada tipo de pregunta (por ejemplo, revisiones sistemáticas de ensayos clínicos en preguntas sobre la eficacia de un tratamiento).

ir arriba

7.1.2. Graduación de la fuerza de las recomendaciones

En esta segunda etapa, el GEG debe decidir hasta qué punto puede confiar en que si se pone en práctica una determinada recomendación, ésta conllevará más beneficios que riesgos. Aparte de la calidad de la evidencia científica, existen otros factores que se deben tener en cuenta y que pueden afectar a la fortaleza con la que se formule la recomendación.

ir arriba

7.2. Sistemas para formular recomendaciones

Un sistema para clasificar la calidad de la evidencia científica y graduar la fuerza de las recomendaciones debe combinar la sencillez con la transparencia. En este manual se describen dos sistemas de formulación de recomendaciones: el sistema SIGN modificado y el sistema del grupo GRADE.

A continuación se describen de forma detallada el sistema modificado SIGN.

ir arriba

7.2.1. Elaboración de las recomendaciones con el sistema modificado de SIGN

El sistema SIGN modificado se basa en el sistema del Centro de Medicina Basada en la Evidencia de Oxford2 (CMBE) para las preguntas sobre diagnóstico, y en el de SIGN para el resto de preguntas (tratamiento, pronóstico, etc.).

El sistema SIGN3 ha sido ampliamente utilizado en los últimos años por esa institución y otras de reconocido prestigio como el Grupo Neozelandés de GPC4. En nuestro medio lo ha utilizado el Servicio Vasco de Salud (Osakidetza).

ir arriba

a) Resumen y clasificación de la evidencia científica

La escala de SIGN utiliza dos atributos para evaluar la calidad de la evidencia científica (nivel de evidencia): el diseño del estudio y el riesgo de sesgo. Para la clasificación del diseño del estudio se utilizan los números del 1 al 4. El número 1 corresponde a ensayos clínicos o a revisiones sistemáticas de estos ensayos, y el 4 a la opinión de expertos. Para evaluar el riesgo de sesgo se utilizan signos que informan sobre el grado de cumplimiento de los criterios clave relacionados con ese potencial riesgo (++, + y -) (ver tabla 7.1). De esta forma, con la ayuda de la plantilla de lectura crítica se evalúa cada estudio, ya sean estudios individuales (ECAS, cohortes, etc.) o revisiones sistemáticas (RS) (ver apartado 6 de este manual: "Evaluación y síntesis de la evidencia"). Esta valoración de la calidad de la evidencia científica de los diferentes estudios disponibles para responder a las preguntas formuladas, será posteriormente utilizada en la graduación de la fuerza de las recomendaciones.

Tabla 7.1. Niveles de evidencia científica y grados de recomendación de SIGN3

Niveles de evidencia científica
1++ Metaanálisis de alta calidad, revisiones sistemáticas de ensayos clínicos o ensayos clínicos de alta calidad con muy poco riesgo de sesgo.
1+ Metaanálisis bien realizados, revisiones sistemáticas de ensayos clínicos o ensayos clínicos bien realizados con poco riesgo de sesgos.
1- Metaanálisis, revisiones sistemáticas de ensayos clínicos o ensayos clínicos con alto riesgo de sesgos.
2++ Revisiones sistemáticas de alta calidad de estudios de cohortes o de casos y controles. Estudios de cohortes o de casos y controles con riesgo muy bajo de sesgo y con alta probabilidad de establecer una relación causal.
2+ Estudios de cohortes o de casos y controles bien realizados con bajo riesgo de sesgo y con una moderada probabilidad de establecer una relación causal.
2- Estudios de cohortes o de casos y controles con alto riesgo de sesgo y riesgo significativo de que la relación no sea causal.
3 Estudios no analíticos, como informes de casos y series de casos.
4 Opinión de expertos.
Grados de recomendación
A Al menos un metaanálisis, revisión sistemática o ensayo clínico clasificado como 1++ y directamente aplicable a la población diana de la guía; o un volumen de evidencia científica compuesto por estudios clasificados como 1+ y con gran consistencia entre ellos.
B Un volumen de evidencia científica compuesta por estudios clasificados como 2 ++, directamente aplicable a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica extrapolada desde estudios clasificados como 1 ++ ó 1+
C Un volumen de evidencia científica compuesta por estudios clasificados como 2 + directamente aplicables a la población diana de la guía y que demuestran gran consistencia entre ellos; o evidencia científica extrapolada desde estudios clasificados como 2 ++
D Evidencia científica de nivel 3 ó 4; o evidencia científica extrapolada desde estudios clasificados como 2+

Los estudios clasificados como 1- y 2- no deben usarse en el proceso de elaboración de recomendaciones por su alto potencial de
sesgo.

Buena práctica clínica

Símbolo de raíz cuadrada Práctica recomendada, basada en la experiencia clínica y el consenso del equipo redactor.

1. En ocasiones el grupo elaborador se percata de que existe algún aspecto práctico importante sobre el que se quiere hacer énfasis y para el cual no existe, probablemente, ninguna evidencia científica que lo soporte. En general estos casos están relacionados con algún aspecto del tratamiento considerado buena práctica clínica y que nadie cuestionaría habitualmente. Estos aspectos son valorados como puntos de buena práctica clínica. Estos mensajes no son una alternativa a las recomendaciones basadas en la evidencia científica sino que deben considerarse únicamente cuando no existe otra manera de destacar dicho aspecto.

Una de las limitaciones que presenta el sistema SIGN es la evaluación de la calidad de los estudios sobre preguntas de diagnóstico. En este sistema, al usar una única clasificación para la calidad de la evidencia científica de acuerdo al diseño de los estudios, los únicos que pueden llegar a ser de calidad alta son los ensayos clínicos o las revisiones sistemáticas. En el caso de los estudios sobre validez de pruebas diagnósticas, los estudios transversales o de cohorte, el sistema SIGN no les otorga el nivel máximo de evidencia científica. Aunque estos diseños son los más apropiados para evaluar la validez diagnóstica de una prueba, el máximo nivel que pueden alcanzar en esta clasificación es el de 2 (estudios observacionales), y por tanto dan lugar a recomendaciones de grado B o inferiores. Debido a estas limitaciones, diversas instituciones, como NICE5, introducen una adaptación del sistema del Centro de Medicina Basada en la Evidencia de Oxford2 para los estudios de pruebas diagnósticas. (ver tabla 7.2).

Tabla 7.2. Niveles de Evidencia científica y formulación de recomendaciones para preguntas sobre Diagnóstico5:

Niveles de evidencia científica Tipo de evidencia científica
Ia Revisión sistemática con homogeneidad de estudios de nivel 1.
Ib Estudios de nivel 1.
II Estudios de nivel 2.
Revisión sistemática de estudios de nivel 2.
III Estudios de nivel 3.
Revisión sistemática de estudios de nivel 3.
IV Consenso, opiniones de expertos sin valoración crítica explícita.
Estudios de Nivel 1 Cumplen :
  • Comparación enmascarada con una prueba de referencia ("patrón oro") válida.
  • Espectro adecuado de pacientes.
Estudios de Nivel 2 Presentan sólo uno de estos sesgos:
  • Población no representativa (la muestra no refleja la población donde se aplicará la prueba).
  • Comparación con el patrón de referencia ("patrón oro") inadecuado (la prueba que se evaluará forma parte del patrón oro o el resultado de la prueba influye en la realización del patrón oro).
  • Comparación no enmascarada.
  • Estudios casos-control.
Estudios de Nivel 3 Presentan dos o más de los criterios descritos en los estudios de nivel 2


Recomendación Evidencia
A Ia o Ib
B II
C III
D IV

ir arriba

b) Formulación de recomendaciones

La formulación de las recomendaciones es una de las tareas más complejas, debido a la multiplicidad de factores que es necesario valorar para realizarla de una manera objetiva, explícita y ordenada. El sistema SIGN fue uno de los primeros en establecer de forma explícita los diversos factores, además de la calidad de la evidencia científica, que hay que tener en cuenta a la hora de formular y graduar la fuerza de las recomendaciones. Este proceso, denominado "Evaluación formal" o "Juicio razonado", parte de la utilización de las tablas de síntesis o tablas de evidencia.

Tal como se presenta en el apartado 6 de este manual, para cada pregunta clínica en la tabla de síntesis se reflejan las principales características de los diferentes estudios incluidos (diseño, población, variables de resultado y magnitud del efecto), así como su potencial riesgo de sesgo o validez interna (ver anexo 14-a (versión pdf, 240 kb)).

En el proceso de "Evaluación formal" o "Juicio razonado" se valoran los siguientes aspectos clave (ver Anexo 14-a (versión pdf, 240 kb)):

  • Cantidad, calidad y consistencia de la evidencia científica: es importante valorar el número de estudios localizados y su calidad metodológica. Cuando los estudios localizados son escasos o de calidad insuficiente, las recomendaciones deben hacerse con mayor cautela. Lo mismo ocurre si los estudios localizados se componen de un número reducido de pacientes o de eventos. El GEG debe valorar si el efecto observado es consistente para las distintas poblaciones de los diferentes estudios evaluados. En ocasiones (por ejemplo, en el caso de las revisiones sistemáticas), se dispone de análisis estadísticos que evalúan el grado de homogeneidad entre los estudios. En caso de presentar un grado considerable de heterogeneidad, la confianza en los resultados será menor. Es necesario explorar las razones que explican esa variabilidad en los resultados. La heterogeneidad puede ser debida a la diferente calidad metodológica de los estudios, a las características de la población (grupos de edad, presencia de comorbilidad, estadios de la enfermedad, etc.) o de las intervenciones (dosis y posología de fármacos, intensidad de las intervenciones, etc.).
  • Generalización de los resultados: El sistema SIGN hace hincapié en la necesidad de sopesar si la evidencia científica de los ECA alejados de la práctica real (por ejemplo, con criterios de exclusión muy restrictivos) puede ser la misma en un entorno de práctica clínica diferente. La presencia de estudios observacionales o de ECA con criterios más cercanos a la realidad clínica (más pragmáticos) reforzará la confianza en el efecto observado. De manera similar, la ausencia de estudios pragmáticos en el contexto de ECA con poblaciones muy seleccionadas, y con un pronóstico potencialmente diferente de la población de interés de la guía, puede disminuir la confianza y llevar al grupo a formular una recomendación con menos fuerza.
  • Aplicabilidad: es importante valorar si los estudios disponibles son directamente aplicables a la población a quien va dirigida la GPC. Es necesario por tanto comparar las potenciales diferencias (por ejemplo, diferencias en el riesgo basal, en la etnia o el sexo de los pacientes, tipo de población, atención primaria o especializada, etc.). Asimismo es importante valorar aspectos diferenciales en los proveedores de salud, en los recursos disponibles, o en los relacionados con factores culturales (diferencias en los valores y preferencias tanto de pacientes como de profesionales sanitarios).
  • Impacto clínico: una de las cuestiones finales que el GEG debe plantearse es si los beneficios esperables de llevar a cabo una recomendación son suficientes para justificarla. Esto depende de varios aspectos entre los que están: balance riesgo-beneficio, el tamaño de la población diana, la magnitud del efecto con respecto a otras opciones o la duración del tratamiento. SIGN recomienda que si no se han evaluado los estudios disponibles sobre las consecuencias económicas relacionados con una recomendación, el grupo debería considerar algunas cuestiones que se apuntan a continuación:
    • ¿La acción propuesta por la recomendación conlleva la utilización de recursos disponibles en la actualidad en el Sistema Nacional de Salud?
    • Si no es así, ¿estos recursos están probablemente disponibles en cualquier lugar del sistema de salud?
    • ¿La implantación de la recomendación conllevará una utilización de recursos adicionales o la reubicación de recursos ya disponibles actualmente?
    • ¿Cuál es la importancia y la cuantía de estos recursos adicionales en caso de ser necesarios? ¿Estaría justificado llevar a cabo un análisis económico completo?

ir arriba

c) Otros aspectos

La clasificación de SIGN está siendo actualmente revisada para optimizarla a partir de los avances metodológicos y de las necesidades actuales. En concreto está considerando aspectos tales como la valoración de las variables de resultado de acuerdo a su importancia relativa o como la integración de la evidencia científica cualitativa dentro de las recomendaciones. En el anexo 14-a (versión pdf, 240 kb) se desarrolla un ejemplo de la formulación de una recomendación a partir de una pregunta clínica mediante el proceso de juicio ponderado del SIGN.

Para ampliar los aspectos desarrollados sobre el sistema SIGN está disponible en formato electrónico su manual3 y en concreto el capítulo de formulación de recomendaciones6 y el anexo D de dicho documento7.

ir arriba

7.2.2. Elaboración de las recomendaciones con el sistema GRADE

a) Clasificación de la importancia relativa de las variables de resultado

En esta etapa el sistema GRADE8 recomienda que el GEG establezca de forma explícita las variables de resultado de interés para las preguntas y clasifique su importancia relativa. El GEG debería llevar a cabo la evaluación de la importancia relativa de las variables de resultado en la etapa inicial de formulación de las preguntas clínicas (ver apartado 4 del Manual). Se recomienda clasificar su importancia mediante la siguiente escala de nueve puntos:

  • 1 – 3: variable de resultado no importante. No incluir en la tabla de evaluación de la calidad o de resultados. Estas variables de resultado no jugarán un papel importante en la formulación de las recomendaciones.
  • 4 – 6: variable de resultado importante pero no clave para la toma de decisiones.
  • 7 – 9: variable de resultado clave para la toma de decisiones.

Por ejemplo, en una guía de práctica clínica sobre osteoporosis, un GEG puede seleccionar las siguientes variables de resultado que hay que tener en cuenta en la evaluación de la eficacia del tratamiento con bifosfonatos: fractura de cadera, fractura vertebral clínica, fractura vertebral radiológica, fracturas no vertebrales, calidad de vida, densidad mineral ósea y cambios en los marcadores óseos (ver Figura 7.1). Probablemente el grupo valorará las variables fractura de cadera, la fractura vertebral clínica y la calidad de vida como las variables de resultado clave para la toma de decisiones (puntuación de 7 a 9), mientras que considerará importantes pero no clave a las fracturas no vertebrales distintas de las de cadera (puntuación de 4 a 6) y a las vertebrales radiológicas. Finalmente puede considerar como no importantes la DMO y los cambios en los marcadores óseos (puntuación de 1 a 3). Es importante resaltar que los estudios sobre resultados intermedios suelen ser más numerosos que aquellos con resultados finales importantes para los pacientes. Este hecho se ve reflejado en el triangulo que aparece en la figura 7.1. En el anexo 14-b (versión pdf, 240 kb) se presenta una tabla para llevar a cabo esta evaluación de forma estructurada. La forma para acordar la importancia relativa de las variables de resultado es mediante consenso.

Figura 7.1. Jerarquía de las variables de resultado de acuerdo a la importancia para los pacientes en la evaluación del tratamiento con bifosfonatos en mujeres osteoporóticas

Niveles de evidencia científica y grado de recomendación de SIGN3D

ir arriba

b) Evaluación de la calidad de la evidencia científica

En el sistema GRADE la etapa de la evaluación de la calidad se realiza para cada una de las variables de resultado seleccionadas. Por tanto, para una pregunta clínica habrá muy probablemente variables de resultado con diferentes calificaciones de calidad. Inicialmente, al igual que otros sistemas, GRADE comienza con la evaluación de la evidencia científica por el diseño de los estudios y su adecuación para responder a cada tipo de pregunta. Se valora como "calidad alta" los ensayos clínicos aleatorizados y como "calidad baja" los observacionales. No obstante, en el caso de los ECA sugiere cinco aspectos que pueden disminuir la calidad y en el caso de los observacionales sugiere tres circunstancias que la pueden aumentar (ver tabla 7.3). Finalmente, la calidad de la evidencia científica será valorada como alta, moderada, baja o muy baja.

  • Aspectos que pueden disminuir la calidad:
    • Limitaciones en el diseño o en la ejecución: por ejemplo, en el caso de un ECA, la ausencia de ocultamiento de la secuencia de aleatorización, enmascaramiento inadecuado, pérdidas importantes, ausencia de análisis por intención de tratar, finalización del estudio antes de lo previsto por razones de beneficio. Si la ejecución de los estudios es muy baja de forma generalizada y presentan limitaciones importantes, el grupo puede decidir bajar la calidad desde alta hasta baja. En otros casos, ciertas limitaciones en algunos estudios pueden penalizar la calidad y calificarla como moderada en lugar de como alta.
    • Resultados inconsistentes: estimaciones muy diferentes del efecto del tratamiento (heterogeneidad o variabilidad en los resultados) en los estudios disponibles sugieren diferencias reales en dichas estimaciones. Estas pueden deberse a diferencias en la población, en la intervención, en las variables de resultado o en la calidad de los estudios. Cuando exista heterogeneidad no explicada de manera razonable la calidad disminuye.
    • Ausencia de evidencia científica directa: puede presentarse en varias circunstancias. Por ejemplo, si se da la ausencia de comparaciones directas entre dos tratamientos, la evidencia científica disponible puede provenir de una "comparación indirecta" de cada uno de ellos frente a placebo. La extrapolación de los resultados de un estudio con un determinado fármaco al resto de fármacos de su misma familia en ausencia de un efecto de clase demostrado, también se considera evidencia científica indirecta. La forma más clásica de evidencia científica indirecta se da cuando existen grandes diferencias entre la población donde se aplicará la GPC y la incluida en los estudios evaluados. Por último, en esta etapa deben ser también valorados los aspectos de la potencial aplicabilidad en nuestro entorno o la validez externa de la evidencia científica disponible.
    • Imprecisión: cuando los estudios disponibles incluyen relativamente pocos eventos y pocos pacientes y, por tanto, presentan intervalos de confianza amplios, la evidencia científica puede considerarse como de menor calidad.
    • Sesgo de notificación: la calidad, y por tanto la confianza, pueden disminuir si se tiene la duda razonable sobre si los autores han incluido o no todos los estudios (por ejemplo, el sesgo de publicación en el contexto de una revisión sistemática) o si los autores han incluido o no todas las variables relevantes de resultado (sesgo de notificación). Un ejemplo de esto sería, en el primer caso, disponer de pocos ensayos, de pequeño tamaño y financiados por la industria.
  • Aspectos que pueden aumentar la calidad en los estudios observacionales:
    • Efecto importante: cuando el efecto observado muestra una asociación fuerte (RR > 2 o < 0,5) o muy fuerte (RR > 5 o < 0,2) y consistente, basada en estudios sin factores de confusión, es improbable que éste sea debido únicamente al diseño más débil del estudio. En estas ocasiones se puede considerar la calidad como moderada o incluso alta.
    • La presencia de un gradiente dosis respuesta
    • Situaciones en las cuales todos los posibles factores confusores podrían haber reducido la asociación observada. Por ejemplo, si los pacientes que reciben la intervención de interés presentan un peor pronóstico y, aún así, presentan mejores resultados que el grupo control, es probable que el efecto observado real sea mayor.
  • Otros estudios
    • El sistema GRADE también incluye un sistema para evaluar los estudios diagnósticos. Este sistema está pendiente de publicación.

Tabla 7.3. Evaluación de la calidad de la evidencia científica según el tipo de diseño de los estudios.

Calidad de la evidencia científica Diseño de estudio Disminuir si* Aumentar si**
Alta ECA



Estudio observacional

Cualquier otra evidencia científica
  • Importante (-1) o muy importante (-2) limitación de la calidad del estudio
  • Inconsistencia importante (-1)
  • Alguna (-1) o gran (-2) incertidumbre acerca de la que evidencia científica sea directa
  • Datos escasos o imprecisos (-1)
  • Alta probabilidad de sesgo de notificación (-1)
  • Asociación: evidencia científica de una fuerte asociación: RR > 2 o < 0,5 basado en estudios observacionales sin factores de confusión (+1). Evidencia científica de una muy fuerte asociación RR > 5 o < 0,2 basada en evidencia científica sin posibilidad de sesgos (+2)
  • Gradiente dosis respuesta (+1)
  • Todos los posibles factores confusores podrían haber reducido el efecto observado (+1)
Moderada
Baja
Muy baja

* En el caso de los ensayos clínicos aleatorizados (ECA) se puede disminuir la calificación de la calidad de la evidencia científica
** En el caso de los estudios observacionales se puede aumentar la calificación de la calidad de la evidencia científica.

Una vez evaluada la calidad de la evidencia científica para cada variable de resultado, el sistema GRADE propone que las variables de resultado clave son las únicas que se tienen que tomar en cuenta para evaluar la calidad de forma global. Por ejemplo, en el caso del tratamiento de las mujeres con osteoporosis y fractura vertebral previa, el GEG puede considerar como variables de resultado clave la fractura de cadera y la fractura vertebral pero no la densidad mineral ósea o los marcadores óseos en orina. Por tanto a la hora de evaluar la calidad global tendrán en cuenta la calidad de las variables de resultado clave y en el caso de que la calidad sea diferente, se tendrá en cuenta la calidad más baja de todas las variables clave. Esta etapa de evaluación de la calidad de la evidencia científica para las diferentes variables de resultado puede reflejarse en formato de tabla (ver Anexo 14-b (versión pdf, 240 kb)).

ir arriba

c) Graduación de la fuerza de las recomendaciones

La graduación de la fuerza de las recomendaciones en este sistema es relativamente sencilla pues solo considera dos categorías: recomendaciones fuertes y recomendaciones débiles.

  • En las recomendaciones fuertes el GEG confía en que los efectos beneficiosos superan a los perjudiciales o viceversa, que los daños superen a los beneficios. En el primer caso la recomendación es fuerte a favor. En el segundo es fuerte en contra.
  • Las recomendaciones débiles, también pueden ser a favor o en contra. Una recomendación es débil a favor, cuando el GEG concluye que los efectos beneficiosos de llevar a cabo la recomendación probablemente superan los perjudiciales, aunque no está completamente seguro. En cambio es débil en contra, cuando los efectos adversos probablemente superan a los beneficiosos.

Implicaciones de las recomendaciones

  Pacientes/cuidadores Clínicos Gestores/Planificadores
Fuerte La inmensa mayoría de las personas estarían de acuerdo con la acción recomendada y únicamente una pequeña parte no lo estarían La mayoría de los pacientes deberían recibir la intervención recomendada. la recomendación puede ser adoptada como política sanitaria en la mayoría de las situaciones.
Débil La mayoría de las personas estarían de acuerdo con la acción recomendada pero un número importante de ellos no. Reconoce que diferentes opciones serán apropiadas para diferentes pacientes y que el médico tiene que ayudar a cada paciente a llegar a la decisión más consistente con sus valores y preferencias. Existe necesidad de un debate importante y la participación de los grupos de interés.
  • Factores que hay que tener en cuenta en la graduación de las recomendaciones:
    • Balance entre beneficios y riesgos: Para realizar una adecuada valoración del balance entre los beneficios y los riesgos es necesario tener en cuenta el riesgo basal de la población a la que va dirigida la GPC, y el efecto tanto en términos relativos como absolutos. Por ejemplo, los glucocorticoides inhalados en el asma moderado a grave presentan importantes beneficios en términos de una reducción del número y gravedad de las crisis con mínimos efectos secundarios. No obstante, en el caso del tratamiento antibiótico para las infecciones agudas no complicadas del tracto respiratorio inferior los beneficios son mínimos y los potenciales efectos no deseables (efectos secundarios y aumento de las resistencias) podrían ser importantes a largo plazo. Por tanto, en el primer caso sería más adecuada una recomendación fuerte a favor y en el segundo una débil en contra.
    • Calidad de la evidencia científica: antes de llevar a cabo una recomendación es necesario conocer la certidumbre sobre la estimación del efecto observada. Si la calidad de la evidencia científica no es alta, a pesar de que la magnitud sea importante, disminuirá la confianza y por tanto la fuerza con la que se lleve a cabo una recomendación.
    • Valores y preferencias: la incertidumbre sobre los valores y preferencias de la población diana, a la cual va dirigida la guía, será otro de los factores que hay que tener en cuenta. Dado que siempre habrá beneficios y riesgos a sopesar, es importante conocer como se han valorado esos beneficios y riesgos a la hora de graduar las recomendaciones y si esos valores reflejan los del personal sanitario, los del colectivo de pacientes o los de la sociedad en general. A pesar de que existe poca información sobre valores y preferencias de los pacientes, es importante tener en cuenta la que está disponible y al menos sopesar y establecer de forma explícita este factor en el proceso de formulación y graduación de las recomendaciones (ver apartado 9 del manual).
    • Costes: los costes, a diferencia de otras variables de resultado, son mucho más variables en el tiempo, en distintas áreas geográficas y en función de diversas implicaciones. Así, aunque un coste elevado disminuye la probabilidad de graduar como fuerte una recomendación, el contexto será crítico en la valoración final. A la hora de considerar la asignación de recursos, los grupos elaboradores deben ser muy específicos sobre el entorno en el cual es aplicable la recomendación y sobre la perspectiva que se utiliza (social o del pagador por ejemplo).

En el anexo 14-b (versión pdf, 240 kb)se desarrolla un ejemplo de la formulación de una recomendación a partir de una pregunta clínica. Para profundizar sobre como aplicar el sistema GRADE ver las lecturas recomendadas al final del apartado.

ir arriba

d) Representación de la calidad de la evidencia científica y la fuerza de las recomendaciones

Existe escasa evidencia científica sobre cual es la forma más efectiva de informar sobre la graduación de las recomendaciones a los usuarios de las guías. Este sistema de clasificación no excluye que para graduar la fuerza de las recomendaciones, el grupo pueda utilizar otros términos alternativos a fuerte o débil, como algún símbolo o letra que represente la calidad de la evidencia científica y la fuerza de las recomendaciones. Por ejemplo, en la calidad se pueden utilizar, junto con los términos propuestos, símbolos como en la tabla adjunta, y en el caso de las recomendaciones pueden ser letras o números (recomendación fuerte 1 y débil 2) (ver Figura 7.2).

Figura 7.2. Representación de la calidad de la evidencia científica y de la fuerza de las recomendaciones

Calidad de la evidencia científica
Alta
Medición A
Moderada medición B
Baja Medición C
Muy baja Medición D
Fuerza de la recomendación
Recomendación fuerte a favor de utilizar una intervención Fuerza 1
Recomendación débil a favor de utilizar una intervención Fuerza 2
Recomendación débil en contra de utilizar una intervención Fuerza 2
Recomendación fuerte en contra de utilizar una intervención Fuerza 1

Próximamente se publicará un manual completo, accesible gratuitamente en Internet, para la aplicación del sistema GRADE para grupos elaboradores de guías de práctica clínica.

ir arriba

7.3. Recomendaciones de investigación futura

En el proceso de elaboración de una GPC se identifican lagunas en el conocimiento, por lo que el GEG puede considerar necesario recomendar líneas para futuras investigaciones, si considera que pueden ser relevantes para profesionales y pacientes.

Es deseable que esas propuestas de investigación se planteen con un cierto grado de concreción para que sean útiles y comprensibles para un futuro proyecto de investigación. Si la evidencia científica sobre un tema en general es escasa, la propuesta puede ser genérica. Por el contrario, cuando un tema ha sido estudiado con profundidad, la propuesta de investigación puede llegar a concretarse más, por ejemplo especificando una determinada subpoblación o un periodo de seguimiento9.

El formato para las propuestas de investigación debería concretar, en la medida de lo posible, los principales aspectos del formato PICO (sugerir la población, las potenciales intervenciones y comparaciones así como los resultados de interés). Idealmente, y si la pregunta de investigación lo requiere, se debería especificar el diseño del estudio y el tiempo de seguimiento.

  • Un ejemplo de recomendación concreta sería: Realizar ensayos clínicos en atención primaria que, en pacientes con antecedentes de ictus o accidente isquémico transitorio (edad media 75 años, ratio hombre-mujer 1:1, tiempo desde el evento cerebrovascular de al menos un año), evalúen la eficacia del tratamiento con suplementos de ácido fólico frente a placebo para la reducción de eventos vasculares graves (ictus, infarto de miocardio, muerte cardiovascular), los efectos adversos, y el riesgo de abandonar la medicación por estos efectos.
  • Un ejemplo más genérico: Estudiar las potenciales diferencias en los valores y preferencias entre médicos y pacientes sobre los riesgos y beneficios del tratamiento anticoagulante oral.

ir arriba

La formulación de las recomendaciones es una etapa en la que es necesario valorar una multiplicidad de factores para realizarla de una forma objetiva, explicita y ordenada. Esta etapa consta de dos partes: a) Evaluación de la calidad de global de la evidencia científica. b) Graduación de la fuerza de las recomendaciones.

La calidad de la evidencia científica es la confianza que se tiene en que la estimación del efecto que reflejan los estudios es cierto. En la graduación de la fuerza de recomendaciones el GEG debe decidir hasta qué punto puede confiar en que si se pone en práctica una determinada recomendación, ésta conllevará más beneficios que riesgos.

Para la formulación de las recomendaciones, el sistema SIGN utiliza la evaluación formal o juicio razonado, en el que se valoran los siguientes aspectos clave: cantidad, calidad y consistencia de la evidencia científica; generalización de los resultados; aplicabilidad e impacto clínico. El sistema GRADE incluye la calidad de la evidencia, el balance entre beneficios y riesgos, los valores y preferencias y los costes.

Lecturas recomendadas

  • Scottish Intercollegiate Intercollegiate Guidelines Network. A guideline developers' handbook (n° 50). Edinburgh: SIGN: 2001.
  • Guyatt G, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, Schünemann HJ. GRADE: An Emerging Consensus on Rating Quality of Evidence and Strength of Recommendations. BMJ (Serie de 5 artículos, "En prensa").
  • GRADE Working Group. Clasificación de la calidad de la evidencia y fuerza de las recomendaciones. Atención primaria [consultada 20 de junio de 2007]. Disponible en: http://www.gradeworkinggroup.org/_ES/publications/Traduccion_GRADE-BMJ-Atencion_Primaria.pdf.

Bibliografía

  1. Guyatt G, Oxman AD, Kunz R, Gunn EV Yngye FY, Schunemann HJ. What is ‘quality of evidence’ and why is it important to clinicians? BMJ. "En prensa 2007".
  2. Oxford Centre for Evidence-based Medicine [sitio web]. Oxford; [consultada 15 de mayo de 2007]. Levels of Evidence and Grades of Recommendation. Disponible en: http://www.cebm.net/index.aspx?o=1047.
  3. Scottish Intercollegiate Guidelines Network. A guideline developers' handbook (Publication n° 50). Edinburgh: SIGN: 2001 [actualizado mayo de 2004; consultada 18 de junio de 2007]. Disponible en: http://www.sign.ac.uk/guidelines/fulltext/50/index.html.
  4. New Zealand Guidelines Group [sitio web]. Wellington: New Zealand Guidelines Group: 1998 [consultada 2 de noviembre de 2007]. Disponible en: http://www.nzgg.org.nz/index.cfm?.
  5. NHS. Scoping the Guideline. En: National Institute for Clinical Excellence [Internet]. The guidelines manual. London: National Institute for Clinical Excellence: 2004 [actualizado 13 de abril de 2007; consultada 15 de mayo de 2007]. Disponible en: http://www.nice.org.uk/page.aspx?o=422950.
  6. Scottish Intercollegiate Guidelines Network. A guideline developers' handbook (Publication n° 50). Capítulo de formulación de recomendaciones. 2001. Edinburgh: SIGN: 2001 [actualizado 21 de mayo de 2004; consultada 18 de junio de 2007]. Disponible en: http://www.sign.ac.uk/guidelines/fulltext/50/section6.html.
  7. Scottish Intercollegiate Guidelines Network. A guideline developers' handbook (Publication n° 50). Anexo D. Edinburgh: SIGN: 2001 [actualizado 25 de mayo de 2004; consultada 18 de junio de 2007]. Disponible en: http://www.sign.ac.uk/guidelines/fulltext/50/annexd.html.
  8. GRADE working group. Grading of Recommendations of Assessment Development and Evaluations. [Internet]. [Consultada mayo de 2007]. Disponible en: http://www.gradeworkinggroup.org/.
  9. Brown P, Brunnhuber K, Chalkidou K, Chalmers I, Clarke M, Fenton M, et al. How to formulate research recommendations. BMJ. 2006 333: 804-6. Disponible en: http://www.bmj.com/cgi/reprint/333/7572/804.pdf.

Anexos

Anexo 1. Evaluación de la calidad de GPC. Instrumento AGREE (versión reducida) (pdf, 81 kb)

Anexo 14. Ejemplo de la evaluación de la calidad de la evidencia científica y formulación de las recomendaciones a partir de una pregunta clínica (pdf, 240 kb). Incluye:

  • Anexo 14-a. Sistema de Clasificación SIGN
  • Anexo 14-b. Sistema de Clasificación GRADE

Última actualización: 7 de mayo de 2008

Logo del Ministerio de Sanidad y Consumo Logo del Plan de Calidad del Sistema Nacional de SaludLogo del Instituto Aragonés de Ciencias de la Salud

 

Copyright