Palabras clave: consensos, resultados, cáncer de mama
Este texto completo es una transcripción editada y revisada de una conferencia que se dictó en el III Consenso Nacional de Diagnóstico y Tratamiento del Cáncer de Mama, realizado en Coquimbo entre los días 26 y 28 de agosto de 2009. El consenso fue organizado por la Sociedad Chilena de Mastología bajo la presidencia de la Dra. Soledad Torres.
En esta presentación se hablará sobre el concepto de los consensos en general y en Medicina, en particular.
La palabra consenso viene del latín consentire, que significa acuerdo y tiene un amplio espectro de significados en las diferentes actividades humanas: en política, es la base de la democracia; en lo social, de la convivencia; en lo sexual, de la reproducción. En lo que se refiere a la ciencia el consenso no tiene ningún significado, porque la ciencia no se basa en consensos; si así fuera muchas teorías (como las de la relatividad o la cuántica) deberían ser consideradas como falsas, porque la mayor parte de los científicos no las comprenden, sin embargo estas teorías han condicionado la mayoría de los progresos científicos y tecnológicos del siglo XX. Por lo tanto en ciencia no existe consenso, ya que es lo opuesto a lo científico. Para determinar si el consenso es aplicable en Medicina se debe definir si esta actividad está más vinculada a la ciencia, a la política, a lo social o a lo sexual.
La Medicina es una actividad humana heterogénea que desde hace más de un siglo se basa parcialmente en la ciencia, existiendo varios factores no científicos que influyen en la forma de desarrollar esta actividad, como la experiencia personal, la superstición o ignorancia parcial, los diferentes tipos de empatía con colegas, pacientes o industrias y factores económicos como número de consultas y de exámenes, viajes científicos y actividades sociales.
La Medicina basada en la Ciencia ha recorrido un largo camino desde la Antigüedad y la Edad Media, cuando se basaba en simples observaciones, hasta la época actual, en que se desarrolla la formulación de hipótesis y su evaluación rigurosa a distintos niveles de conocimiento, tratando de profundizar cada vez más en ellos. Así, por ejemplo:
Figura 1. Regulación del ciclo celular (A. Brahme, Karolinska Institutet, 2003).
La Medicina basada en la Ciencia exige que los conocimientos que se adquieren en el área biológica sean aplicables a la práctica clínica; para ello es imprescindible que estos conocimientos se evalúen en estudios clínicos que cumplan con el rigor de los análisis estadísticos aceptados. El primer estudio aleatorio se llevó a cabo en el Reino Unido durante la Segunda Guerra Mundial y se enfocó en el uso de estreptomicina en pacientes con tuberculosis. Desde esa época se reconoce el peligro de sacar conclusiones a partir de series históricas o estudios retrospectivos. Actualmente se sabe que las hipótesis se deben plantear claramente y someterla a un estricto proceso de evaluación; no obstante, como éste suele ser largo y tedioso no siempre es debidamente apreciado por todos los médicos.
Los estudios no aleatorios pueden ser útiles para determinar factores pronósticos, siempre que se utilicen grandes muestras, análisis multifactoriales correctos, lo cual no sucede en muchas publicaciones, y se excluyan del análisis los factores relacionados con el tratamiento. Asimismo, este tipo de estudio no sirve para establecer los factores predictivos del efecto de un tratamiento, que sólo se pueden analizar en el material clínico proveniente de un estudio aleatorio (evaluando el tratamiento en cuestión), o después de un tratamiento preoperatorio si la respuesta tumoral es el principal criterio de evaluación
Además, los estudios no aleatorios pueden entregar resultados erróneos en la cuantificación del efecto de un tratamiento. Por ejemplo, al evaluar el tratamiento con anticoagulantes en enfermedades cardiovasculares se encontró una reducción de la mortalidad de 62% en controles históricos, de 34% en controles concurrentes no históricos y solamente de 22% en estudios aleatorios; esto muestra que los estudios no aleatorios pueden sobreestimar de manera importante el efecto de un tratamiento.
El estudio de subgrupos es otra forma de analizar datos. Un ejemplo es un estudio aleatorio que se publicó en 1980 (1) en el que se comparó el grado de prevención de enfermedades coronarias al tratamiento con clofibrato. La mortalidad a cinco años fue 20% entre los 1100 pacientes tratados con clofibrato y 21% entre los 2800 pacientes que recibieron placebo, diferencia que no fue significativa. Luego los investigadores definieron dos subgrupos: los buenos adherentes como aquellos que recibieron 80% o más de la dosis de clofibrato y los malos adherentes como a los que tomaron dosis menores. El análisis mostró que la mortalidad de los buenos adherentes fue inferior a la de los malos adherentes, con 15% y 25% respectivamente, diferencia claramente significativa. Esto parece sugerir que el medicamento es eficaz, puesto que los resultados son mucho mejores en los pacientes que cumplieron el tratamiento indicado; sin embargo, al analizar los resultados de los pacientes que recibieron el placebo se encontraron cifras similares: los buenos adherentes tuvieron una mortalidad de 15% y los malos adherentes, de 28%. Lo anterior es un ejemplo típico de exploración “de pesca”, ya que no era la hipótesis inicial del estudio (1).
Este tipo de estudio de subgrupos es de aplicación frecuente en oncología; de hecho, la mayoría de los estudios en esta área involucran comparaciones entre “respondedores y “no respondedores” a un determinado tratamiento; si los resultados muestran diferencias significativas éstas se atribuyen a un efecto positivo del tratamiento. Esta respuesta tumoral es un atributo adquirido post-hoc, en un proceso típicamente relacionado con las “expediciones de pesca”.
Un ejemplo clásico de análisis de subgrupos en estudios aleatorios, incluyendo un gran número de pacientes, es la comparación del efecto de Aspirina® o placebo sobre la mortalidad, según el signo del Zodíaco correspondiente a la fecha de nacimiento de los pacientes; según este análisis el uso de Aspirina es beneficioso en general, pero no para las personas clasificadas Géminis o Libra, que no se beneficiarían con el uso de este fármaco (Tabla I).
En la evaluación de tratamientos el estándar de oro es el estudio aleatorio fase III, en el cual la única diferencia entre los grupos que se comparan es el tratamiento evaluado. La ventaja del estudio aleatorio es que si la muestra es superior a mil pacientes se asegura prácticamente un balance entre todos los factores pronósticos conocidos o desconocidos.
El control de los errores estadísticos es fundamental en la evaluación de un tratamiento. Así, en los estudios aleatorios se pueden producir dos tipos de error:
Es importante revisar el valor de la significación estadística. Si se obtiene una desviación estándar, equivalente a p = 0,3, es como lanzar una moneda al aire y elegir “cara o sello” o lanzar un dado de tres caras; dos unidades de desviación estándar, equivalentes al 5% convencional (p = 0,05) es como lanzar dos dados y obtener dos veces seis; el efecto es sólo sugerido y se considera un buen resultado moderado para un estudio aleatorio. Una desviación estándar de tres unidades, equivalente a p = 0,003, es como lanzar cuatro dados y obtener cuatro seis. Con cuatro desviaciones estándar, equivalentes a p = 0,0001, se considera como una corroboración científica de la hipótesis inicial.
Hasta hace pocos años los médicos se preocupaban de eliminar los falsos positivos, pero es necesario destacar que el 5% convencional es bastante peligroso porque existe una posibilidad sobre veinte de estar equivocados. En la actualidad los médicos también se están preocupando de los falsos negativos. Por ejemplo, hay tratamientos eficaces, como el tamoxifeno en cáncer de mama, que se podrían haber dejado de utilizar debido a que sólo dos estudios sobre más de veinte demostraron beneficios con el tratamiento; incluso tres de ellos mostraron un efecto deletéreo. Sin embargo, el tamoxifeno es un tratamiento hormonal que se utiliza como adyuvante en el cáncer de mama, con efectos moderados, con reducción relativa del riesgo de muerte de alrededor de 17%, similar a la quimioterapia (16%), a la radioterapia de tórax en cáncer de células pequeñas (14%) y a la quimioterapia con cis-platino en cáncer de pulmón operado (13%). Los beneficios absolutos son del orden de 4% a 6%. Lo interesante es que la asociación de tratamientos eficaces puede tener un efecto multiplicativo; por ejemplo, en cáncer de mama temprano con ganglios positivos la radioterapia adyuvante produce una reducción de la mortalidad de 10%; una paciente que recibe tamoxifeno adyuvante por cinco años y que tiene receptores estrogénicos positivos presenta una reducción de 30%; y en una paciente joven con ganglios positivos que recibe quimioterapia adyuvante la reducción es de 20%. Si se multiplican los efectos de estos tratamientos se obtiene una reducción total de la mortalidad de 50%.
La medicina basada en ciencia no constituye un problema excepto si los resultados son ambiguos o heterogéneos, lo que genera controversias. Con estas definiciones es posible determinar áreas de consenso y de controversia; sin embargo se debe reconocer que la mayor parte de la información en medicina no se produce en forma científica o no se evalúa en forma apropiada. Aquí aparece el concepto de estado del arte, que es influenciado por aspectos políticos, sociales, económicos y que además depende de los intereses personales y de la moda.
Los consensos pueden ser peligrosos; de hecho el consenso 2007 de St. Gallen entregó recomendaciones sobre las indicaciones de radioterapia post-mastectomía de un panel de expertos incluyendo algunos radioterapeutas. El autor de esta exposición envió una carta al medio que publicó dichas recomendaciones señalando el potencial peligro de ellas “ya que en algunos lugares las podrían aplicar sin considerar que son el resultado de un consenso y no de pruebas científicas”. Los autores de la publicación del consenso respondieron que aquellas recomendaciones eran más seguras que las afirmaciones individuales basadas sobre estudios seleccionados. El autor de la carta en realidad basó su postura sobre estudios aleatorios provenientes de todo el mundo sobre radioterapia post-mastectomía. Esto lleva a preguntarse cómo se seleccionan los participantes de un panel de líderes de opinión. Nadie desconoce que eran expertos reconocidos en todo el mundo. La pregunta es si no hay sesgos en su selección tales como amistad, colaboraciones cercanas, compromiso o por tener una visión similar que los organizadores sobre los temas tratados. La proposición de este autor para evitar sesgos es elegir el panel de manera aleatoria: 40 a 50 expertos entre los dos mil o tres mil que existen en todo el mundo y constituir cuatro grupos de 10 ó 12 personas, también en forma aleatoria, para trabajar en el tema. Luego se compararían los cuatro consensos para definir las áreas de consenso y controversia. Los “líderes de opinión” deberían reconocer en caso de controversia que sus asertos son opiniones de experto, pero sin base científica.
Ejemplos recientes de consensos y revisiones sistemáticas son los siguientes:
En el caso de los umbrales para las terapias de Saint Gallen del año 2009 se reunió un panel de 43 expertos que en sus conclusiones puso énfasis en las terapias sistémicas adyuvantes dirigidas a blancos, de acuerdo a subgrupos definidos por marcadores predictivos. Además se insistió en la importancia de medir de manera muy estricta los receptores estrogénicos (ER) y HER2 y se reconoció la importancia de los marcadores de proliferación, incluyendo los que se identifican en análisis genómicos. Las recomendaciones finales resumidas fueron:
En pacientes ER positivo y HER2 negativo la indicación depende del riesgo:
Este resumen muestra la complejidad de los parámetros que pueden llegar a ser integrados en un consenso y al mismo tiempo como este proceso se aleja de lo que es puramente científico.
El notable desarrollo del área de la biología molecular en los últimos años ha llevado a plantear la hipótesis de que cada paciente es diferente y por lo tanto debe recibir un tratamiento personalizado. Sin embargo: ¿Se sabe lo suficiente sobre cada diferencia? ¿Se sabe cómo determinar el tratamiento personalizado apropiado? ¿Se sabe cómo evaluarlo? En teoría los tratamientos se pueden evaluar considerando características como ER, HER2, presencia o no de ganglios y edad del paciente; no obstante, sólo si los blancos moleculares se conocen perfectamente, que no es lo habitual, sería posible evaluar el efecto del tratamiento en grupos cada vez más pequeños de pacientes; y como en la actualidad el conocimiento que se tiene en esta área aún es limitado, no es posible realizar predicciones infalibles.
En un intento de encontrar predictores seguros se han desarrollado las firmas genómicas (genomics signatures), en series pequeñas de no más de cien pacientes. Entre sus ventajas están su presentación estética, ya que parecen pinturas puntillistas, y el hecho de que producen un alto nivel de publicaciones. Sin embargo, al comparar diferentes firmas genómicas son pocos los genes comunes entre una firma y otra para una misma localización, en el cáncer de mama, por ejemplo, la firma de Amsterdam sólo tiene dos genes comunes con la firma de Rotterdam, sobre más de 70 seleccionados.
En búsqueda de nuevos factores predictivos se están realizando los estudios europeo Mindact (BIG/TRANSBIG) y norteamericano US Intergroup TAILORx trial. Ambos incluyen a miles de pacientes y son de alto costo. Su factibilidad está siendo determinada.
Los estudios de Sotiriou y colaboradores en Bruselas sobre la utilidad de las firmas en el pronóstico mostraron una discordancia de 10% a 20% entre los laboratorios. Los autores concluyeron que las clasificaciones moleculares tienen una reproducibilidad bajo el nivel óptimo, se deben afinar mucho las definiciones, existen pocos genes comunes entre diferentes firmas, se han realizado pocas validaciones y la mayoría de los genes pronósticos son marcadores de proliferación (7).
Michiels y el grupo de investigación del IGR realizaron un estudio en el que volvieron a analizar los datos de los siete principales estudios publicados que han intentado predecir el pronóstico de los pacientes con cáncer sobre la base del análisis genómico. Para ello ampliaron la estrategia estándar, que se basa en la detección de una firma molecular y conjuntos de validación, mediante la formación de varios conjuntos en forma aleatoria para estudiar la estabilidad de la firma molecular y la proporción de errores de clasificación. La información que se obtuvo fue de importancia, ya que el porcentaje de clasificaciones erróneas fue alto y cercano al 50%. La mejor de las series fue la de cáncer de mama de Amsterdam (9) que alcanzó un porcentaje de clasificación errónea en 31% con amplios intervalos de confianza (8).
Precisamente, el estudio pionero de Van’t Veer (9) sobre identificación de genes, publicado en 2002, incluyó a sólo 78 pacientes con cáncer de mama y axila negativa. Se analizaron 20.000 genes y se encontró que 1.000 genes con un error de 5%, o 200 genes con un error menor de 1%, estaban relacionados con el pronóstico (9). Posteriormente se han propuesto varios criterios para ajustar los p-value como el estudio de Michiels et al. citado en el párrafo precedente (8).
En otro estudio (10) con el objetivo de explicar la variabilidad de un estudio pionero en cáncer de mama, se encontró una variabilidad de 0% en un modelo sin factores; con todos los factores convencionales la variabilidad fue 16%; al analizar sólo la firma molecular la variabilidad fue 12% y con los factores convencionales y la firma molecular la variabilidad subió a 19%. Por lo tanto, el valor agregado por la firma molecular para explicar la variabilidad fue sólo 3%.
En resumen, marcadores como los RE y HER2 son buenos factores predictivos del efecto de un tratamiento, pero explican solamente una parte de la variabilidad, por lo lo tanto proporcionan probabilidades y no son determinantes. Las firmas biómicas, sean genómicas, proteómicas o metabolómicas, son una esperanza para el futuro y han abierto un amplio campo de investigación, pero para lograr una aplicación clínica se requieren resultados más robustos.
Las conclusiones de esta presentación sobre, los consensos en Medicina pueden ser las siguientes: estos consensos son prácticamente útiles, ya que evitan la necesidad de leer los artículos originales, lo cual tiene una repercusión positiva en la calidad de vida de los médicos, sus familias y amistades. Por otro lado evitan que se cometan errores mayores, lo cual va sin duda en beneficio del paciente. No obstante, su utilidad es mayor si se utilizan como guías o recomendaciones, y no como leyes.
Dentro de las limitaciones de los consensos está que no siempre coincide la significación estadística con la clínica. En algunos estudios se encuentran diferencias estadísticas y clínicas, pero en otros si bien se encuentra una diferencia estadísticamente significativa, el impacto clínico es limitado. En este caso se debe considerar la toxicidad del tratamiento y su efecto sobre la calidad de vida mediante una evaluación muy cuidadosa, entregando la información completa al paciente. Por ejemplo, en el estudio HERA se encontró una diferencia significativa clínica y estadística, con dos años de seguimiento, a favor del tratamiento con trastuzumab (11). En cambio en el estudio sobre cáncer pulmonar avanzado presentado en 2009 en ASCO, en el que se estudió a 743 pacientes sobrevivientes con cáncer avanzado de pulmón que habían recibido cuatro ciclos de quimioterapia con bevacizumab y luego se subdividieron en dos grupos, el primer grupo de los cuales continuó con bavacizumab y con erlotinib y el segundo, con bevacizumab y placebo, los resultados muestran que el primer grupo tuvo una reducción de 28% de los acontecimientos y de la letalidad, pero que el impacto con el uso de erlotinib fue solamente de cuatro semanas de ganancia, es decir bastante limitado.
Este texto completo es una transcripción editada y revisada de una conferencia que se dictó en el III Consenso Nacional de Diagnóstico y Tratamiento del Cáncer de Mama, realizado en Coquimbo entre los días 26 y 28 de agosto de 2009. El consenso fue organizado por la Sociedad Chilena de Mastología bajo la presidencia de la Dra. Soledad Torres.
Citación: Arriagada R. On consensus in medicine. Medwave 2010 Abr;10(04):e4491 doi: 10.5867/medwave.2010.04.4491
Fecha de publicación: 1/4/2010
Nos complace que usted tenga interés en comentar uno de nuestros artículos. Su comentario será publicado inmediatamente. No obstante, Medwave se reserva el derecho a eliminarlo posteriormente si la dirección editorial considera que su comentario es: ofensivo en algún sentido, irrelevante, trivial, contiene errores de lenguaje, contiene arengas políticas, obedece a fines comerciales, contiene datos de alguna persona en particular, o sugiere cambios en el manejo de pacientes que no hayan sido publicados previamente en alguna revista con revisión por pares.
Aún no hay comentarios en este artículo.
Para comentar debe iniciar sesión