A grandes rasgos, existen dos variedades de error que pueden afectar a los resultados de un estudio clínico, los errores por azar y los sistemáticos. Estos errores producen resultados que se desvían de la verdadera asociación entre las variables. Por ejemplo, por efecto de un sesgo, el estudio puede mostrar:
A los errores aleatorios, producto del azar, nos referiremos más adelante en esta serie, al tratar sobre la significación estadística, el valor P y los intervalos de confianza.
Un error sistemático es un fenómeno que afecta el estudio en cualquiera de sus etapas, y que tiende a producir resultados que se desvían de los valores reales en un sentido determinado. De allí lo de “sistemático”, porque el fenómeno actúa en un sentido predominante. A este tipo de error se le conoce como “sesgo”.
En entregas posteriores analizaremos sesgos específicos de las principales variedades de estudios clínicos existentes. Aquí nos ocuparemos del concepto de manera general.
Para que ocurra sesgo, debe producirse un fenómeno que afecte de manera diferenciada al grupo expuesto y al control, por ejemplo:
1. Que la susceptibilidad de desarrollar el desenlace sea mayor o menor en uno de los grupos, por razones distintas al factor estudiado (sesgo de selección).
Esta diferencia de riesgo puede estar representada por factores conocidos (edad, proporción de diabéticos, score de gravedad, etcétera), o desconocidos. En el caso de los factores que han sido medidos durante el estudio, su efecto pudiera ser ajustado -corregido mediante técnicas estadísticas- durante el análisis. Si no han sido medidos no será posible corregir los resultados en función de esas variables.
Muchas veces se puede sospechar la presencia de factores, no necesariamente medibles, que pueden estar sesgando los resultados. Por ejemplo, hay grupos de sujetos a los que se atribuye un mejor o peor pronóstico por el solo hecho de pertenecer a ese grupo, aunque sus restantes características sean similares:
2. Que el desenlace sea medido con distinta intensidad en unos y otros.
Por ejemplo, imagine que se está comparando dos grupos correspondientes a períodos distintos, por ejemplo un grupo atendido entre 2001 y 2005, y otro entre 2006 y 2010. Es posible que se introduzca un sesgo si los métodos o criterios de diagnóstico aplicados en ambos períodos no fueron enteramente equivalentes.
3. Que la exposición sea medida o expresada con distinta intensidad en unos y otros.
El ejemplo más evidente de este sesgo se da en los estudios de casos y controles, y está representado por el “sesgo de recuerdo” y sus diversas variantes. Nos referiremos a él en una serie próxima.
Cuando medimos la exposición o los desenlaces de un paciente podemos equivocarnos al calificar su condición. Por ejemplo, si para identificar a los pacientes como hipertensos/no hipertensos usamos solamente un cuestionario, en el que preguntamos por el antecedente de hipertensión al propio sujeto, podríamos estar clasificando como no hipertensos a pacientes que sí lo son, pero no lo saben.
Cuando la exposición o el desenlace son medidos en forma errónea con similar intensidad en ambos grupos, es decir en forma aleatoria, se produce lo que denominamos error de clasificación no diferencial. Este tipo de error no modifica la magnitud de la asociación en términos relativos (que es la forma habitual de expresar los resultados), pero sí la altera en términos absolutos.
Siguiendo con el ejemplo inicial, imaginemos que el estudio evalúa la asociación entre el consumo de sal y la hipertensión:
El Riesgo Relativo (RR) del estudio es 2, es decir, los sujetos con alto consumo de sal tienen el doble de riesgo de desarrollar hipertensión. En términos absolutos, la diferencia de riesgo es de un 10%.
Por el error de clasificación mencionado, que afectó por igual a ambos grupos, hubo un 50% de subdiagnóstico, es decir, los hipertensos en el grupo expuesto son en realidad 30%, y en los no expuestos 15%. ¿Cómo se modifican los resultados? El RR sigue siendo el mismo, pero la diferencia en términos absolutos sube a 15%.
Por el contrario, cuando la clasificación inadecuada de la condición del paciente afecta de manera distinta a los grupos, hablamos de un error de clasificación diferencial. Este tipo de error da lugar a lo que normalmente conocemos como sesgo de medición.
Por cierto, en todo estudio es esperable algún grado de error de clasificación, que podremos minimizar mediante el uso de estrategias e instrumentos lo más válidos y acuciosos posibles para recoger los datos.
Mientras menos evidente el desenlace (imagine por ejemplo que el resultado a medir es la aparición de hepatocarcinoma), mayor esfuerzo debemos hacer para detectarlo. Mientras más subjetivo o menos acuerdo exista sobre la definición del desenlace, más importante será que el instrumento para evaluar el desenlace se encuentre estandarizado, los criterios se apliquen por igual a todos los pacientes, y si es un cuestionario o escala, que se encuentre validado en el país.
Cuando para verificar la exposición dependemos de la memoria del paciente, la información sobre exposiciones más recientes será por lo general más confiable. Existe además la posibilidad de limitar el error de clasificación usando varias fuentes de información complementarias (por ejemplo, agregar a la entrevista que se hace al paciente a algunos de sus familiares directos, revisar los antecedentes disponibles en la ficha clínica o en bases de datos administrativas, etcétera).
De lo ya expuesto podemos inferir que existen dos grandes categorías de sesgo en los estudios clínicos:
Los sesgos pueden originarse por debilidades del diseño del estudio, o aparecer después durante la ejecución. Una vez producidos los sesgos son difícilmente corregibles, por lo que el esfuerzo por evitarlos debe ser llevado a cabo al diseñar el estudio, previéndolos y tomando medidas apropiadas para minimizarlos.
También se pueden clasificar los sesgos según la dirección de su efecto:
Usted encontrará en la literatura epidemiológica una amplia variedad de sesgos descritos. Si bien es importante ir conociendo poco a poco las variedades principales o más frecuentes, no espere asimilarlos todos de una vez. Frente a eso, razone al leer un estudio en los siguientes términos:
¿Hay motivos para pensar que los pacientes son significativamente distintos entre los grupos, más allá de lo que pueda uno esperar por azar? Y si lo son… ¿fue suficiente el ajuste realizado en sus características basales durante el diseño -por ejemplo el pareo realizado en un estudio de casos y controles- o durante el análisis -por ejemplo el análisis multivariado realizado a la cohorte- para hacer comparables los grupos? (sesgo de selección).
¿Hay motivos para pensar que la exposición y resultados no fueron medidos de la misma forma entre los grupos? Si lo fueron… ¿se conocen todos los resultados o hay una proporción demasiado grande de pacientes cuyos resultados no conocemos y que podrían ser distintas entre los grupos (pérdidas de seguimiento)? (potencial de sesgo de medición).
Citación: Araujo M. General validity criteria in clinical trials. Medwave 2012 Mar/Abr;12(3):e5338 doi: 10.5867/medwave.2012.03.5338
Fecha de envío: 26/2/2012
Fecha de aceptación: 27/2/2012
Fecha de publicación: 1/3/2012
Origen: solicitado
Tipo de revisión: sin revisión por pares
Nos complace que usted tenga interés en comentar uno de nuestros artículos. Su comentario será publicado inmediatamente. No obstante, Medwave se reserva el derecho a eliminarlo posteriormente si la dirección editorial considera que su comentario es: ofensivo en algún sentido, irrelevante, trivial, contiene errores de lenguaje, contiene arengas políticas, obedece a fines comerciales, contiene datos de alguna persona en particular, o sugiere cambios en el manejo de pacientes que no hayan sido publicados previamente en alguna revista con revisión por pares.
Aún no hay comentarios en este artículo.
Para comentar debe iniciar sesión