Criterios para validar clasificaciones clínicas
RESUMEN
Introducción:

Existe ausencia de consenso sobre el método de construcción y validación de las escalas y subyacen también diversos enfoques metodológicos con este fin.

Objetivo:

Elaborar una propuesta de criterios para validar clasificaciones clínicas.

Método:

Se realizó una investigación cualitativa. Para ello se escogieron diez Doctores en Ciencias Médicas de la Facultad de Estomatología “Raúl González Sánchez” de la Universidad de las Ciencias Médicas de La Habana y un Máster en Ciencias, todos con categoría docente de profesor titular, a excepción del Máster, quien era auxiliar. Todos los evaluadores estaban categorizados como investigadores. Se utilizó el método Delphi para contrastar y combinar los argumentos emitidos, permitir tomar decisiones al investigador y arribar a conclusiones sobre los criterios propuestos. La evaluación se realizó de forma anónima y a todos se les aplicó el test de autovaloración de experto. A cada experto se le mostró la propuesta y se le pidió que propusieran cualquier criterio nuevo a agregar, modificación o duda que presentaran, las cuales se someterían a la aprobación del resto de los participantes. Se realizaron tantas rondas como fueron necesarias para llegar al consenso y aprobación final.

Resultados:

De los 11 expertos seleccionados para el estudio, en la encuesta de autovaloración de experto todos alcanzaron valores entre 0,8 y 1. Siete (63,6 %) participantes alcanzaron valor de 1 de coeficiente de competencia.

Conclusiones:

La propuesta final de ítems quedó conformada por cinco criterios: objetividad, clínicamente justificable, exhaustiva, comprensibles y excluyentes, y sensibles a cambios.

ABSTRACT
Introduction:

Consensus has not been achieved about a method for the development and validation of scales, and various methodological approaches are applied for this purpose.

Objective:

Develop a proposal of criteria to validate clinical classifications.

Method:

A qualitative study was conducted. Ten Doctors of Medicine and one Master of Science were selected from Raúl González Sánchez Dental School of the University of Medical Sciences of Havana. All had the teaching category of Full Professor, except for the Master of Science, who was an Associate Professor. All the evaluators had the category of researcher. The Delphi method was used to contrast and combine the arguments issued, let the researcher take decisions, and reach conclusions about the criteria proposed. The evaluation was anonymous and all participants took the expert self-assessment test. Each expert was shown the proposal and asked to suggest any new criterion to be added, as well as any modification or question they might have, which would be subjected to approval by the remaining participants. As many rounds were performed as required to reach consensus and final approval.

Results:

The 11 experts selected for the study obtained scores of 0.8-1 in the expert self-assessment survey. Seven participants (63.6%) obtained a competence coefficient of 1.

Conclusions:

The final proposal of items was composed of five criteria: objective, clinically justifiable, exhaustive, understandable and mutually exclusive, and sensitive to changes.

Palabras clave:
    • clasificación;
    • normas;
    • testimonio de experto;
    • investigación cualitativa.
Keywords:
    • classification;
    • standards;
    • expert testimony;
    • qualitative research.

Introducción

El proceso de búsqueda de escalas y de clasificación de un proceso nosológico, o la adaptación de estas a un contexto que no es el medio ni el idioma de donde se originaron, puede tomar mucho tiempo y no siempre se logra lo que se desea en cuanto a calidad. Idealmente, se deben utilizar instrumentos de los cuales se sepa que miden lo que pretenden evaluar y que son estables en el tiempo de aplicación; es decir, que obtienen la misma información en intervalos diferentes.1

La validez se refiere al grado en que el instrumento mide la variable que pretende medir y define la calidad del instrumento. Es por ello que debe tomarse muy en serio el proceso de validación cuando se construye una clasificación para una enfermedad determinada.

La validez puede ser vista desde diferentes enfoques:

Validez de contenido: se refiere al grado en que un instrumento refleja un dominio específico de contenido.

Validez de criterio: se compara con algún criterio externo que mide lo mismo. Si el criterio se fija en el mismo momento, se habla de validez concurrente.

Validez de constructo: debe explicar el modelo teórico empírico, que subyace a la variable de interés.

Validez de expertos: los expertos definen si el instrumento mide la variable en cuestión.

En la elevada cantidad de artículos científicos que han utilizado instrumentos basados en escalas de medición, lo referente a su proceso de construcción y validación en salud, sigue presentando limitaciones relacionadas con la falta de claridad en algunas comunidades académicas sobre los criterios que deben evaluarse. Existe ausencia de consenso sobre el método de construcción y validación de las escalas y subyacen diversos enfoques metodológicos con este fin. En este orden de ideas, se considera que la ausencia de equivalencia entre las diferentes escalas, derivada de un proceso de validación deficiente, reduce la posibilidad de hacer comparaciones entre poblaciones de diferentes países, culturas e idiomas, impide el intercambio de información en la comunidad científica e induce al diseño de políticas públicas y de salud inadecuadas.2

Muchos son los ejemplos que ponen en duda la calidad de una clasificación médico clínica por una pobre validez, aun cuando han sido sometidas a criterios de expertos: Soriano Cabrera, citado por Lopera-Medina,3 y Castaldi4) ponen en duda la validez de clasificar a la enfermedad pulmonar obstructiva crónica en subgrupos definidos; Cavero-Carbonell y otros5 en su artículo “La validez del Conjunto Mínimo Básico de Datos como fuente de identificación de las anomalías congénitas, en la Comunitat Valenciana”, describen muchas diferencias en distintos hospitales y profesionales. De igual manera, Aravena Pedro y otros6 encuentran pérdida de validez cuando se usan instrumentos validados en otros países y de diferentes idiomas sin una correcta validación en el medio que se utilizan.

Los autores de este artículo consideran que, al igual que se emplean criterios recomendados a los expertos para la validez en los instrumentos evaluativos, merece también, en aras de conseguir una mayor calidad, proponer criterios a tener en cuenta por los expertos a la hora de validar una clasificación de una entidad nosológica con su escala para la práctica clínica de médicos y estomatólogos.

Actualmente no se cuenta con un sistema de criterios que sirva como un instrumento para realizar una clasificación de mayor calidad, más consistente y con mejor poder discriminativo. Su creación redunda en un mejor diagnóstico del paciente, ya que permitirá caracterizar la prevalencia de las enfermedades y generar intervenciones que las mejoren o las controlen. Desde el punto de vista teórico, el desarrollo de una nueva clasificación exige una mayor preparación y redunda en la aplicación del tratamiento que precisa cada paciente para garantizar una evolución satisfactoria. Por ello, el objetivo de la investigación fue elaborar una propuesta de criterios para validar clasificaciones clínicas.

Métodos

Se realizó una investigación cualitativa usando el método Delphi para contrastar y combinar los argumentos emitidos, permitir tomar decisiones al investigador y arribar a conclusiones sobre los criterios que se proponen.

Para ello, se escogieron diez Doctores en Ciencia de la Facultad de Estomatología “Raúl González Sánchez”, de la Universidad de las Ciencias Médicas de La Habana y un Máster en Ciencias, para un total de 11, cifra que concuerda con los parámetros exigidos para este tipo de estudio.7

Todos los participantes tenían categoría docente de profesor titular, a excepción del máster con auxiliar. Todos los evaluadores estaban categorizados como investigadores, según aparece en su expediente docente.

La evaluación de los criterios propuestos se realizó de forma anónima y a todos se les aplicó el test de autovaloración de experto: 8,9

Coeficiente de conocimiento (Kc): se calculó al multiplicar el número seleccionado en escala comprendida del uno al diez por 0,1.

Coeficiente de argumentación (Ka): sumatoria de los valores de la tabla patrón (Tabla 1).

Coeficiente de competencia (K): se calcula a través de la fórmula: ½ (Kc+Ka)

Si 0,8 < K < 1,0; el coeficiente de competencia es alto.

Si 0,5 < K < 0,8; el coeficiente de competencia es medio.

Si K < 0,5; el coeficiente de competencia es bajo.

A cada experto se le explicó en qué consistía la investigación y la voluntariedad de su participación, así como la importancia de su anonimato para no condicionar la respuesta de otro experto. Se les mostró la propuesta y se les pidió que propusieran cualquier criterio nuevo a agregar, modificación o duda que presentaran, las cuales se someterían a la aprobación de todos los participantes, tantas rondas como se necesitaran para llegar al consenso y aprobación final.

Tabla patrón para calcular el coeficiente de argumentación
Fuentes de argumentación Alto Medio Bajo
Análisis teóricos realizados 0,3 0,2 0,1
Experiencia como profesional 0,5 0,4 0,2
Trabajos de autores nacionales 0,05 0,05 0,05
Trabajos de autores extranjeros 0,05 0,05 0,05
Sus propios conocimientos sobre el estado del problema de investigación 0,05 0,05 0,05
Su intuición 0,05 0,05 0,05

Resultados

De los 11 expertos seleccionados para el estudio, en la encuesta de autovaloración de experto todos alcanzaron valores mayores a 0,8; de ese total, 7 (63,6 %) alcanzaron valor de 1 de coeficiente de competencia.

La propuesta a la primera ronda fue la siguiente:

Objetividad: Debe quedar claro y verificable el diagnóstico de la enfermedad sin prestarse a dudas por los profesionales que usen la clasificación.

Clínicamente justificable: Debe ser fruto de una necesidad real de mejorar clasificaciones existentes o de hacer una nueva para mejorar atención al paciente (diagnóstico, tratamiento o rehabilitación).

Exhaustiva: No puede quedar fuera de la clasificación ningún paciente que padezca la enfermedad.

Comprensibles y excluyentes: No puede haber duda entre una categoría y otra de la clasificación y cada paciente se ubica en una y solo una categoría de la clasificación.

Sensibles a cambios: La clasificación detecta cualquier modificación de la enfermedad que mide.

Para esta primera revisión se sugirieron modificaciones en el último de los criterios por uno de los expertos, otro de ellos requirió aclaración del segundo criterio y dos refirieron no entender lo que se quería expresar en el último, por lo que, además de la explicación aclarando las dudas, se presentó la modificación corregida por los autores a una segunda ronda quedando como se presenta la propuesta del criterio a modificar:

Sensibles a cambios: En un paciente que sufra modificaciones con respecto a la enfermedad y por sus características no pertenezca a la categoría que fue ubicado inicialmente, la clasificación debe tener la posibilidad de que sea reubicado en otra de sus categorías.

En esta segunda ronda los 11 expertos mostraron la conformidad con la propuesta, sin embargo, uno de ellos sugirió modificar el criterio Comprensibles y excluyentes. La propuesta consistía en separarlo en dos, luego de lo cual lo referente a comprensible formara un criterio independiente de lo excluyente, por lo que se sometió a aprobación en una tercera ronda.

Solo el experto que propuso la modificación estuvo de acuerdo con ella, los 10 restantes consideraron que debía quedarse como inicialmente se propuso por lo que quedó sin modificación por mayoría.

De esa manera la propuesta final validada por los expertos en 3 rondas por el método Delphi, quedó como sigue:

Objetividad: Debe quedar claro y verificable el diagnóstico de la enfermedad sin prestarse a dudas por los profesionales que usen la clasificación.

Clínicamente justificable: Debe ser fruto de una necesidad real de mejorar clasificaciones existentes o de hacer una nueva para mejorar la atención al paciente (diagnóstico, tratamiento o rehabilitación).

Exhaustiva: No puede quedar fuera de la clasificación ningún paciente que padezca la enfermedad.

Comprensibles y excluyentes: No puede haber duda entre una categoría y otra de la clasificación. Cada paciente se ubica en una y solo una categoría de la clasificación.

Sensibles a cambios: En un paciente que sufra modificaciones con respecto a la enfermedad y por sus características no pertenezca a la categoría que fue ubicado, la clasificación debe tener la posibilidad de que sea reubicado en otra de sus categorías.

Discusión

La propuesta del primer criterio está basada en que la objetividad, dada por el estándar de oro (gold standard) (EO): El rendimiento de todo test diagnóstico se basa en su comparación con un gold standard (estándar de oro, patrón de oro, patrón de referencia). El EO es la técnica de diagnóstico que define la presencia de la condición con la máxima certeza conocida,10 sea histológica, radiológica, microbiológica, clínica o de otra índole, para el diagnóstico en el momento en que se haga la clasificación. Es lo que hace posible que la enfermedad sea verificable.

Cuando el diagnóstico de una enfermedad no es el adecuado, muchos pacientes reciben tratamiento médico o farmacológico sin necesitarlo y son expuestos a sus potenciales efectos adversos, con las respectivas implicaciones económicas para el sistema de salud que esto conlleva. A su vez, muchos pacientes con enfermedades progresivas y potencialmente fatales no serán tratados de la forma que requieren, porque quedan mezclados en una población de enfermos heterogéneos o con diferentes características.11

De tal forma, en la literatura aparecen muchas clasificaciones con este tipo de problemas, como reportan Torre Alonso,12) en la revista Reumatología Clínica; Vogelmeiera y otros,13) en su artículo “Fe de errores de Informe 2017 de la Iniciativa global para el diagnóstico, tratamiento y prevención de la enfermedad pulmonar obstructiva crónica: resumen ejecutivo de GOLD”, y Díaz de León-Ponce y otros,14 sobre la insuficiencia renal aguda.

El hecho de que todos los expertos coincidieran con la presencia de este criterio, muestra la importancia que tiene a la hora de validar cualquier clasificación clínica de una enfermedad.

El segundo criterio se basa en que muchas clasificaciones, a la luz de los nuevos conocimientos, no satisfacen los requerimientos de la comunidad científica. Surge, entonces, una necesidad real, que justifica la creación de una nueva clasificación. Así se pueden constatar las diferentes versiones de la Clasificación Internacional de Enfermedades (CIE-11).15 Por el contrario, en la literatura es muy común encontrar enfermedades con múltiples clasificaciones, en las cuales los criterios de diagnóstico varían según los autores y los comités de expertos. Estas diferencias son relevantes y tienen importantes consecuencias, ya que, según el criterio diagnóstico aplicado, un individuo será diagnosticado o no, la prevalencia reportada variará y, lo que es más importante, también lo harán el tratamiento y el pronóstico del individuo.16

La clasificación debe ser exhaustiva para que no quede ninguna manifestación de la enfermedad que no pueda ser contemplada. Existen muchas clasificaciones que han tenido gran importancia a lo largo de años en determinadas especialidades o ramas. Ese es el caso de la clasificación de Angle, que durante un largo tiempo se consideró para los estudios de maloclusión en la ortodoncia. Sin embargo, aunque ha sobrevivido en el tiempo como lenguaje de entendimiento entre los profesionales, hoy en día se conoce que para estos fines no es suficiente, porque existen muchas maloclusiones que no puede clasificar.17 Otra situación similar es reportado por Arias-Cuadrado y otros,18 quienes plantearon que mientras que la mayoría de los autores se basan en una escala de tres estadios para la clasificación del linfedema, cada vez más autores reconocen un estadio 0 (estadio latente), que se refiere a una etapa latente o subestado clínico.

El criterio comprensible y excluyente es muy importante a la hora de definir la categoría o clase propiamente dicha y en el momento de decidir cuando un paciente se ubica en una de las clases. Muchas clasificaciones ampliamente usadas no cumplen con este criterio, como es el caso de la clasificación de El-Azhary, que el 21,9 % de los autores utilizan para el tratamiento del rinofima, sobre todo en estadios severos. En esta la clasificación, leve, moderado o severo depende de la observación y el entrenamiento del especialista que lo trate, ya que en la descripción de la clasificación se combinan elementos clínicos e histológicos,19 cuando las exigencias reales de diagnóstico y tratamiento del paciente deben quedar claras para cualquier profesional de la especialidad que atiende esa enfermedad. En el caso de los trastornos temporomandibulares (TTM). Peña y otros, citado por Pereira Dávalos y otros,19) en un estudio de concordancia, entre los criterios de diagnóstico plantean que, a lo largo de los años, la clasificación de los TTM ha sido confusa, debido a la extensa cantidad de taxonomías existentes. Además, precisan que han sido escasos los criterios de diagnóstico objetivos que puedan diferenciar fácil y claramente a las personas que padecen una condición de las que no.

El criterio sensibles a cambios permite, no solo evaluar los cambios ocurridos en un paciente respecto a la enfermedad, sino que induce al seguimiento y a las adecuaciones respectivas del tratamiento. Los problemas nutricionales y la composición corporal han sido evaluados en múltiples ocasiones por los parámetros antropométricos básicos, como el peso, la talla y el índice de masa corporal, los cuales deben ser siempre obligatorios, tanto para realizar el chequeocomo para realizar la valoración del estado nutricional del paciente. Sin embargo, estos no son parámetros suficientemente sensibles para valorar cambios tempranos, según plantea García Almeida y otros20 en su artículo “Nuevo enfoque de la nutrición”. También, Carrillo Esper y otros21 plantea que los criterios clínicos se han combinado en diferentes escalas o puntajes y ninguna de estas escalas de diagnóstico descarta por completo el síndrome ni establece con certeza el riesgo de muerte y los efectos del tratamiento.

Teniendo en cuenta los diferentes inconvenientes que con frecuencia aparecen señalados a las clasificaciones clínicas y la aprobación final de los expertos, a modo de conclusión, se asume la propuesta final de ítems para validar. La escala quedó conformada por 5 criterios: objetividad, clínicamente justificable, exhaustiva, comprensibles y excluyentes y sensibles a cambios.

Referencias bibliográficas
Historial:
  • » Recibido: 24/02/2020
  • » Aceptado: 08/10/2020
  • » Publicado : 16/04/2021