Nótese
las correlaciones de Pearson altas (superiores a 0,196) al interior de
cada componente teórico (zonas por debajo de la diagonal en negro
claro), las cuales son evidencia de validez de constructo. Asimismo, se
muestran correlaciones de Pearson bajas (inferiores a 0,196) entre
componentes (zonas por debajo de la diagonal en negro oscuro). Los
colores negros debajo de la diagonal clarifican para el primer caso
(con negrilla) la validez de constructo y para el segundo caso (sin
negrilla) la validez discriminante lo cual es indicativo de componentes
teóricos (rasgos o atributos) distintos y, por lo tanto, demuestra la presencia de validez discriminante.Las
correlaciones al interior del componente teórico de evaluación poseen
valores de correlación inferiores a 0,196, así como valores de
correlación negativos, pero también reporta correlaciones
significativas * p valor=0,05. Por lo anterior no es posible establecer
juicios sobre la validez de constructo en esta dimensión teórica.Discusión
En
la literatura se dispone de abundantes sistemas de medición de la
percepción de los síntomas, sin evidencia de los mínimos parámetros de
estabilidad psicométrica necesaria que haga meritoria su utilización en
procesos de investigación o en la práctica, con el agravante de
encontrarse soportados en los estándares masculinos.
Por
otra parte, la literatura no dispone de propuestas métricas para el
estudio de la evaluación y la respuesta a los síntomas, dejándose de
lado como algo no medible o reduciéndose a la cuantificación de los
tiempos de demora únicamente.
Contar con un sistema que sustente
la validez de medida de la experiencia del síntoma desde la percepción,
la evaluación y la respuesta a los síntomas del sca en la mujer a
partir de varios modelos, partiendo desde la apreciación de jueces
hasta aproximaciones matemáticas de mayor complejidad, es la principal
contribución de la presente investigación.Un aporte
relevante se trata de la implementación de un concepto bastante
difundido en la investigación metodológica, el cual hace referencia a
que todo instrumento válido puede ser confiable, pero no todo instrumento confiable es válido.
Con
la anterior premisa se dio una revisión a la propuesta de validez de
contenido de Lawshe modificada por Tristán, la cual permitió emitir un
juicio con base en un nivel de aceptabilidad del IVC, calculado en 0,58
por métodos de comprobación e independiente del número de panelistas.
Con ello se puede resolver la dificultad detectada en los procesos
investigativos que deben adaptar escalas o demostrar parámetros mínimos
de contenido para la utilización de pruebas en contextos diferentes, en
relación con la conformación de los paneles y la determinación de los
puntos mínimos de aceptabilidad, que para la propuesta original de
Lawshe se plantean cinco panelistas para un valor mínimo de CVR de 1,
que corresponde a total acuerdo (lo cual es bastante exigente cuando se
trabaja con un grupo de expertos) y cuarenta panelistas (lo cual es a
veces inexistente en nuestro contexto) para un valor mínimo de CVR de
0,29, pudiéndose notar que no hay propuesta para menos de cinco
panelistas.
Asimismo, la implementación del concepto de validez
escalar permitió desarrollar una propuesta que pasó de ser una
colección de preguntas a una verdadera escala con tres subescalas
independientes que plantean direccionalidad, dependiendo de la cantidad
de atributos de percepción, evaluación y respuesta que posean las
mujeres con SCA.
Este importante desarrollo escalar favoreció
corroborar la validez discriminante y de constructo de los rasgos
medidos, los cuales derivan no solamente en un sistema de medición
válido, sino en resultados de alta interpretabilidad para la mujer que
experimenta los síntomas de sca, que se demarcan en escenarios de
percepción atípica, evaluación de un origen extracardiaco e
insignificante y acciones de respuesta inadecuadas.
La versión
derivada en el presente estudio es de gran utilidad no solo para la
investigación, sino que a futuro podrá ser utilizada en la práctica
disciplinar de enfermería y de las ciencias de la salud en general,
gracias a las pruebas cortas derivadas, las cuales serían fáciles de
aplicar en escenarios reales, especialmente en los sistemas de
clasificación-Triage.
Finalmente y como elemento parcialmente
presentado en la presente publicación, los métodos que soportaron la
validez favorecieron la implementación de sistemas novedosos para
dictaminar la confiabilidad del instrumento como parte de la medición
de la calidad de pruebas, como el modelo de máxima validez-máxima
confiabilidad utilizado, el cual seguramente será de gran utilidad en
la medición de los fenómenos de enfermería, que por su naturaleza
subjetiva requiere un manejo especial, principalmente al establecer los
puntos de corte. Lo anterior se puede ejemplificar claramante con el
tan utilizado parámetro de 0,7 para determinar la aceptabilidad del
valor de alpha de Crombach de un reactivo dentro de una prueba, que
como se demuestra en la presente investigación, podría tratarse de
redundancia métrica (aumento de longitud de prueba para incrementar la
confiabilidad) en pruebas que demuestran una óptima validez escalar.
Los
parámetros de validez obtenidos en el diseño del instrumento derivado
en la presente investigación constituyen la principal garantía para su
utilización, seguido del cálculo de la confiabilidad necesaria para la
validez obtenida, lo que abre el camino al proceso de estandarización
de la prueba en mediciones repetidas.
Conclusiones
La presente investigación exploró varias evidencias de validez, en particular:
Validez de contenido. Se realizó en función de un análisis de jueces expertos. En este caso se empleó el modelo de cuantificación de la validez de contenido a partir de los supuestos planteados en el modelo de Lawshe modificado, encontrándose un índice de validez de contenido para el instrumento global de 0,97 y comprobándose que cada ítem alcanzó y superó el criterio de garantía métrica. Este hallazgo indica que los ítems se constituyen en unidades de análisis representativas de los elementos incluidos para la percepción, la evaluación y la respuesta a los síntomas medidos.
Validez de escala.
El instrumento propuesto debía medir un rasgo latente asociado a la
experiencia del síntoma en tres componentes específicos: percepción,
evaluación y respuesta. Tratándose de un instrumento de medición y no
de un simple conjunto de preguntas inconexas, se esperó que el
“puntaje” que recibía una persona correspondiera con una medida dentro
de las tres variables específicas. Se planteó la necesidad de verificar
que el instrumento disponía de una escala subyacente, por lo cual se
requirió probar la validez de escala. En este caso se empleó el
concepto de validez de escala, revisándose la distribución de ítems, el
rango y el ajuste al modelo denominado recta de diseño 20-80, el cual
aportó la evidencia de esta validez, encontrándose que los tres
componentes de percepción, evaluación y respuesta correspondían a
escalas reales de medición de manera independiente y total. Como medida
correctiva del componente de respuesta analizado por contenido exacto,
al no optar por el comportamiento escalar, los ítems asociados al
ambiente social y los tiempos de demora ameritaron ser retirados del
instrumento. Sin embargo, su valor como reporte fue reubicado y
utilizado para análisis desde el contexto.
Validez discriminante:
los ítems debían medir cada uno de los componentes específicos de
percepción, evaluación y respuesta y no otros; es decir, debía haber
una clara distinción entre los ítems del primer componente y los de los
demás componentes. Para esta verificación se ejecutó el análisis de
validez discriminante, con base en una exploración exhaustiva de los
ítems, utilizando la correlación punto-biserial y el modelo de máxima
validez-máxima confiabilidad, los cuales permitieron comprobar que cada
uno de los componentes estudiados eran diferentes entre sí.
Validez de constructo:
el instrumento debía demostrar que la medición de los ítems
correspondía a un referente teórico externo, para lo cual se empleó el
análisis factorial exploratorio, utilizando el modelo de extracción de
valores característicos y rotación varimax. Este análisis se
complementó con la aplicación del modelo matemático de análisis
multirasgo-multimétodo, demostrándose que el conjunto de ítems que
conformaba los componentes de percepción, evaluación y respuesta
correspondieron con un elemento teórico externo en particular,
evidenciándose así la validez de constructo del instrumento creado
mediante dos estrategias metodológicas diferentes.
La metodología seguida en este trabajo es de aplicación sencilla, pero muy potente y rigurosa para el diseño de pruebas.
Referencias
(1)
Demsey SJ, Dracup K, Moser DK. Women´s decisions to seek medical care
for acute myocardial infarction. Heart Lung. 1995; 24(6): 444-456.
(2)
Hauser ST. Physician-patient relationships. Social Contexts of Health,
illness, and patient care. Cambridge: Cambridge University Press; 1987.
p. 104-140.
(3) Johnson JI. Nurse practitioner-pacient
discourse: uncovering the voice of nursing in primary care practice.
Scholarly inquiry for nursing practice: an International Journal. 1993;
7(3): 143-157.
(4) Wright BD, Stone MH. Validity in Rasch
measurement. Research memorandum 54. MESA. Chicago: University of
Chicago; 1988. p. 12.
(5) Dodd MJ. The pathogenesis and
characterization of oral mucositis associated with cancer therapy. In
innovative approaches to oral mucositis and cancer pain: linking
mechanisms to management. Oncology Nursing Forum. 2004; 31(4): 5-11.
(6)
University of California. A model for symptom management. San Francisco
School of Nursing Symptom Management Faculty Group. J Nurs Scholarship.
1994; 26 (4): 272-276.
(7) Dodd M, Janson S, Facione N,
Faucett J, Froelicher E, Humphreys J, et al. Advancing the science of
symptom management. J Advance Nurs. 2001; 33(5): 668-676.
(8) Lenz ER, et al. The middle-range theory of unpleasant symptoms: An update. Advances in Nursing Science. 1997; 19(3): 14-27.
(9)
Lenz ER, et al. Collaborative development of middle-range nursing
theories: Toward a theory of unpleasant symptoms. Advances in Nursing
Science. 1995; 17(3): 1-13.
(10) Keele KD. The pain chart. Lancet. 1948; 3(2): 6-8.
(11)
Revill SI, Robinson JO, Rosen N, et al. The reliability of a linear
analogue for evaluating pain. Anaesthesia. 1976; 31(9): 1191-1198.
(12)
Liu WH, Aitkenhead AR. Comparison of contemporaneous and retrospective
assessment of postoperative pain using the visual analogue scale. Br J
Anaesth. 1991; 67(6): 768-771.
(13) Frank M, Olsen S.
Instruments for clinical health-care research. Measuring Pain. 2a Ed.
Jones and Bartlett Publishers; 1997. p. 528-561.
(14) Melzack R.
The short-form McGill Pain Questionnaire. Journal of Pain Symptom
Management. 1987; 30(2): 191-197. (15) Dudgeon D, Raubertas RF,
Rosenthal SN. The Shortform McGill Pain Questionnaire in chronic cancer
pain. Journal of Pain Symptom Management. 1993; 8(4): 191-195.
(16)
McGuire DB, Altomonte V, Peterson DE, et al. Patterns of mucositis and
pain in patients receiving preparative chemotherapy and bone marrow
transplantation. Oncology Nursing Forum. 1993; 20(10): 1493-1502.
(17)
Swanston M, Abraham C, Nacrae WA, et al. Pain assessment with
interactive computer animation. Review of Pain. 1993; 53(3): 347-351.
(18)
Zerwic JJ. Symptoms of acute myocardial infarction: Expectations of a
community sample. Heart Lung: Journal of Acute & Critical Care.
1998, 27(2): 75-81.
(19) Champion VL. Instrument development for health belief model constructs. Advances in Nursing Science. 1984; 6(3): 72-85.
(20)
Porter LA. Cognitive appraisal of psychological stress, appraisal
contexts, and life disruption in patients having percutaneous
transluminal coronary angioplasty. Rochester: The University of
Rochester; 1992.
(21) Delunas LR, Potempa K. Adaptation after
treatment for Heart disease: preliminary examination within a stress
appraisal context. Heart Lung. 1999; 28(3): 186-191.
(22)
Vilagut G, Ferrer M, Rajmil L, et al. El cuestionario de salud SF-36
español: una década de experiencia y nuevos desarrollos. Gac Sanit.
2005; 19(2): 135-50.
(23) Wann-Hansson C, Rahm Hallberg I,
Risberg B, et al. A comparison of the Nottingham Health Profile and
Short Form 36 Health Survey in patients with chronic lower limb
ischaemia in a longitudinal perspective. Health and quality of life
outcomes. 2004; 2(9): 5-11.
(24) Céspedes V. Modelo Conceptual
del Manejo del síntoma: clasificación por percepción, evaluación y
respuesta de mujeres con síndrome coronario agudo; originada por la
construcción de un instrumento validado en Bogotá, Colombia [Tesis
doctoral]. Universidad Nacional de Colombia; 2009.
(25) Lawshe CH. Quantitative Approach to Content Validity. Personnel Psychology. 1975; 28(4): 563-575.
(26)
Tristán LA. Modificación al modelo de Lawshe para el dictamen
cuantitativo de la validez de contenido de un instrumento objetivo.
Avances en Medición. 2008; Vol. 6: 35-44.
(27) Wright BD, Stone MH. Making measures. Chicago (USA): The Phaneron Press; 2004. p. 35-39.
(28) Tristán LA, Vidal UR. Linear model to assess the scale’s validity of a test. Chicago: AERA Annual Meeting; 2007.
(29)
Tristán LA. Contribución al estudio del error de medida, (Parte 1).
Notas sobre evaluación criterial. No. 5. CENEVAL y familia de programas
KALT; 1999. p. 12.
(30) Tristán LA. Diseño de pruebas, (Parte 4). México: Instituto de Evaluación e Ingeniería Avanzada; 1999-2007. p. 13-17.
(31) Batista JM, Coenders G, Alonso J. Análisis factorial confirmatorio. Disponible en: http://www.elsevier.es/sites/default/files/elsevier/pdf/2/2v122nSupl.1a13057542pdf001.pdf. Consultado Mayo de 2011.
(32)
Campbell DT, Fiske CD. Convergent and Discriminant Validation by the
Multitrait-Multimethod Matrix. Psychological Bulletin. 1959; 56(2):
81-105.
(33) Wright BD, Stone MH. Making measures. Chicago (USA): The Phaneron Press; 2004. p. 35-39.
(34) Rodríguez P, Cifuentes M, Moreno E, Sanjuán P. Matriz Multirasgo Multimétodo. Disponible en: http://redalyc.uaemex.mx/redalyc/pdf/727/72797112.pdf. Consultado Mayo de 2011.
(35) Martínez JA, Martínez L. Matriz Multirasgo Multimétodo. Disponible en: http://repositorio.bib.upct.es:8080/jspui/handle/10317/1600. Consultado Mayo de 2011.