Publicado

2025-07-01

PREDICCIÓN DE CASOS DE MALARIA EN LA REGIÓN DE ASHANTI GHANA UTILIZANDO LOS MODELOS NAIVE BAYES Y K VECINOS MÁS CERCANOS

PREDICTION OF MALARIA CASES IN THE ASHANTI REGION GHANA USING THE NAIVE BAYES AND K NEAREST NEIGHBORS MODELS

Palabras clave:

K vecinos más cercanos, machine learning, naive bayes, aprendizaje estadístico, malaria (es)
K nearest neighbors, machine Learning, naive bayes, statistical learning, malaria (en)

Descargas

Autores/as

  • Javier Mosquera Renteria Universidad Nacional de Colombia https://orcid.org/0009-0004-7105-461X
  • Juan Carlos Salazar Uribe Universidad Nacional de Colombia
  • Ellis Kobina Paintsil Centro Kumasi de Investigación Colaborativa (KCCR) en Ghana

La malaria es una enfermedad causada por parásitos del género Plasmodium, transmitidos por la picadura de mosquitos hembra del género Anopheles. En Ghana, esta enfermedad representa un problema de salud pública significativo, siendo la principal causa de morbilidad y responsable de entre el 40 % y el 60 % de las hospitalizaciones en el país. El objetivo de este estudio fue comparar el desempeño de los modelos de aprendizaje estadístico K vecinos más cercanos y Naive Bayes en la predicción del número de casos probables de malaria. Se utilizo variables hematológicas, edad y género de pacientes, cuyos datos fueron extraídos del laboratorio del Hospital St. Patrick?s de Ashanti, en Ghana desde enero de 2018, a junio del mismo año, a partir del libro de registros hematológicos. Para este estudio se utilizaron datos de 2076 pacientes. En la evaluación de los modelos, Naive Bayes obtuvo un AUC del 80.6 % y una precisión del 77.9 %, destacando variables hematológicas como Hemoglobina (Hb), Plaquetas (Plt) y Linfocitos (Lymph), además de la Edad (Age), como las más relevantes dentro del conjunto analizado. Su sensibilidad fue del 70.3%, lo que indica una buena capacidad para identificar casos positivos, aunque con un valor predictivo positivo del 38.1%, reflejando una alta tasa de falsos positivos. Sin embargo, su valor predictivo negativo alcanzó el 93.6%, lo que sugiere una alta confiabilidad en la identificación de casos negativos. En contraste, KNN presentó un AUC del 70.3% y una precisión del 78.4%, pero con una menor sensibilidad del 39%. Su especificidad fue del 94%, permitiéndole identificar correctamente la mayoría de los casos negativos, con un valor predictivo positivo del 71.9%, indicando mayor precisión en la clasificación de casos positivos. En conclusión, Naive Bayes mostró mejor desempeño en términos de AUC y sensibilidad, aunque su capacidad para predecir correctamente casos positivos fue inferior a la de KNN.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Ankamah, S., Nokoe, K. & Iddrisu,W. (2018). Modelling Trends of Climatic Variability and Malaria in Ghana Using Vector Autoregression. Hindawi, 2018(6124321), 1-11.

Bishop, C. M.(2006).Pattern Recogniton and Machine Learning- 738p.

Bun, Y., Ma, X., Lam, K. F. & Milligan, P. (2020). Estimation of the primary, secondary and composite effects of malaria vaccines using data on multiple clinical malaria episodes. Elsevier, 38(32), 4964-4969.

Dalrymple, ´U., Arambepola, R., Gething, P.W & Cameron, E. (2018). How long do rapid diagnostic tests remain positive after anti-malaria treatment?. Malaria Journal, 17(1), 1-13.

Deress, T & Girma, M. (2019). Plasmodium falciparum am Plasmodium vivax Prevalence in Ethiopia: A Systematic Review and Meta-Analysis. Hindawi, 2019(7065064), 1-12.

Gaw, S-L., Hromatka, B.S., Ngeleza, S., Buarpung, S., Ozorslan, N., Tshefu, A & Fisher, S.J. (2019). Differential Activation of Fetal Hofbaver Cells in Primigravidas Is Associated with Decreased Birth Weight in Symptomatic Placental Malaria. Hindawi, 2019(378174), 1-10.

Hume, J.C., Barnish, G., Mangal, T., Arm´azio, L., Streat, E. & Bates, I. (2008). Household cost of malaria overdiagnosis in rural Mozambique. Malaria Journal, 7(1), 1-8.

James, G., Witten, D., Hastie, T & Tibshirani, R. (2021). An Introduction to Statistical Learning with Applications in R. 607 p.

Johnson, R.A & Wichern, D.W.(2007). Applied Multivariate Statistical Analysis. 773 p.

Kobina, E., Yaw, A., Glover, M & Akwasi, M. (2019). Analysis of Haematological Parameters asPredictors of Malaria Infection Using a Logistic Regression Model: A case Study of a Hospital in The Ashanti Region of Ghana. Hindawi, 2019(1486370), 1-7.

Ladier, J., Parker, D.M., Myin, A., Carrara, V.I., Maung, K., Bonnington, C.A., Pukrittayakamee, S., Delmas, G & Nosten, F.H. (2016). The role of early detection and treatment in malaria elimination. Malaria Journal, 15(1), 1-8.

Lamine. & Sy, A. (2021). On the Efficiency of Machine Learning Models inMalaria Prediction.Public Health and Informatics, 281, 437-441. doi: 10.3233/SHTI210196

Lave, E., Aseidu, J & Adjei, E. (2017). A Weather-Based Prediction Model of Malaria Prevalence in Amenfi West District, Ghana. Hindawi, 2017(7820454), 1-8.

Muhamedhussein, M.S., Ghosh, S., Khanbhai, K., Maganga, E., Nagri, Z. & Manji. (2019). Prevalence and Factors Association with Acute Kidney Injury among Malaria Patients in Dar es Salaam: A Cross-Sectional Study. Hindawi, 2019(4396108), 1-7.

R Core Team. (2023). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. [Consultada en 2023]. Disponible en: https://www.Rproject.org/.

RStudio Team. (2023). RStudio: Integrated Development for R. RStudio, PBC, Boston, MA. [Consultada en 2023]. Disponible en: http://www.rstudio.com/.

Suseela, Devi.S., Samantha, E., Priyadharshini, B., & Jetlin, C.P. (2021). Malaria Detection Using Machine Learning with K Nearest Neighbour Algorithm. International Journal of Scientific Development and Research, 6(2455-2631), 457-460.

Walpole, R.E., Myers, R.H., Myers, S.L & Ye, K.(2012). Probabilidad y estadística para ingeniería y ciencias. 816p.

Wackerly, D., Mendenhall, W & Scheaffer, R. (2008). Estadística matemática con aplicación. 911