Aplicación de técnicas de minería de datos para la detección y el diagnóstico del cáncer de mama
No Thumbnail Available
Date
2022
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Este trabajo de grado se enmarca en la construcción de modelos a través de la metodología CRISD - DM para el diagnóstico del cáncer de mama en benigno y maligno integrados en un aplicativo web para la gestión de este proceso en la Liga Contra el Cáncer – Seccional Cesar. Por lo tanto, este proyecto está dividido en tres etapas las cuales son: la descripción general del proyecto, la descripción situacional donde se presenta la problemática de estudio, se planean los objetivos y definen las metodologías y aspectos de la investigación, y por ultimo, se realizo el desarrollo cientifico tecnologico donde se aplicó la metodología propuesta, se exponen el análisis de requerimientos, el diseño del sistema y socialización del aplicativo web llamado Diagnosis Breast Cancer.
Para finalizar se presentan los resultados del proyecto donde se aplicaron un total de siete modelos: LogisticRegression (exactitud: 55%), KNN (exactitud: 75%), SVM (exactitud: 66%), DecisionTree (exactitud: 100%), NaiveBayes (exactitud: 65%), RandomForest (exactitud: 99%) y el GradientBoosting (exactitud: 100%), fueron elegidos solo tres modelos para la integración al aplicativo web debido a sus altos porcentajes el DecisionTree, GradientBoosting y RandomForest los cuales permiten de manera efectiva y eficaz el diagnóstico del cáncer de mama.
Abstract
This thesis is framed within the construction of models using the CRISP-DM methodology for diagnosing benign and malignant breast cancer, integrated into a web application for managing this process at the League Against Cancer – Cesar Branch. Therefore, this project is divided into three stages: the general description of the project, the situational description where the study problem is presented, the objectives are planned, and the methodologies and aspects of the research are defined. Finally, the scientific-technological development was carried out, applying the proposed methodology, presenting the requirements analysis, system design, and the socialization of the web application called Diagnosis Breast Cancer.
To conclude, the project results are presented, where a total of seven models were applied: Logistic Regression (accuracy: 55%), KNN (accuracy: 75%), SVM (accuracy: 66%), Decision Tree (accuracy: 100%), Naive Bayes (accuracy: 65%), Random Forest (accuracy: 99%), and Gradient Boosting (accuracy: 100%). Only three models were selected for integration into the web application due to their high accuracy: Decision Tree, Gradient Boosting, and Random Forest, which effectively and efficiently facilitate breast cancer diagnosis.