23-6-2021%2019.6.16%203.jpg

23-6-2021%2019.6.12%202.jpg

23-6-2021%2019.6.6%201.jpg

VEAMOS PRIMERO QUE PASA SI USAMOS EL DATASET DESBALANCEADO :

REGRESION LOGÍSITCA - SKLEARN

COMPARACIÓN DE MÉTRICAS

REGRESION LOGÍSITCA - STATSMODEL

NAIVE BAYES

COMPARACIÓN DE MÉTRICAS

KNN

VALOR DE K

CURVA ROC Y AUC

CONCLUSION FINAL

La métrica más importante en este tipo de estudios médicos va a ser la Recall Sensitivity.

Ya que buscamos tener la mayor relación entre los Verdaderos Positivos ( Predicciones correctas a Gente con un posible CHD ) y Cantidad de casos predichos con CHD (Predicciones correctas a Gente con un posible CHD + Predicciones incorrectas a Gente con un posible CHD)

Por lo que elegimos la Regresión Logística