Goal
The main objective of this project is for the student to apply one or more classification algorithms to predict the response variable in the target data set, evaluate said algorithm and interpret the results.
In these blocks I install some dependencies needed for the next analysis.
In this block the modules needed to run this notebook are imported.
El siguiente bloque de código hace que todas las columnas que se muestran en un df.head() sean visibles y no hayan ocultas.
En este bloque cargamos el dataset a analizar.
El siguiente bloque hace un proceso de escalación de los datos para que entrenando el modelo no se sesgue por las dimensiones de cada magnitud. Además guarda el escalador para que pueda ser usado en posteriores llamados del modelo para predecir usándolo.
En esta parte del código lo que se hace es dividir el conjunto de datos en X y Y, es que separa la variable target, ademas también saca un conjunto de entrenamiento, un 80% y uno de pruebas con el restante.
En este bloque se crea el modelo usando el clasificador de decisiones de árbol, luego se hacen las predicciones al conjunto de pruebas y se calcula una matriz de confusión para validar Falsos Positivos, Falsos Negativos, Verdaderos Positivos y Verdaderos Negativos, con los cuales se calcularán las métricas accuracy, precision, recall y f1 score.
Guardamos el modelo.
Podemos cargar de nuevo el modelo
Podemos cargar también el scaler
Se simulan algunos datos que llegan a través de una API y ver como podemos llamar al modelo para usarlo.
Escalamos los datos de prueba.
Realizamos las predicciones
Adjunto se podrá encontrar este notebook en un formato comprimido junto con el dataset.