Goal
The main objective of this project is for the student to apply one or more classification algorithms to predict the response variable in the target data set, evaluate said algorithm and interpret the results.
In these blocks I install some dependencies needed for the next analysis.
In this block the modules needed to run this notebook are imported.
Run to view results
El siguiente bloque de código hace que todas las columnas que se muestran en un df.head() sean visibles y no hayan ocultas.
Run to view results
En este bloque cargamos el dataset a analizar.
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
El siguiente bloque hace un proceso de escalación de los datos para que entrenando el modelo no se sesgue por las dimensiones de cada magnitud. Además guarda el escalador para que pueda ser usado en posteriores llamados del modelo para predecir usándolo.
Run to view results
En esta parte del código lo que se hace es dividir el conjunto de datos en X y Y, es que separa la variable target, ademas también saca un conjunto de entrenamiento, un 80% y uno de pruebas con el restante.
Run to view results
En este bloque se crea el modelo usando el clasificador de decisiones de árbol, luego se hacen las predicciones al conjunto de pruebas y se calcula una matriz de confusión para validar Falsos Positivos, Falsos Negativos, Verdaderos Positivos y Verdaderos Negativos, con los cuales se calcularán las métricas accuracy, precision, recall y f1 score.
Run to view results
Run to view results
Guardamos el modelo.
Run to view results
Podemos cargar de nuevo el modelo
Run to view results
Podemos cargar también el scaler
Run to view results
Se simulan algunos datos que llegan a través de una API y ver como podemos llamar al modelo para usarlo.
Run to view results
Run to view results
Run to view results
Escalamos los datos de prueba.
Run to view results
Realizamos las predicciones
Run to view results
Run to view results
Run to view results
Adjunto se podrá encontrar este notebook en un formato comprimido junto con el dataset.