🧽E-Learning - Limpieza de datos
Breve descripción del proyecto: En este proyecto, analizaremos los datos de LearnData que es una empresa de e-learning dedicada a la venta de cursos online de análisis de datos. Su principal objetivo es:
Contexto
LearnData es una empresa de e-learning dedicada a la venta de cursos online de análisis de datos. Su principal objetivo es:
Herramientas a utilizar
El lenguaje de programación utilizada para realizar el proyecto fue MySQL.
Conjunto de datos del proyecto
LearnData utiliza las siguientes herramientas para gestionar su negocio:
Wocommerce: Es un plugin de wordpress que te permite convertir tu web a un sitio de ecommerce y vender productos.
Stripe: Es una plataforma de procesamiento de pagos por internet, al igual que paypal.
Wordpress: Es un sistema de gestión de contenidos(CMS), un software utilizado para construir, modificar y mantener sitios web.

Desarrollo | Ejecución
Análisis previo del problema
1. ¿Que fuentes de datos tiene la empresa?
La empresa utiliza wordpress con un plugin de wocommerce como plataforma de venta de sus cursos online y luego cuenta con stripe como pasarela de pagos a de más de los pagos de tarjeta de crédito.
2. ¿En que formato se descargan los datos?
Los datos crudos los tendremos en csv directamente descargados de las fuentes.
3. ¿Que datos tenemos?
Tenemos datos de los productos osea cursos que se venden, los clientes, de los pedidos y de los pagos recibidos por stripe.
4. Modelo de datos
Tenemos la tabla de pedidos que se relaciona con la de clientes y productos mediante SKU_producto e id_cliente y por otro lado tenemos la tabla la de pagos de stripe que la relacionaremos con la de pedidos por el numero de pedido.
5. Análisis exploratorio de las tablas.
Pasos para la ejecución del proyecto
1. Crear una nueva base de datos en MYSQL llamada “learndata” + tablas: dim_clientes; dim_producto;fac_pedidos; fac_pagos_stripe
2. Crear la tabla de productos a partir de los datos en crudo: Chequear como vienen los datos, cambiar los nombres de los campos , insertar los campos a la nueva tabla.
3. Crear la tabla de clientes a partir de los datos en crudo: Chequear como vienen los datos, cambiar los nombres de los campos, convertir el campo date_created que viene como timestamp a solo fecha, extraer del campo billing, todos los descriptivos del cliente que necesitamos aprendiendo a parsear un JSON, insertar los campos a la nueva tabla.
4. Crear la tabla de pedidos a partir de los datos en crudo: Chequear como vienen los datos, cambiar los nombres de los campos, sustituir el nombre del producto por el id, normalizar la columna método de pago, convertir a date la columna fecha_pedido, redondear decimales de la columna coste_articulo a enteros, insertamos los pedidos a la tabla.
5. Crear la tabla de cobros de stripe a partir de los datos en crudo: Chequear como vienen los datos, cambiar los nombres de los campos, obtener el número de pedido con la función RIGHT, quitar el numero de pedido de la descripción que es lo que nos va a permitir unir esta tabla con otras, pasar a timestamp el campo “created”, reemplazar las commas por puntos, convertir el número a decimal con dos lugares despues de la comma, insertar tabla en nueva.
Run to view results
Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results

Run to view results
