👩🏻💻 LINKEDIN - Data - Automatización + Limpieza de datos + Análisis
Breve descripción del proyecto: En este proyecto, nosotros, como analistas de datos, estamos enfocados en analizar el mercado laboral en roles relacionados con la analítica de datos en diferentes países. Nuestra fuente de datos proviene de una descarga de webscraping que hemos obtenido de LinkedIn, que contiene información sobre puestos de trabajo en este campo. Nuestro objetivo principal es validar la calidad de los datos y, posteriormente, extraer conclusiones clave sobre el mercado laboral en el mundo de la analítica de datos.
Contexto
Este proyecto intentará responder a las siguientes preguntas:
Herramientas a utilizar
El lenguaje de programación utilizada para realizar el proyecto fue Mysql.
Conjunto de datos del proyecto
Los datos están originalmente en CSV, la fuente de datos proviene de una descarga de webscraping que he obtenido de LinkedIn, que contiene información sobre puestos de trabajo en analisis de datos.
Desarrollo | Ejecución
Parte I - Crear tabla linkedin_data + SP de recarga de datos
1. Cargar la base de datos “linkedin_data” 2. Crear tabla linkedin_ofertas (con los siguientes campos: linkedin_ofertas ( fecha_actualizacion datetime, nombre_empresa varchar(200) , fecha_busqueda_oferta_linkedin datetime , fecha_publicacion_oferta date , pais_oferta varchar(200), search_id_oferta int , titulo_oferta varchar(200) ) 3. Modificar las restricciones de la fecha ejecutuando la siguiente sentencia: SET @@SESSION.sql_mode='ALLOW_INVALID_DATES'; 4. Definir la consulta que va a dejar los datos como queremos. (limpiarlos) 5. Crear un stored procedure con la query de limpieza que inserte datos en la tabla. 6. Crear el evento que ejecute el SP de forma diaria
Parte II - Crear tabla linkedin_busquedas + SP de recarga de datos
1. Crear tabla linkedin_busquedas (linkedin_busquedas ( id_busqueda INT PRIMARY KEY, fecha_busqueda datetime , fecha_actualizacion datetime, keyword_busqueda varchar(200) , pais_busqueda varchar(200), n_resultados_busqueda int ) 2. Modificar las restricciones de la fecha ejecutuando la siguiente sentencia: SET @@SESSION.sql_mode='ALLOW_INVALID_DATES'; 3. Definir la consulta que va a dejar los datos como queremos. (limpiarlos) 4. Crear un stored procedure con la query de limpieza que inserte datos en la tabla. 5. Crear el evento que ejecute el SP de forma diaria
Limpieza de datos
Run to view results
Análisis exploratorio - validacion de datos
Run to view results
Análisis Linkedin data
Run to view results