Ranking de ejecución del Programa Presupuestal 101 "Incremento de actividades físicas, deportivas y recreativas en la población peruana" durante el año 2021 en los gobiernos locales
Análisis Exploratorio de Datos (EDA)
Realizado por: Urdanegui Bisalaya, Sebastian Marat
Contactarse con Sebastian: sebasurdanegui@gmail.com
Base de datos: https://www.datosabiertos.gob.pe/dataset/ranking-ppr-101
El presente notebook tiene como objetivo aplicar los conocimientos adquiridos como Data Analyst en la escuela de Data Analyst de Platzi. Tomé la decisión de evaluar el Ranking de ejecución del Programa Presupuestal 101 "Incremento de actividades físicas, deportivas y recreativas en la población peruana" durante el año 2021 en los gobiernos locales para dar a conocer a los lectores qué presupuesto fue asignado por el Ministerio de Economía y Finanzas a cada gobierno local, además, mostrar la tasa de ejecución y el valor monetario de cada asignación.
Las siguientes librerías serán necesarias para extraer, transformar y analizar la información del dataset. Además, es necesario instalar las siguientes dependencias para lograr acceder al formato .xlsx sin ningún inconveniente: 'xlrd', 'openpyxl'.
La información del Programa Presupuestal 101 "Incremento de actividades físicas, deportivas y recreativas en la población peruana" durante el año 2021 en los gobiernos locales será almacenada en la variable data para el posterior uso.
Preparación y limpieza del dataset
Debo eliminar aquellas columnas que se encuentran en la parte derecha de la columna Total, puesto que la información declarada no será útil para el análisis de datos.
El dataset Programa Presupuestal 101 "Incremento de actividades físicas, deportivas y recreativas en la población peruana" durante el año 2021 en los gobiernos locales tiene 1,192 filas y 18 columnas.
El dataset Programa Presupuestal 101 "Incremento de actividades físicas, deportivas y recreativas en la población peruana" durante el año 2021 en los gobiernos locales tiene 21,456 datos.
Dado que el dataset posee espacios en blanco y las variables del tipo numérico no son reconocidas como tal, debo realizar un reemplazo de tales inconvenientes para limpiarlo.
El dataset Programa Presupuestal 101 "Incremento de actividades físicas, deportivas y recreativas en la población peruana" durante el año 2021 en los gobiernos locales tienen un valor nulo en la variable Población, ya que, el número es mínimo no impacta en gran medida en el análisis de la información.
Ahora, crearé una función para cortar cadenas de texto. ¿Por qué? Ya que la variable GOBIERNOS LOCALES tiene un tipo de dato alfanumérico, sólo se desea extraer el nombre de los gobiernos locales más no el código de identificación.
Es hora de convertir el dataset inicial a un DataFrame para poder concatenarlo con la información del tipo texto del nombre de las municipalidades locales perteneciente al DataFrame NOMBRES_GOBIERNOS_LOCALES.
Posteriormente, presentaré un análisis estadístico básico tras la preparación y limpieza de la base de datos extraída de la plataforma de Datos Abiertos del Gobierno Peruano.
Interpretación general del análisis descriptivo
Análisis estadístico descriptivo
¿Cuál es la municipalidad que recibió el mayor presupuesto actualizado (PIM) para el año fiscal 2021 a consecuencia de las modificaciones presupuestarias, tanto a nivel institucional como a nivel funcional programático?
¿Cuál es presupuesto inicial total por departamento de las entidades públicas aprobado por su respectivo Titular con cargo a los créditos presupuestarios establecidos en la Ley Anual de Presupuesto del Sector Público para el año fiscal 2021?
¿Qué departamentos poseen el mayor presupuesto inicial del total de las entidades públicas aprobado por su respectivo Titular con cargo a los créditos presupuestarios establecidos en la Ley Anual de Presupuesto del Sector Público para el año fiscal 2021? - Top 5
¿Cuál es presupuesto actualizado total por departamento de las entidades públicas a consecuencia de las modificaciones presupuestarias, tanto a nivel institucional como a nivel funcional programático, efectuadas durante el año fiscal, a partir del PIA?
¿Qué departamentos poseen el mayor presupuesto actualizado total de las entidades públicas a consecuencia de las modificaciones presupuestarias, tanto a nivel institucional como a nivel funcional programático, efectuadas durante el año fiscal, a partir del PIA?
¿Las entidades públicas por departamentos han incrementado o contraído el presupuesto asignado para el año fiscal 2021 mediante el PIA reflejado en el PIM a consecuencia de las modificaciones presupuestarias, tanto a nivel institucional como a nivel funcional programático?
¿Cuáles son las municipalidades por departamento que han obtenido el mayor presupuesto actualizado reflejado en el PIM para el año fiscal 2021?
¿Existe alguna diferencia entre el presupuesto actualizado para el año fiscal 2021 (PIM) y el Compromiso Anual de la autoridad municipal de cada gobierno local en el Perú? - Top 5
¿Cuáles son las municipales por departamento que han obtenido el mayor avance (%) en función del presupuesto actualizado asignado para el año fiscal 2021? - Top 10
Análisis geoespacial
Niveles del presupuesto actualizado (PIM) por departamento en el Perú
Según la teoría económica urbana, menciona que las zonas de aglomeración con mayores áreas geográficas son proclives a tener un crecimiento económico, teniendo en cuenta los factores como la productividad del capital humano, la latitud y longitud del espacio geográfico y la cercanía a espacios comerciales. Por ello, tomando como supuesto que una mayor asignación en el presupuesto actualizado proveerá de un mejor desarrollo económico a la localidad, esperaría que cuanto más sea su área geográfica mayor será el presupuesto actualizado asignado (PIM).
Pese que la información es limitada, se puede inferir que existe una relación directa entre el área geográfica medida en kilómetros al cuadrado (km2) y el presupuesto asignado actualizado (PIM). Es decir, cuanto mayor sea el área geográfica del departamento mayor será el presupuesto asignado. Además, se puede apreciar cierta aglomeración de los presupuestos asignados a cada departamento entre los S/. 25'000,000.00 y los S/. 75'000,000.00 ocupando un área geográfica alrededor de los 50,000 km2.
Puedo inferir que existe una relación positiva entre el número de habitantes por departamento en el Perú (medido en miles) y el presupuesto asignado actualizado (PIM). En líneas generales, cuanto mayor sea el número de habitantes por departamento impactará en el incremento del presupuesto actualizado (PIM). Es preciso recalcar que existe una aglomeración de los datos en rango de los 2'000,000 de habitantes por departamento que reciben cerca de S/. 50'000,000.00 como presupuesto actualizado (PIM) para la mejora de actividades físicas, deportivas y recreativas para el año fiscal 2021.