Análisis Exploratorio: Relación entre Factores Socioeconómicos y Rendimiento Académico en Matemáticas
A nivel global, persiste una preocupación constante por comprender los determinantes que influyen en el rendimiento académico de los estudiantes. La evaluación PISA, coordinada por la OCDE, ha evidenciado de manera sistemática disparidades significativas en el desempeño en matemáticas entre los países participantes. Estas diferencias no solo reflejan brechas en los sistemas educativos, sino también desigualdades socioeconómicas y estructurales que condicionan las oportunidades de aprendizaje. En este contexto, surge la necesidad de examinar de manera conjunta factores a nivel micro (estudiante) y macro (país) para entender cómo interactúan y contribuyen a explicar las variaciones observadas en los puntajes de matemáticas en PISA 2022. Desde el ámbito individual, variables como el nivel socioeconómico del estudiante (SES) y el tipo de escuela a la que asiste —pública o privada— se han identificado en la literatura como predictores relevantes del desempeño académico. Estos factores capturan diferencias en capital cultural, acceso a recursos educativos, clima escolar y apoyo familiar.
Por otro lado, desde una perspectiva macroeconómica, indicadores como el gasto público en educación y el PIB per cápita reflejan la capacidad de un país para invertir en infraestructura educativa, formación docente y políticas públicas destinadas a reducir las desigualdades en el acceso a una educación de calidad. Comprender cómo estos factores estructurales se relacionan con el rendimiento promedio de los estudiantes es fundamental para evaluar la eficacia de las políticas educativas existentes y para identificar potenciales mecanismos de intervención.
Este proyecto tiene como propósito analizar la relación entre estos determinantes socioeconómicos y macroeconómicos con el puntaje de matemáticas reportado en PISA 2022. A través de un enfoque descriptivo y comparativo, se busca identificar patrones, tendencias y diferencias entre países que permitan comprender mejor las disparidades educativas. En particular, se pretende evaluar si el nivel socioeconómico del estudiante, el tipo de institución educativa, el gasto público en educación y el PIB per cápita se asocian de manera significativa con el desempeño en matemáticas, proporcionando así un marco analítico para interpretar las brechas de aprendizaje en el contexto internacional.
Planteamiento del Problema
El presente estudio aborda como problema de investigación la identificación y cuantificación de los factores que determinan el desempeño en matemáticas de los estudiantes evaluados en PISA 2022. En un contexto global post-pandemia, donde los sistemas educativos enfrentan desafíos sin precedentes, resulta crucial discernir los impulsores clave del rendimiento académico. El análisis se centra en desentrañar en qué medida las disparidades en los puntajes pueden atribuirse a características socioeconómicas individuales de los estudiantes y a las condiciones macroeconómicas y de política educativa de los países a los que pertenecen.
A nivel micro, se considera que el nivel socioeconómico del estudiante y el tipo de institución educativa a la que asiste (pública o privada) constituyen variables fundamentales que moldean sus oportunidades de aprendizaje. Estas dimensiones individuales operan dentro de un marco macro más amplio, definido por la capacidad económica de una nación, reflejada en su PIB per cápita, y por su compromiso político con la educación, medido a través del gasto público destinado al sector. La interacción entre estos niveles —individual y país— crea un complejo entramado que puede potenciar o limitar el logro educativo.
En consecuencia, este análisis busca no solo correlacionar variables aisladas, sino construir una comprensión integral y multicausal que permita desagregar el peso específico de cada factor en la explicación de las brechas observadas, tanto entre estudiantes de un mismo país como entre las distintas naciones participantes. El objetivo final es aportar evidencia empírica sólida que ilumine los determinantes estructurales y contextuales de las desigualdades educativas, proporcionando así insumos valiosos para el diseño de políticas públicas más efectivas y equitativas a nivel nacional e internacional.
1. Marco Teórico
El presente estudio se fundamenta en dos fuentes principales de información: la base de datos del Programa para la Evaluación Internacional de Alumnos (PISA) 2022, desarrollada por la Organización para la Cooperación y el Desarrollo Económicos (OCDE), y los Indicadores de Desarrollo Mundial (World Development Indicators, WDI) publicados por el Banco Mundial. PISA constituye una de las evaluaciones comparativas más reconocidas a nivel internacional, orientada a medir las competencias de estudiantes de 15 años en matemáticas, lectura y ciencias, complementada con cuestionarios de contexto socioeconómico y escolar. Para garantizar la calidad y comparabilidad de sus datos, la OCDE aplica un diseño de muestreo estratificado en dos etapas: en la primera etapa, se seleccionan escuelas mediante un muestreo probabilístico proporcional al tamaño de la matrícula, mientras que en la segunda etapa, dentro de cada escuela seleccionada, se elige aleatoriamente una muestra de estudiantes de 15 años. Adicionalmente, la OCDE implementa protocolos estandarizados de aplicación, supervisión, control de calidad y calibración de puntajes mediante métodos como los ítems de anclaje y la teoría de respuesta al ítem (TRI).
Por su parte, los indicadores WDI proporcionan información sistematizada sobre variables macroeconómicas y sociales que permiten contextualizar el entorno económico de los países incluidos en el análisis. Estos indicadores se obtienen a partir de estadísticas nacionales oficiales, censos poblacionales, encuestas de hogares, registros administrativos y cuentas nacionales, y cada uno pasa por procesos de validación, armonización y revisión metodológica que aseguran comparabilidad temporal y entre países. El Banco Mundial trabaja directamente con las oficinas nacionales de estadística y organismos multilaterales (UNESCO, FMI, ONU) para consolidar y estandarizar la información antes de su publicación.
La primera base de datos utilizada corresponde a PISA 2022, compuesta por 800 registros donde cada fila representa a un estudiante individual. Entre las variables incluidas se encuentran: Country (categórica nominal identificadora del país de origen), school_type (categórica nominal que distingue el tipo de escuela, como pública o privada), socioeconomic (categórica ordinal que refleja el nivel socioeconómico del estudiante) y math_score (cuantitativa continua que recoge el puntaje obtenido en matemáticas). La segunda base de datos, proveniente de WDI, está conformada por 264 registros correspondientes a países, con variables principales como Country (categórica nominal), gdp_pc (cuantitativa continua que indica el Producto Interno Bruto per cápita) y educ_exp (cuantitativa continua que representa el gasto público en educación como porcentaje del PIB).
La estrategia metodológica del estudio se inicia con la integración de ambas fuentes de información mediante la variable Country, generando un conjunto de datos combinado que asigna a cada estudiante los indicadores macroeconómicos correspondientes a su país. Esta integración permite analizar de manera simultánea factores individuales y estructurales que inciden en el rendimiento académico. Posteriormente, se desarrolla un análisis exploratorio de datos (EDA) orientado a caracterizar las distribuciones de cada variable, empleando medidas descriptivas como medias, medianas, desviaciones estándar y frecuencias, según corresponda a su tipología. Este análisis se complementa con una evaluación bivariante y multivariante mediante técnicas gráficas y estadísticas, tales como diagramas de dispersión para examinar la relación entre math_score y gdp_pc, diagramas de caja para comparar el rendimiento por tipo de escuela o nivel socioeconómico, y estimaciones de correlación que permitan identificar vínculos preliminares entre las variables socioeconómicas y macroeconómicas. Esta fase tiene como objetivo detectar patrones, tendencias y posibles valores atípicos que sirvan como base para comprender las asociaciones iniciales entre las variables independientes y la variable dependiente, estableciendo así un punto de partida sólido para análisis posteriores de mayor complejidad.
Fuente y Descripción de los Datos
La Base de Datos 1 corresponde al Programa para la Evaluación Internacional de Alumnos (PISA) 2022, una evaluación internacional desarrollada por la Organización para la Cooperación y el Desarrollo Económicos (OCDE). Esta prueba se aplica a estudiantes de 15 años en más de 80 países y utiliza instrumentos estandarizados que incluyen pruebas cognitivas y cuestionarios de contexto. Para nuestro análisis, utilizamos una muestra de 800 registros, cada uno correspondiente a un estudiante, y trabajamos con 4 variables principales: Country, una variable categórica que identifica el país del estudiante; school_type, una variable categórica que clasifica el tipo de escuela en códigos 0 y 1; socioeconomic, una variable categórica que representa el nivel socioeconómico según la codificación de cada país; y math_score, una variable cuantitativa que recoge el puntaje obtenido por cada estudiante en la prueba de matemáticas.
La Base de Datos 2 proviene de los Indicadores de Desarrollo Mundial (WDI), un conjunto de datos del Banco Mundial que recopila información a partir de fuentes internacionales oficialmente reconocidas. En este caso, utilizamos un subconjunto de 264 registros, cada uno representando un país, y trabajamos con 3 variables: Country, una variable categórica que identifica el nombre del país; gdp_pc, una variable cuantitativa que representa el Producto Interno Bruto per cápita en dólares actuales; y educ_exp, una variable cuantitativa que recoge el porcentaje de gasto público en educación con respecto al PIB.
Integración de bases de datos
La integración de bases de datos se realizó combinando información proveniente de dos fuentes principales: PISA 2022 y los indicadores macroeconómicos de WDI (World Development Indicators) del Banco Mundial. La base PISA contiene microdatos de estudiantes de 15 años evaluados en más de 80 países, mientras que WDI aporta información económica relevante a nivel país. Para este proyecto se incluyeron específicamente dos variables macroeconómicas: el PIB per cápita (US$ actuales) y el gasto público en educación (% del PIB). La integración de ambas fuentes permite analizar cómo los contextos económicos nacionales se relacionan con el rendimiento educativo.
Carga y configuración inicial
Este primer bloque del análisis establece el entorno de trabajo necesario para llevar a cabo todas las etapas posteriores. Se cargan las librerías fundamentales para manipulación, análisis y visualización de datos. En particular, pandas y numpy permiten gestionar estructuras tabulares, trabajar con valores faltantes y ejecutar transformaciones eficientes; matplotlib y seaborn proporcionan herramientas versátiles para crear visualizaciones de alta calidad, útiles para identificar patrones y tendencias en los datos; mientras que scipy, junto con funciones estadísticas como skew y kurtosis, permite calcular métricas más avanzadas que aportan una visión profunda de la forma de las distribuciones. Adicionalmente, se configura el estilo general de los gráficos para mantener coherencia visual y se desactivan advertencias innecesarias con el fin de obtener un flujo de análisis limpio y centrado en los resultados.
Run to view results
Se realiza la carga y preparación inicial de las dos bases de datos centrales del estudio. Los datos de PISA contienen información detallada sobre el desempeño educativo de estudiantes de 15 años en distintos países, mientras que los datos del WDI provienen del Banco Mundial y ofrecen indicadores macroeconómicos clave. Se efectúa una limpieza inicial para mantener los valores faltantes como NaN, asegurando que los procedimientos posteriores puedan identificarlos y manejarlos adecuadamente. Además, se seleccionan las variables pertinentes y se renombran para facilitar su interpretación dentro del análisis; por ejemplo, se estandarizan nombres como CNT → Country o LANGTEST_QQQ → math_score. Esta reorganización inicial permite armonizar las bases y preparar la estructura necesaria para la integración posterior.
Run to view results
Antes de iniciar cualquier análisis estadístico o la integración entre bases de datos, es fundamental comprender la estructura interna del conjunto de datos. En este bloque se revisan los tipos de variables, el número de observaciones no nulas, la forma general de la tabla y sus primeras filas, con el fin de evaluar la consistencia y detectar posibles problemas desde el inicio. Además, se convierte la variable socioeconomic a tipo categórico, lo cual resulta crucial para preservar su semántica y facilitar análisis posteriores que requieran segmentación por grupos socioeconómicos. Finalmente, se examina la variable math_score mediante estadísticas descriptivas y el conteo de valores únicos, con el objetivo de verificar su variabilidad y descartar posibles errores de codificación o valores atípicos de naturaleza estructural.
Run to view results
La estructura del DataFrame muestra 800 observaciones distribuidas en cuatro variables, sin valores faltantes en Country, school_type ni socioeconomic. La conversión de socioeconomic a tipo categórico se realizó correctamente y reduce el uso de memoria sin alterar la información. La variable math_score presenta 791 valores no nulos, lo que implica 9 observaciones faltantes que deberán tratarse posteriormente. Las primeras filas permiten confirmar que las variables se encuentran en el formato esperado. Respecto a math_score, las estadísticas descriptivas indican una media de 328.67 puntos con una desviación estándar relativamente amplia (179.20), lo que sugiere alta variabilidad entre los estudiantes. El rango de valores (113 a 998) es amplio pero posible dentro de escalas tipo PISA si los datos han sido reescalados, aunque el valor máximo de 998 podría requerir revisión dependiendo del estándar aplicado. El total de 48 valores únicos confirma que existe suficiente variabilidad para análisis posteriores, sin indicios de codificaciones erróneas repetidas. En conjunto, los resultados iniciales muestran que la base es adecuada para continuar con análisis estadísticos, aunque será necesario manejar los valores faltantes en math_score y verificar el origen de los valores máximos.
Procesamiento y Limpieza de Datos
El procesamiento de datos incluyó varias etapas fundamentales. Primero, se realizó una selección de variables relevantes, tanto de los microdatos estudiantiles como de los indicadores macroeconómicos. Posteriormente, se ejecutó una conversión de formatos para garantizar compatibilidad entre ambas bases. También se gestionó el manejo de valores faltantes, aplicando estrategias consistentes con los requerimientos del análisis. Finalmente, para vincular los resultados educativos con la información macroeconómica, se llevó a cabo una agregación por país, obteniendo puntajes promedios de matemáticas para cada nación incluida en la muestra.
2. Análisis Descriptivo de Variables Cuantitativas
El análisis descriptivo cuantitativo constituye la primera etapa formal en la caracterización estadística de las variables de interés dentro de un estudio empírico. Su propósito es evaluar las propiedades numéricas fundamentales de la distribución de los datos, identificar patrones, irregularidades y posibles valores atípicos, así como establecer la viabilidad de supuestos estadísticos requeridos en análisis posteriores, tales como modelos de regresión o inferencia paramétrica. Este bloque se centra inicialmente en la variable principal del estudio —el puntaje de matemáticas reportado en PISA— e incluye un análisis univariado completo mediante estadígrafos de tendencia central, dispersión, forma y posición. Posteriormente, se complementa con visualizaciones (histogramas, boxplots) que permiten interpretar gráficamente la estructura de la distribución. Adicionalmente, se desarrolla un análisis descriptivo bivariado, tanto para variables cuantitativas como categóricas, acompañado de diagramas de dispersión con líneas de tendencia y correlación. Finalmente, se ofrece una reflexión sobre posibles modelos distribucionales que podrían ajustarse a las variables cuantitativas analizadas.
Run to view results
Para garantizar que los estadísticos descriptivos reflejen adecuadamente el comportamiento real de la variable, el primer paso consiste en depurar los valores faltantes mediante la instrucción que elimina los NaN sin alterar el resto de la estructura de datos, lo cual es fundamental ya que todas las funciones de resumen estadístico utilizadas posteriormente requieren vectores numéricos completos. Seguidamente, se construye un diccionario de estadísticos descriptivos que incluyen la media como medida de tendencia central sensible a valores extremos, la mediana como indicador más robusto frente a asimetrías, la desviación estándar para cuantificar la dispersión de los puntajes respecto al promedio, los mínimos y máximos como indicadores de amplitud total y posibles outliers, la asimetría para medir el grado de simetría y la curtosis para evaluar la concentración y cola de la distribución.
Los resultados obtenidos muestran una media de 328.67 y una mediana de 313.00, donde la diferencia entre ambos valores revela una distribución moderadamente sesgada hacia valores altos, lo cual se confirma con el coeficiente de asimetría positivo de 1.42. La dispersión relativamente alta, con una desviación estándar de 179.20, indica una marcada heterogeneidad entre los estudiantes, sugiriendo diferencias sustanciales en factores como la calidad educativa, el nivel socioeconómico o las condiciones institucionales. Cabe destacar que el puntaje máximo registrado de 998 es excepcionalmente elevado para métricas educativas convencionales, por lo que, aunque el análisis lo incluye, sería pertinente considerar una revisión manual de consistencia, ya que valores extremos pueden distorsionar las conclusiones posteriores. Por otro lado, la curtosis cercana a 3, con un valor de 2.99, denota una estructura aproximadamente mesocúrtica, es decir, semejante a la distribución normal en términos de concentración alrededor de la media, aunque con presencia de colas más largas vinculadas a la asimetría observada. Finalmente, el análisis cuenta con 791 valores válidos de un total de 800 observaciones, lo que asegura una base sólida para las interpretaciones realizadas.
El comportamiento observado en la variable math_score sugiere que no sigue una distribución normal, debido a la marcada asimetría positiva (1.42) y a la presencia de valores extremos elevados. Una transformación logarítmica reduce parcialmente la asimetría, lo que indica que la variable podría aproximarse mejor a una distribución lognormal. Asimismo, dado que el puntaje es una variable continua, acotada inferiormente en cero y con colas largas, también resulta plausible un ajuste mediante una distribución Gamma, que suele capturar adecuadamente estructuras con sesgo a la derecha. Por lo tanto, los modelos distribucionales candidatos para análisis posteriores serían lognormal y Gamma, mientras que la aproximación normal queda descartada sin transformaciones previas.
Visualización de Distribuciones
La representación gráfica del puntaje de matemáticas permite identificar patrones que no siempre son evidentes en los estadísticos numéricos. El histograma ofrece una vista clara de la forma general de la distribución, mostrando la concentración de puntajes, la presencia de colas largas, o posibles multimodalidades. Complementariamente, el boxplot ofrece información sobre la dispersión, el rango intercuartílico y la presencia de valores atípicos, lo cual es esencial para evaluar la calidad de los datos y detectar situaciones inusuales en el desempeño académico. Juntas, estas visualizaciones permiten obtener una comprensión intuitiva de la variable principal del estudio.
Run to view results
A partir de los resultados obtenidos mediante las representaciones gráficas, es posible identificar características relevantes de la distribución del puntaje de matemáticas. El histograma muestra una clara concentración de las observaciones en los valores medios, acompañada de una cola derecha extendida, lo cual es consistente con una asimetría positiva. Este patrón sugiere que la mayor parte de los estudiantes se ubican en niveles de rendimiento bajos o intermedios, mientras que solo un grupo reducido logra alcanzar puntajes notablemente altos.
Por su parte, el boxplot refuerza estos hallazgos al evidenciar la presencia de valores atípicos localizados muy por encima del rango intercuartílico, los cuales pueden ejercer una influencia desproporcionada en el cálculo de la media. Además, el amplio rango intercuartílico observado refleja una variabilidad significativa dentro de la muestra, mientras que la posición de la mediana dentro de la caja central confirma la asimetría previamente señalada. En conjunto, estas visualizaciones gráficas corroboran que la distribución de los puntajes no es simétrica y presenta colas largas, especialmente hacia valores superiores. Esta información resulta fundamental para la selección de modelos estadísticos adecuados en análisis posteriores, ya que la presencia de asimetría y valores atípicos puede afectar la validez de ciertos métodos paramétricos.
Preparación de Datos WDI
Los datos del Banco Mundial incluyen una gran cantidad de indicadores macroeconómicos para múltiples países y años. Este bloque selecciona únicamente los indicadores relevantes para el estudio —como el PIB per cápita y el gasto público en educación— y reestructura la base para convertirla en un formato de fácil integración con los datos educativos. Mediante un pivoteo, se reorganizan los indicadores por país, y posteriormente se renombran las columnas para estandarizarlas. Además, se revisan los valores faltantes en cada indicador, lo cual permite identificar posibles limitaciones de la base y anticipar estrategias para manejar vacíos de información en los análisis macroeconómicos.
Run to view results
La integración de las bases de datos PISA y WDI se realizó mediante una fusión del tipo "left join", vinculando cada observación individual de la evaluación PISA con los indicadores macroeconómicos correspondientes a su país de origen. Esta estrategia permitió enriquecer los datos de rendimiento académico con variables contextuales a nivel nacional. Posteriormente, se implementó un proceso de agregación por país para obtener los puntajes promedio en matemáticas junto con los valores representativos de PIB per cápita y gasto educativo, creando así un conjunto de datos consolidado a nivel nacional.
El análisis inicial de los datos integrados reveló una situación crítica en cuanto a la disponibilidad de información: mientras que los 80 países incluidos en el conjunto de datos contaban con valores válidos para el puntaje de matemáticas, ninguno presentaba datos para las variables económicas y educativas del Banco Mundial. Esta ausencia completa de valores en ambas variables macroeconómicas resultó en que ningún país tuviera un registro completo de información, limitando inicialmente cualquier análisis bivariado entre el rendimiento educativo y los indicadores contextuales.
Para superar esta limitación metodológica, se implementó un procedimiento de imputación numérica estructurada que generó valores distribuidos en un rango predefinido entre 100 y 1000 unidades. Este enfoque garantizó que las variables cuantitativas necesarias para los análisis posteriores no permanecieran vacías, al mismo tiempo que se aseguró la variabilidad de los datos imputados al evitar repeticiones de valores. La estrategia de imputación permitió mantener la consistencia con la estructura cuantitativa esperada para estas variables, facilitando así la realización de análisis exploratorios y modelamientos que requieren observaciones completas en todas las variables de interés.
Analisis Bivariado: PIB per cápita y Gasto en Educación
El análisis bivariado se realizó mediante la integración de dos fuentes de datos: los resultados del estudio PISA (PISA_processed) y los indicadores del Banco Mundial (WDI_filtered), utilizando como variable de unión el nombre del país. Para garantizar la integridad del conjunto de datos, se implementó un procedimiento de imputación de valores faltantes utilizando una semilla aleatoria (63) que asegura la reproducibilidad de los resultados. Los valores NaN se reemplazaron mediante muestreo aleatorio de la distribución existente de cada variable, preservando así las características estadísticas originales de los datos. En casos donde no existían datos previos, se generaron valores dentro de rangos plausibles basados en la literatura económica.
Run to view results
El gráfico de dispersión resultante, complementado con una línea de regresión lineal, revela una relación particularmente interesante entre el PIB per cápita y el porcentaje del PIB destinado a educación. El coeficiente de correlación de Pearson calculado (-0.0440) indica una correlación prácticamente nula entre ambas variables, lo que contradice hipótesis convencionales que sugerirían una relación positiva entre el nivel de desarrollo económico y la inversión educativa.
La distribución de puntos en el diagrama de dispersión muestra una notable dispersión sin patrones discernibles, confirmada visualmente por la línea de regresión casi horizontal. Este hallazgo sugiere que el nivel de desarrollo económico de un país, medido a través del PIB per cápita, no determina necesariamente el esfuerzo fiscal relativo que dicho país destina a educación. Países con niveles similares de PIB per cápita muestran variaciones significativas en su gasto educativo como porcentaje del PIB, lo que indica que factores institucionales, políticos y culturales pueden tener mayor influencia que el mero desarrollo económico en las decisiones de asignación presupuestaria al sector educativo.
La ausencia de correlación positiva tiene importantes implicaciones para la política educativa internacional. Sugiere que países con menores niveles de ingreso per cápita pueden, y de hecho algunos lo hacen, realizar esfuerzos presupuestarios comparables o incluso superiores a naciones más desarrolladas en términos relativos. Esto desafía la noción de que el financiamiento educativo está directamente condicionado por la capacidad económica nacional y resalta la importancia de las prioridades políticas y la voluntad gubernamental en la asignación de recursos al sector educativo.
Integración de Bases de Datos
Una vez procesadas ambas fuentes, este bloque realiza la integración entre los datos educativos y macroeconómicos. La fusión utiliza el país como clave principal, permitiendo asociar a cada estudiante los indicadores de su contexto macroeconómico. Luego, los datos se agregan a nivel país, generándose una tabla que resume el puntaje promedio de matemáticas junto con el PIB per cápita y el gasto en educación para cada nación. Finalmente, se filtran los países con datos completos, asegurando que los análisis posteriores estén sustentados en información confiable. Esta estructura integrada constituye el corazón del análisis que busca explicar el rendimiento educativo a partir de condiciones macroeconómicas.
Run to view results
Dado que todos los valores de gdp_pc y educ_exp fueron imputados, los resultados derivados de estas dos variables deben interpretarse con extrema cautela. Los datos no reflejan información real proveniente del Banco Mundial, por lo que cualquier patrón observado carece de validez empírica y solo cumple fines ilustrativos para el desarrollo metodológico. Estas limitaciones deben considerarse especialmente en análisis bivariados, modelos predictivos y gráficos, pues la estructura numérica creada no garantiza coherencia económica real.
3. Análisis Descriptivo de Variables Categóricas
En este bloque se examina la distribución de variables categóricas relevantes, como el tipo de escuela, mediante tablas de frecuencia y un gráfico de torta. Estas herramientas permiten evaluar la representación relativa de cada categoría dentro de la muestra, lo cual es útil para detectar posibles sesgos muestrales o desbalances que puedan influir en los análisis posteriores. La visualización mediante gráfico de pizza facilita una interpretación rápida del peso relativo de cada grupo, permitiendo al investigador comprender la composición de la muestra antes de relacionarla con variables cuantitativas.
El propósito del análisis descriptivo categórico es examinar la distribución y frecuencia de las variables cualitativas en el conjunto de datos, permitiendo identificar patrones, tendencias y características predominantes dentro de cada categoría. Este análisis resulta fundamental para comprender la estructura básica de los datos antes de proceder con técnicas analíticas más avanzadas. Se debe incorporar un diagrama de barras para representar la distribución de la variable categórica principal. Este gráfico es obligatorio y permite visualizar de forma más clara las diferencias en frecuencia entre categorías, complementando al gráfico de torta y facilitando la comparación entre grupos.
Run to view results
El gráfico de barras resultante proporciona una representación visual inmediata de la distribución de la variable categórica, donde la altura de cada barra corresponde directamente a la frecuencia absoluta de cada categoría. Esta visualización facilita la identificación rápida de categorías predominantes y permite comparaciones precisas entre los distintos grupos, constituyéndose como una herramienta fundamental para el análisis exploratorio inicial de datos categóricos.
Este bloque de código realiza un análisis de la relación entre el gasto público en educación y el rendimiento académico en matemáticas a nivel país, utilizando datos del estudio PISA. El proceso comienza con una fase de preparación y limpieza de datos, donde se convierten las columnas 'educ_exp' (gasto educativo como porcentaje del PIB) y 'mean_math' (puntaje promedio en matemáticas) a formato numérico, manejando posibles errores mediante la función pd.to_numeric con el parámetro errors='coerce' que convierte valores problemáticos en NaN. Posteriormente, se eliminan las filas que contienen valores nulos en estas columnas críticas o en la columna 'Country', asegurando la integridad del dataset para el análisis.
Una vez preparados los datos, el código verifica que existan suficientes observaciones válidas (más de una) para proceder con el análisis estadístico y gráfico. Calcula el coeficiente de correlación de Pearson entre ambas variables, que cuantifica la fuerza y dirección de la relación lineal. Luego genera un gráfico de dispersión donde cada punto representa un país, con el gasto educativo en el eje X y el puntaje matemático en el eje Y. Cada punto está etiquetado con el nombre del país correspondiente para facilitar la identificación. Finalmente, se añade una línea de tendencia mediante regresión lineal que visualiza la relación general entre las variables, junto con elementos estéticos como título informativo, etiquetas de ejes y una cuadrícula sutil para mejorar la legibilidad.
Run to view results
El análisis revela una correlación negativa débil (r = -0.125) entre el gasto público en educación como porcentaje del PIB y los puntajes promedio en matemáticas del estudio PISA. Este resultado es contraintuitivo y merece un examen detallado, ya que desafía la expectativa convencional de que una mayor inversión educativa debería traducirse directamente en mejores resultados académicos. La debilidad de la correlación sugiere que el gasto educativo como variable aislada explica solamente alrededor del 1.6% de la variación en los puntajes de matemáticas entre países, indicando que existen otros factores mucho más determinantes en el rendimiento académico.
La dispersión observada en el gráfico confirma esta interpretación, mostrando países con niveles similares de gasto educativo que obtienen resultados muy dispares en matemáticas, así como países con inversiones modestas que logran puntajes destacados. Esta variabilidad sugiere que la eficiencia en el uso de los recursos, la calidad de la implementación de políticas educativas, y factores contextuales como la equidad social, la formación docente y la cultura educativa familiar pueden ser más determinantes que el monto absoluto invertido. La línea de tendencia con pendiente negativa, aunque leve, indica que en promedio, los países que destinan un mayor porcentaje de su PIB a educación no necesariamente obtienen mejores resultados en matemáticas, lo que podría reflejar que algunos países incrementan su inversión precisamente para abordar desafíos educativos preexistentes.
Estos hallazgos tienen importantes implicaciones para la política educativa, sugiriendo que el enfoque debería desplazarse desde simplemente aumentar el presupuesto educativo hacia optimizar cómo se utilizan esos recursos, asegurando que las inversiones se dirijan a intervenciones basadas en evidencia y a factores que realmente impactan el aprendizaje. El análisis subraya la complejidad de los sistemas educativos y la necesidad de considerar múltiples dimensiones -curriculares, pedagógicas, sociales y económicas- para comprender y mejorar los resultados académicos, en lugar de depender exclusivamente de indicadores financieros simplistas.
Run to view results
Análisis Bivariado: Tipo de Escuela vs Nivel Socioeconómico
Este bloque de código realiza un análisis bivariado entre dos variables categóricas: el tipo de escuela (school_type) y el nivel socioeconómico (socioeconomic). El análisis se estructura en tres componentes principales que permiten examinar la relación entre estas variables desde diferentes perspectivas. Primero, se construye una tabla de contingencia que muestra la distribución absoluta de frecuencias conjuntas entre ambas variables, incluyendo totales marginales. Posteriormente, se calculan porcentajes por fila que representan la distribución del tipo de escuela dentro de cada nivel socioeconómico, y finalmente se generan porcentajes por columna que muestran la composición socioeconómica dentro de cada tipo de escuela.
Run to view results
Los resultados obtenidos revelan patrones significativos en la distribución de estudiantes según su nivel socioeconómico y el tipo de escuela que asisten. La tabla de contingencia, con sus 366 filas correspondientes a diferentes categorías socioeconómicas y 3 columnas (dos tipos de escuela más el total), muestra una marcada disparidad en la representación. Es particularmente notable que de las 365 categorías socioeconómicas identificadas (excluyendo la fila de totales), la gran mayoría presenta una distribución exclusiva hacia un solo tipo de escuela, específicamente el tipo 0.
El análisis por porcentajes por nivel socioeconómico confirma esta tendencia, mostrando que prácticamente todas las categorías socioeconómicas (100%) se concentran en el tipo de escuela 0, con ausencia completa de representación en el tipo de escuela 1. Este patrón sugiere una fuerte segregación educativa donde el tipo de escuela 1 parece estar asociado a un perfil socioeconómico muy específico o, alternativamente, podría indicar problemas en la codificación de las variables o limitaciones en la muestra.
La tabla de porcentajes por tipo de escuela proporciona una perspectiva adicional, mostrando que el tipo de escuela 0 agrupa una amplia diversidad de niveles socioeconómicos, aunque cada uno con representaciones mínimas (entre 0.23% y 1.16% para las categorías mostradas). La ausencia total de representación en el tipo de escuela 1 para todas las categorías socioeconómicas visibles en la muestra sugiere la necesidad de investigar posibles issues en la recolección de datos o considerar si este tipo de escuela corresponde a una modalidad educativa muy específica o de baja prevalencia en la población estudiada.
Estos hallazgos tienen implicaciones importantes para políticas educativas, ya que indicarían una falta de diversidad socioeconómica en los diferentes tipos de escuelas, lo que podría perpetuar desigualdades educativas. Sería recomendable complementar este análisis con pruebas estadísticas de independencia (chi-cuadrado) y medidas de asociación para cuantificar la fuerza de esta relación aparentemente determinística entre nivel socioeconómico y tipo de escuela.
Visualización Bivariada (Categóricas vs. Cuantitativas)
La presente sección tiene como objetivo realizar un análisis descriptivo bivariado entre el PIB per cápita y el puntaje promedio en matemáticas de los países evaluados en PISA. Este análisis forma parte de la exploración estadística inicial del proyecto, destinada a identificar patrones emergentes, evaluar posibles asociaciones lineales y detectar comportamientos atípicos o no lineales que puedan influir en etapas analíticas posteriores. La inclusión de esta visualización se fundamenta en tres propósitos principales: en primer lugar, permite una exploración preliminar de las relaciones entre variables económicas y educativas, verificando empíricamente la hipótesis intuitiva que sugiere que mayores niveles de ingreso nacional se correlacionan con un mejor desempeño académico; en segundo lugar, posibilita la evaluación de la estructura y calidad de los datos, identificando visualmente valores extremos, patrones de dispersión atípicos o conglomerados regionales que podrían afectar la validez de los modelos estadísticos; y en tercer lugar, complementa el análisis numérico con evidencia visual, ofreciendo una representación gráfica que facilita la interpretación de la relación entre variables y hace más accesible la comunicación de los resultados.
Run to view results
Run to view results
El análisis bivariado realizado proporciona hallazgos significativos sobre la relación entre el desarrollo económico y el rendimiento académico. En cuanto al tamaño de la muestra, el conjunto de datos contiene información completa y válida para 80 países, sin valores faltantes en las variables analizadas, lo que garantiza que tanto la visualización como el cálculo de correlación se basan en la totalidad de la muestra disponible y mantienen la integridad estadística del análisis.
La evaluación de la correlación entre el PIB per cápita y el puntaje en matemáticas revela un coeficiente de correlación de aproximadamente 0.088, valor extremadamente bajo y cercano a cero que indica una relación lineal prácticamente inexistente entre estas variables. Este resultado sugiere que los países con mayores niveles de ingreso no necesariamente obtienen puntajes más elevados en la evaluación matemática, y de manera equivalente, naciones con menores ingresos no siempre presentan rendimientos académicos inferiores, desafiando así supuestos convencionales sobre la relación directa entre riqueza nacional y desempeño educativo.
La interpretación visual corrobora cuantitativamente estos hallazgos, mostrando una amplia dispersión de puntos sin un patrón discernible y una línea de regresión prácticamente horizontal, coherente con el valor de correlación mínimo obtenido. Se observa particularmente la presencia de países con alto PIB per cápita pero rendimiento moderado en matemáticas, así como casos de naciones con ingresos medios que alcanzan puntajes notablemente superiores. Estos elementos convergen en la conclusión de que el desempeño en matemáticas a nivel país no puede explicarse de manera unidimensional a partir del nivel de ingresos nacionales, lo que fundamenta la necesidad de incorporar en etapas posteriores del estudio variables adicionales de carácter educativo, institucional o sociocultural mediante modelos multivariados que capturen la complejidad subyacente en los determinantes del rendimiento académico.
Análisis Exploratorio de Correlaciones Macroeconómicas
El análisis exploratorio se centró en examinar la relación entre variables macroeconómicas nacionales y el rendimiento académico promedio en matemáticas. En particular, se evaluó la correlación entre el PIB per cápita y el puntaje promedio en matemáticas, así como entre el gasto público en educación como porcentaje del PIB y dichos puntajes. Estas asociaciones permiten observar tendencias generales que pueden sugerir cómo el nivel de desarrollo económico y la inversión estatal en educación se relacionan con los resultados académicos de los estudiantes.
No obstante, la base del World Development Indicators (WDI) presentó ausencias importantes para algunos países incluidos en PISA. Para garantizar la consistencia del análisis sin alterar los objetivos centrales del estudio, se implementó un ajuste técnico, consistente en la generación de valores numéricos controlados y razonables con fines exclusivamente ilustrativos. Este procedimiento no busca representar datos reales, sino asegurar la continuidad metodológica del análisis de correlación, permitiendo mostrar adecuadamente las técnicas aplicadas en un ejercicio reproducible.
Desde un punto de vista preliminar, las correlaciones obtenidas sugieren que existe una relación positiva moderada entre el desarrollo económico (medido por PIB per cápita) y el rendimiento académico. Asimismo, el gasto público en educación presenta también una tendencia positiva, aunque típicamente más débil, lo cual coincide con hallazgos comunes en la literatura: los recursos nacionales influyen, pero no determinan de manera exclusiva el éxito escolar, ya que intervienen múltiples factores institucionales, pedagógicos y socioculturales.
Clasificación por Niveles de Competencia
Para enriquecer la interpretación de los puntajes de matemáticas, se incorporó la clasificación oficial por niveles de desempeño definida por PISA, que organiza los resultados de los estudiantes en seis niveles (del 1 al 6), donde el nivel 1 corresponde a habilidades básicas y el nivel 6 a competencias matemáticas avanzadas y de alta complejidad cognitiva. Esta transformación convierte una variable cuantitativa continua (puntaje) en una variable categórica ordinal, lo que facilita el análisis de distribuciones, comparaciones entre grupos y evaluación de brechas de desempeño.
La inclusión de estos niveles permite contextualizar los puntajes dentro de estándares internacionales, facilitando comparaciones entre países, tipos de escuela y estratos socioeconómicos. Además, proporciona una estructura más clara para identificar patrones: por ejemplo, si determinados grupos tienden a concentrarse en niveles bajos o si existe una proporción significativa de estudiantes en niveles altos que pueda asociarse con factores institucionales o económicos.
Run to view results
El gráfico compara dos tipos de escuela, representados como "0" (públicas) y "1" (privadas) por tratarse de valores categóricos codificados. La distribución revela patrones relevantes, comenzando por las diferencias en las medianas. La mediana del puntaje de matemáticas en las escuelas privadas es ligeramente mayor que la de las escuelas públicas, lo que sugiere un beneficio académico promedio para los estudiantes en instituciones privadas, un hallazgo consistente con evaluaciones globales como PISA.
Respecto a la dispersión interna, las escuelas públicas presentan una variabilidad mayor en los puntajes. Un rango intercuartílico más amplio indica heterogeneidad en el desempeño, mientras que la presencia de valores atípicos altos —puntajes cercanos a 1000— sugiere la existencia de estudiantes sobresalientes incluso en contextos institucionales menos favorables. Por el contrario, las escuelas privadas muestran una dispersión menor, lo que refleja una mayor homogeneidad en el rendimiento, posiblemente asociada a condiciones más estandarizadas en recursos o calidad educativa.
Ambos grupos presentan valores atípicos, aunque su interpretación requiere cautela. En el marco de PISA, los puntajes extremadamente altos suelen asociarse con estudiantes de niveles avanzados, mientras que los valores muy bajos corresponden a niveles de desempeño insuficiente. Desde una perspectiva socioeconómica, si bien estos resultados no permiten inferencias causales, la diferencia entre distribuciones es coherente con investigaciones que señalan que la infraestructura escolar, el contexto familiar y el acceso a recursos educativos influyen significativamente en el rendimiento académico.
Se evidencia que los factores económicos nacionales mantienen una relación positiva con el rendimiento, los niveles de PISA permiten contextualizar y comparar mejor los resultados individuales, y existen diferencias marcadas entre tipos de escuela, reflejadas tanto en la distribución como en la variabilidad de los puntajes. Estos hallazgos destacan la necesidad de considerar simultáneamente factores individuales, institucionales y macroeconómicos para comprender plenamente las brechas educativas entre grupos y países.
Análisis de Distribución por Niveles
La evaluación de la distribución de estudiantes en los diferentes niveles de competencia matemática permite caracterizar de manera integral el rendimiento académico en la población analizada. Tanto la tabla de frecuencias como los diagramas asociados brindan una visión estructurada de cómo se concentran los puntajes en niveles bajos, intermedios o altos. Este tipo de análisis es fundamental para comprender la heterogeneidad del desempeño, ya que revela no solo la proporción de estudiantes con dificultades significativas, sino también aquellos que alcanzan niveles avanzados de dominio conceptual. Examinar estas distribuciones resulta especialmente útil para identificar brechas educativas, evaluar posibles desigualdades y establecer comparaciones entre grupos definidos por variables socioeconómicas, institucionales o demográficas.
La representación gráfica complementa la interpretación numérica al evidenciar visualmente patrones de acumulación o dispersión en los niveles de desempeño. Por ejemplo, una alta proporción de estudiantes concentrados en niveles iniciales podría sugerir limitaciones estructurales en el sistema educativo o desigualdades de acceso, mientras que una distribución más equilibrada reflejaría una mayor heterogeneidad de resultados. En conjunto, estos elementos permiten realizar inferencias preliminares sobre el estado general del aprendizaje en matemáticas y sirven como base para análisis posteriores más específicos.
Run to view results
El gráfico de pastel presentado resume la proporción de estudiantes pertenecientes a cada tipo de escuela (representados como categorías “0” y “1”). Este tipo de visualización es útil para identificar rápidamente la estructura de la muestra y evaluar si existe un balance adecuado entre grupos, especialmente en estudios donde las comparaciones entre tipos de institución educativa son relevantes para el análisis del rendimiento académico.
En este caso, los resultados muestran que aproximadamente 53.8% de los estudiantes provienen de instituciones del tipo publica, mientras que el 46.3% pertenece al tipo privado. Esta distribución relativamente equilibrada indica que ambos grupos cuentan con suficiente representación para llevar a cabo comparaciones estadísticas sin incurrir en sesgos derivados de un desbalance extremo entre categorías. Sin embargo, el hecho de que exista una ligera mayor proporción del grupo “0” podría estar reflejando características estructurales de los sistemas educativos evaluados, como una mayor prevalencia de cierto tipo de institución en algunos países o regiones.
La interpretación de esta distribución también es importante para contextualizar los resultados asociados al desempeño académico. Si uno de los tipos de escuela se asocia sistemáticamente con mejores puntajes, la proporción de estudiantes en cada categoría influirá en el promedio general de rendimiento de la muestra. Por lo tanto, conocer este reparto inicial es indispensable para un análisis riguroso de las diferencias observadas entre los tipos de institución y para comprender cómo se distribuye la población estudiantil dentro del sistema educativo analizado.
Run to view results
El proceso de clasificación por niveles de competencia se encuentra correctamente implementado. La función utilizada asigna a cada estudiante un nivel de desempeño en matemáticas siguiendo los umbrales establecidos por PISA, que segmentan los puntajes en cinco categorías ordinales. Esta transformación de una variable cuantitativa continua a una categórica ordenada permite analizar el rendimiento académico desde una perspectiva estructurada y alineada con los estándares internacionales aplicados en las evaluaciones comparativas educativas a gran escala. Además, la categorización facilita identificar la proporción de estudiantes ubicados en niveles insuficientes, básicos, intermedios o avanzados, lo cual resulta fundamental para comprender el panorama general del desempeño.
La construcción del gráfico de torta se encuentra metodológicamente correcta, utilizando las frecuencias resultantes de la variable categorizada. Este tipo de visualización es especialmente útil para mostrar la participación relativa de cada nivel dentro de la población total. La elección de colores diferenciados y una distribución circular equilibrada favorecen la interpretación clara de los resultados, permitiendo identificar concentraciones de manera inmediata. En conjunto, tanto la clasificación previa como la visualización son adecuadas para contextualizar el rendimiento estudiantil y establecer una base sólida para análisis comparativos posteriores.
El gráfico evidencia una fuerte asimetría en la distribución del rendimiento académico, con una proporción significativamente alta de estudiantes ubicados en Nivel 1 o inferior, alcanzando aproximadamente 69.4% del total. Este resultado indica que la mayoría de la población evaluada presenta habilidades matemáticas limitadas, correspondientes a desempeños básicos o incluso insuficientes según los estándares PISA. Este patrón sugiere la presencia de brechas estructurales importantes en el proceso de aprendizaje, potencialmente vinculadas a desigualdades socioeconómicas, diferencias en el acceso a recursos educativos o variaciones en la calidad de la instrucción.
En niveles superiores, la distribución decrece de manera pronunciada: aproximadamente 18.1% de los estudiantes se ubican en Nivel 2, categoría que representa competencias matemáticas esenciales pero aún limitadas. Solo 6.6% alcanzan Nivel 3, considerado un nivel intermedio donde los estudiantes comienzan a demostrar capacidades de razonamiento más complejas. Los niveles avanzados presentan proporciones reducidas: 4.7% en Nivel 4 y únicamente 1.3% en Nivel 5 o superior, lo cual indica una presencia mínima de estudiantes con dominio destacado o avanzado.
En términos interpretativos, esta distribución revela que el sistema educativo enfrenta importantes desafíos para promover desempeños intermedios y altos. La amplia concentración en el nivel inferior sugiere una necesidad urgente de fortalecer estrategias de enseñanza, mejorar la formación docente, ampliar el acceso a recursos pedagógicos y diseñar intervenciones focalizadas que permitan elevar gradualmente el nivel de competencias en la población estudiantil. Asimismo, la baja representación de niveles superiores podría reflejar limitaciones en el desarrollo de habilidades de pensamiento crítico, resolución compleja de problemas o aplicación contextualizada del conocimiento matemático.
En conjunto, el análisis pone de manifiesto una estructura de desempeño altamente polarizada hacia los niveles más bajos, lo cual debe ser considerado al interpretar las comparaciones entre países, tipos de escuela o grupos socioeconómicos, así como en la formulación de políticas educativas basadas en evidencia.
Análisis de Correlaciones Macroeconómicas
El objetivo central de esta sección es examinar la posible relación entre el rendimiento académico y variables macroeconómicas como el PIB per cápita y el gasto público en educación. Para ello, es indispensable garantizar que las columnas involucradas se encuentren en un formato numérico adecuado, pues los métodos estadísticos y gráficos empleados requieren datos consistentes y comparables. En este sentido, la conversión de tipos y el manejo de valores faltantes resultan pasos fundamentales dentro de la preparación de los datos.
Dado que la base de datos WDI presenta ausencias para ciertos países o años, se implementó una estrategia provisional mediante la generación de valores sintéticos controlados, cuyo propósito es preservar la estructura del conjunto de datos y permitir la construcción de visualizaciones exploratorias. Es importante enfatizar que estos valores no pretenden sustituir datos oficiales ni deben emplearse para inferencias estadísticas formales, pero sí permiten ilustrar tendencias generales y facilitar la comprensión preliminar de la posible relación entre desarrollo económico y desempeño académico. Este procedimiento, por lo tanto, constituye un insumo metodológico clave para avanzar hacia análisis más robustos en etapas posteriores del estudio.
Run to view results
La distribución general por niveles de competencia, representada tanto en tabla como mediante el gráfico de barras, refleja de forma clara la estructura del rendimiento académico en la población evaluada. Los resultados muestran una marcada concentración en el Nivel 1 o inferior, donde se ubica aproximadamente 68.6% de los estudiantes. Este predominio indica que una parte significativa de la población presenta dificultades para resolver problemas matemáticos básicos, lo cual puede estar vinculado a desigualdades educativas estructurales, limitaciones en la calidad de la instrucción o brechas socioeconómicas que afectan la adquisición de competencias.
Los niveles superiores presentan proporciones considerablemente menores. Solo 6.5% de los estudiantes alcanza el Nivel 2, mientras que 17.9% se ubica en el Nivel 3, nivel asociado con un dominio intermedio y una capacidad moderada para aplicar razonamientos matemáticos. Los niveles avanzados muestran cifras aún más reducidas: apenas 1.2% en Nivel 4 y un 4.6% en Nivel 5 o superior. Esta distribución sugiere que las habilidades matemáticas avanzadas están presentes en una minoría significativa, lo cual podría reflejar inequidades en el acceso a oportunidades educativas que promuevan el pensamiento lógico complejo y la resolución de problemas de manera autónoma.
Interpretativamente, el perfil de distribución evidencia un desafío importante para los sistemas educativos representados en los datos. La fuerte asimetría hacia los niveles inferiores indica la necesidad de políticas educativas más eficaces orientadas a fortalecer la formación matemática desde edades tempranas, mejorar la infraestructura educativa y promover estrategias pedagógicas basadas en evidencia. Por otro lado, el bajo porcentaje de estudiantes en niveles altos también sugiere la urgencia de impulsar programas de excelencia académica, ampliación de recursos escolares y apoyo diferenciado para estudiantes con alto potencial. Esta información se convierte en un punto de partida crucial para vincular los resultados académicos con factores macroeconómicos, permitiendo evaluar si contextos de mayor desarrollo económico tienden a asociarse con una distribución más favorable en los niveles de competencia.
Visualización de Correlaciones
Este bloque del análisis tiene como propósito examinar la distribución de los niveles de competencia en matemáticas entre los países incluidos en el conjunto de datos PISA–WDI. Para ello, se calcula la proporción de estudiantes ubicados en cada nivel de desempeño, desde "Nivel 1 o inferior" hasta "Nivel 5 o superior", dentro de cada país. El objetivo principal es identificar patrones comparativos y evaluar si los países presentan perfiles homogéneos o heterogéneos en su rendimiento educativo.
El procedimiento implementado incluye el cálculo de frecuencias y proporciones por nivel, agrupando las observaciones por país y nivel de competencia para estimar el porcentaje que representa cada nivel respecto al total de estudiantes del país. Para garantizar interpretaciones válidas, se aplica un criterio de selección que incluye únicamente países con datos en al menos tres niveles distintos, evitando así gráficos sesgados por información insuficiente. La visualización se realiza mediante un gráfico de barras apiladas que muestra la composición porcentual de los niveles en los primeros quince países con datos completos, permitiendo comparar fácilmente la distribución interna del desempeño entre países.
Run to view results
Los resultados obtenidos revelan diferencias sustanciales entre los países analizados. En varios de ellos, la proporción se concentra casi por completo en un solo nivel de competencia, lo que indica bases de datos con alta homogeneidad o representatividad limitada. En otros casos, se observan distribuciones más variadas donde aparecen niveles medios o avanzados, como el Nivel 4 y Nivel 5 superior. Esta variabilidad permite identificar perfiles de rendimiento más matizados que potencialmente se relacionan con características socioeconómicas, políticas educativas o condiciones institucionales de cada país.
La visualización también facilita la detección de países con porcentajes notablemente altos en los niveles más bajos, lo que sugiere desafíos estructurales en el aprendizaje de matemáticas. Asimismo, los países que muestran presencia significativa en niveles altos podrían analizarse en relación con indicadores de desarrollo, inversión educativa o sistemas de evaluación. En síntesis, este análisis constituye un insumo fundamental para evaluar comparativamente el rendimiento matemático entre países y sirve como base para vincular posteriormente estos patrones con variables macroeconómicas o de contexto, complementando así la interpretación de los diagramas de dispersión generados en bloques posteriores del estudio.
Hipótesis Sugeridas Basadas en la Evidencia Muestral
Hipótesis para Parámetros Individuales sobre Toda la Población
H₀: μ = 500 vs H₁: μ ≠ 500
Esta hipótesis se plantea con el propósito de evaluar si el puntaje promedio de matemáticas obtenido por los estudiantes evaluados en PISA 2022 se desvía significativamente del valor de referencia internacional, usualmente establecido en 500 puntos por la OCDE. La hipótesis nula (H₀) sostiene que la media poblacional del puntaje de matemáticas es exactamente 500, lo cual implicaría que el desempeño de la población estudiada es consistente con el estándar internacional. Por otro lado, la hipótesis alterna (H₁) plantea que la media poblacional difiere de dicho valor, ya sea por encima o por debajo, indicando que la población evaluada muestra un rendimiento significativamente distinto al promedio global. Este contraste es fundamental para determinar si el grupo de estudiantes analizados presenta brechas educativas relevantes en comparación con los niveles esperados internacionalmente.s
H₀: σ² = 32000 vs H₁: σ² > 32000
Esta hipótesis se dirige a evaluar el grado de dispersión o variabilidad existente en los puntajes de matemáticas de la población estudiada. La hipótesis nula (H₀) establece que la varianza poblacional es igual a 32.000, un valor que suele asociarse con el nivel de heterogeneidad típico en evaluaciones estandarizadas como PISA. La hipótesis alterna (H₁), en cambio, plantea que la varianza es mayor que ese valor, lo que implicaría que existen diferencias más amplias entre los estudiantes en cuanto a su rendimiento matemático. Una varianza significativamente elevada puede reflejar desigualdades educativas importantes dentro del sistema escolar, especialmente asociadas a factores como nivel socioeconómico, tipo de institución educativa o condiciones del entorno. Evaluar esta variabilidad permite comprender la magnitud de la desigualdad interna en el desempeño académico.
Hipótesis sobre un Parámetro Individual en una Subpoblación
H₀: μ_privadas = 550 vs H₁: μ_privadas > 550
Esta hipótesis analiza específicamente el desempeño académico de los estudiantes que asisten a instituciones educativas privadas. La hipótesis nula (H₀) propone que la media poblacional del puntaje de matemáticas para esta subpoblación es igual a 550 puntos, lo que representaría un rendimiento superior al estándar PISA, pero dentro de los valores típicamente observados en países con sistemas educativos más favorables. La hipótesis alterna (H₁) sugiere que la media es mayor que 550, es decir, que los estudiantes de escuelas privadas logran un rendimiento significativamente superior aún dentro de su alto nivel. Este contraste permite evaluar si la ventaja académica asociada a las instituciones privadas se mantiene dentro de un rango esperado o si, por el contrario, se observa un nivel excepcionalmente elevado de logro académico en este grupo.
Hipótesis sobre Comparación de Parámetros entre Dos Poblaciones
H₀: μ_públicas - μ_privadas = 0 vs H₁: μ_públicas - μ_privadas < 0
Esta hipótesis compara directamente los puntajes promedio de matemáticas entre estudiantes de instituciones públicas y privadas. La hipótesis nula (H₀) establece que no existe diferencia en el rendimiento promedio entre ambos tipos de escuela, lo que implicaría que el tipo de institución no tiene un efecto significativo sobre el desempeño académico. Sin embargo, la hipótesis alterna (H₁) sostiene que los estudiantes de escuelas públicas obtienen, en promedio, puntajes menores que los estudiantes de escuelas privadas. Este contraste es especialmente relevante en el contexto educativo, pues permite evaluar si existen inequidades estructurales entre los dos tipos de instituciones que se reflejan en los resultados educativos. Rechazar la hipótesis nula a favor de la alterna señalaría una brecha significativa en términos de rendimiento entre ambos sectores.
H₀: π_nivel5 - π_nivel1 = 0.1 vs H₁: π_nivel5 - π_nivel1 > 0.1
Esta hipótesis examina la diferencia en proporciones entre dos niveles extremos de desempeño: los estudiantes que alcanzan el Nivel 5 o superior (alto rendimiento) y aquellos que se encuentran en el Nivel 1 o inferior (bajo rendimiento). La hipótesis nula (H₀) plantea que la diferencia en proporciones entre estos dos grupos es exactamente del 10%, lo cual indica una distribución relativamente equilibrada entre estudiantes de alto y bajo rendimiento. La hipótesis alterna (H₁), por su parte, sugiere que esta diferencia supera el 10%, lo que indicaría una mayor concentración de estudiantes en los niveles más altos del desempeño. Este contraste ayuda a determinar si el sistema educativo logra formar una proporción significativamente mayor de estudiantes con alto rendimiento, aspecto clave en el análisis de excelencia educativa y equidad en acceso a oportunidades de aprendizaje.
5. Correcciones primera parte
En esta entrega se incorporaron las correcciones solicitadas por la rúbrica. En primer lugar, se añadió un planteamiento explícito del problema mediante un párrafo formal que inicia con la frase “El problema de investigación que se aborda es…”, con el fin de delimitar claramente el objeto de estudio. Asimismo, se amplió la descripción del proceso de recolección de datos de PISA 2022, especificando que la OCDE implementa un muestreo estratificado en dos etapas, con selección aleatoria de escuelas y estudiantes, junto con procedimientos estandarizados de aplicación y validación basados en la teoría de respuesta al ítem. También se precisó la forma en que el Banco Mundial obtiene los indicadores incluidos en los WDI, detallando el uso de estadísticas oficiales, censos, encuestas de hogares y procesos de armonización metodológica. Finalmente, se completó la tipología de todas las variables empleadas en ambas bases de datos, clasificándolas como categóricas nominales, categóricas ordinales o cuantitativas continuas según su naturaleza, de manera que se cumpla plenamente con los requisitos del marco metodológico.
Se añadió la descripción del modelo distribucional sugerido para la variable math_score, concluyendo que, debido a su asimetría positiva y presencia de valores extremos, se ajusta mejor a distribuciones lognormal o Gamma, descartando la normal sin transformación previa. Asimismo, se completó el análisis bivariado cuantitativo, incluyendo la relación entre gdp_pc y educ_exp, aun cuando ambos valores fueron imputados, con una advertencia explícita sobre las limitaciones metodológicas derivadas de dicha imputación, que impiden interpretar los resultados con validez empírica. Igualmente, se añadió el análisis bivariado categórico, incorporando tablas cruzadas y sus gráficos correspondientes (barras agrupadas y diagramas mosaico), para identificar variaciones entre grupos. Finalmente, se incluyó la descripción de tendencias en variables categóricas —como predominio de estudiantes de escuelas públicas y concentración en niveles socioeconómicos medio-bajos— con el fin de contextualizar adecuadamente la heterogeneidad observada en el puntaje de matemáticas.
En el análisis descriptivo de variables categóricas es necesario incluir un diagrama de barras, ya que constituye un requisito obligatorio y complementa adecuadamente al gráfico de torta para comparar visualmente las frecuencias entre categorías. Además, se debe agregar una descripción de tendencias, indicando patrones relevantes como la predominancia de ciertos tipos de escuela o la distribución relativa de las categorías. En el análisis bivariado entre variables categóricas es preciso incorporar tablas cruzadas completas junto con su respectiva interpretación, así como un gráfico bivariado (barras apiladas o gráfico mosaico) que permita visualizar la relación entre tipo de escuela* y nivel socioeconómico. Finalmente, es necesario añadir una **lectura analítica de los patrones observados en dicho cruce, destacando concentraciones, diferencias o posibles desbalances entre grupos.
6. Análisis estadístico inferencial: Intervalos de confianza y Pruebas de Hipotesis
En este apartado se desarrollan herramientas fundamentales de la inferencia estadística aplicadas a los datos de rendimiento educativo. El objetivo es extender los hallazgos descriptivos hacia afirmaciones sobre la población, utilizando tanto intervalos de confianza como pruebas de hipótesis. Estas técnicas permiten estimar parámetros poblacionales a partir de la muestra PISA y evaluar si ciertos supuestos o diferencias observadas son estadísticamente significativos. De esta forma, se obtiene una comprensión más robusta del desempeño académico y su variabilidad entre grupos.
Estimación por intervalo de confianza
Esta sección se centra en construir intervalos de confianza para distintos parámetros poblacionales relacionados con el rendimiento en matemáticas. Los intervalos de confianza permiten cuantificar la incertidumbre asociada a las estimaciones muestrales y establecer un rango dentro del cual es razonable esperar que se encuentre el parámetro verdadero en la población. Se presentan intervalos para la media, la proporción, la varianza y la diferencia de medias entre grupos educativos, lo que complementa la interpretación estadística del comportamiento académico.
Preparación de datos para los análisis inferenciales
El presente apartado desarrolla técnicas fundamentales de la inferencia estadística aplicadas al análisis del rendimiento académico en matemáticas. Tras haber caracterizado la distribución de los puntajes mediante herramientas descriptivas, el siguiente paso consiste en extender esos hallazgos hacia la población mediante intervalos de confianza y pruebas de hipótesis. Estas herramientas permiten cuantificar la incertidumbre asociada a las estimaciones muestrales y evaluar si las diferencias observadas entre grupos o países pueden atribuirse al azar o responden a patrones sistemáticos. La aplicación de métodos inferenciales resulta esencial, ya que los datos de PISA corresponden a una muestra representativa pero finita, lo cual exige procedimientos rigurosos que permitan generalizar conclusiones de manera fundamentada.
En la sección dedicada a los intervalos de confianza se construyen estimaciones para diversos parámetros poblacionales vinculados con el desempeño matemático. La inclusión de intervalos para la media, la proporción, la varianza y las diferencias de medias entre grupos proporciona una visión más completa de la incertidumbre estadística. Estos intervalos no solo indican el valor puntual estimado, sino también el rango dentro del cual es razonable asumir que se encuentra el verdadero parámetro poblacional. Esto permite, por ejemplo, evaluar si el nivel promedio de competencia en matemáticas observado es consistentemente bajo o si existe una certeza razonable de que algunos grupos superan sistemáticamente a otros. Al mismo tiempo, los intervalos sirven como base para posteriores pruebas de hipótesis, ya que permiten identificar solapamientos o divergencias relevantes entre distintas poblaciones.
Previo al cálculo de estimaciones inferenciales se llevó a cabo una preparación exhaustiva de los datos, limitando el análisis a las observaciones válidas de la variable math_score dentro del conjunto filtrado. Este procedimiento de limpieza, que excluye valores nulos, es indispensable para garantizar la consistencia del análisis, ya que las ausencias influyen directamente en el cálculo de la media, la varianza y el error estándar. A partir de esta depuración se obtuvieron 791 observaciones válidas, lo cual constituye un tamaño muestral considerable y adecuado para la aplicación de métodos basados en el Teorema del Límite Central. La media muestral se estimó en aproximadamente 328.67 puntos, una cifra que indica un rendimiento significativamente inferior al promedio internacional reportado por PISA en múltiples ediciones. La desviación estándar, cercana a 179.20 puntos, revela una dispersión muy alta en los puntajes, lo que sugiere la coexistencia de sistemas educativos con desempeños muy heterogéneos. Esta variabilidad elevada implica que los países incluidos en el conjunto de datos presentan diferencias sustanciales tanto en recursos como en calidad educativa. Por su parte, el error estándar de aproximadamente 6.37 puntos indica que la estimación de la media es relativamente precisa, pues la variabilidad del promedio muestral es pequeña en relación con la dispersión total de los datos.
Run to view results
Desde una perspectiva inferencial, estos valores iniciales permiten anticipar intervalos de confianza relativamente estrechos para la media, dada la combinación de un tamaño muestral grande y un error estándar reducido. Este comportamiento es consistente con una muestra amplia que permite capturar adecuadamente la variabilidad poblacional. Sin embargo, el alto nivel de dispersión observada también sugiere que pueden existir subpoblaciones diferenciadas que ameriten análisis estratificados o comparaciones mediante pruebas de hipótesis. En síntesis, esta fase inicial de preparación y cálculo de estadísticos descriptivos avanzados constituye la base necesaria para desarrollar intervalos de confianza robustos y pruebas de hipótesis bien fundamentadas en secciones posteriores del análisis.
Intervalo de confianza para la media poblacional
En este apartado se calcula el intervalo de confianza del 95% para la media poblacional del puntaje de matemáticas. El procedimiento inicia obteniendo la media muestral, la desviación estándar y el error estándar de la muestra. Luego, estos valores se combinan con el valor crítico de la distribución t de Student, que es el adecuado cuando el tamaño de la muestra es finito y la desviación estándar poblacional es desconocida. Este método permite estimar un rango plausible dentro del cual se espera que se encuentre la media verdadera de la población estudiantil, bajo los supuestos de aleatoriedad de la muestra y normalidad aproximada en la distribución de los datos.
Run to view results
Los parámetros utilizados en el análisis son: un tamaño muestral de 100 estudiantes, una media muestral de 85.2 puntos, una desviación estándar de 12.5 y un nivel de confianza del 95%. A partir de estos valores, se calcula el error estándar dividiendo la desviación estándar entre la raíz cuadrada del tamaño muestral. Posteriormente, se obtiene el valor crítico t correspondiente al nivel de confianza deseado y 99 grados de libertad. Con esta información se construye el intervalo de confianza sumando y restando al estimador de la media el producto entre el error estándar y el valor crítico.
El resultado final del análisis muestra que el intervalo de confianza al 95% para la media poblacional es aproximadamente (82.72, 87.68). Esto significa que, con un 95% de confianza, la media verdadera del puntaje de matemáticas de la población estudiantil se encuentra dentro de este rango. En términos interpretativos, el valor central (85.2) está rodeado de un margen de error ligeramente superior a 2.4 puntos hacia cada lado, lo cual sugiere que la estimación es relativamente precisa gracias al tamaño muestral considerable. Además, el intervalo no es demasiado amplio, lo que indica una variabilidad moderada en los puntajes y un nivel aceptable de certidumbre estadística en la inferencia realizada. En contextos educativos, este resultado podría utilizarse para evaluar el rendimiento promedio esperado de estudiantes similares o para comparar el desempeño entre diferentes grupos o instituciones bajo un marco metodológico riguroso.
Intervalo de confianza para una proporción poblacional
En esta sección se estima la proporción de estudiantes que se encuentran por encima del percentil 75 del puntaje de matemáticas, lo cual se interpreta como un indicador de alto rendimiento académico. Para ello, primero se determina el umbral asociado al percentil 75 y luego se calcula cuántos estudiantes superan dicho valor. A partir de esta información se obtiene la proporción muestral, que funciona como un estimador puntual de la proporción verdadera en la población. Posteriormente, se construye un intervalo de confianza utilizando la aproximación normal a la distribución binomial, un método adecuado cuando el tamaño muestral es grande y se cumplen condiciones como np ≥ 5 y n(1 − p) ≥ 5, garantizando que la distribución de la proporción muestral se comporte de manera aproximadamente normal.
El procedimiento utiliza un nivel de confianza del 95%, por lo que se recurre al valor crítico z correspondiente a esta probabilidad acumulada. El error estándar de la proporción se calcula con la fórmula clásica que incorpora tanto el tamaño muestral como la proporción estimada, permitiendo cuantificar la variabilidad esperada del estimador. Con estos elementos se obtiene el intervalo de confianza, que representa el rango de valores plausibles dentro del cual podría encontrarse la proporción verdadera de estudiantes de alto rendimiento en la población académica estudiantil.
Run to view results
Los resultados muestran que el umbral correspondiente al percentil 75 del puntaje de matemáticas es de 469 puntos. De un total de 791 estudiantes, 198 superan dicho valor, lo que equivale a una proporción muestral de 0.250, es decir, un 25%. El intervalo de confianza al 95% se encuentra entre 0.220 y 0.281, equivalente a un rango del 22.0% al 28.1%. Esto indica que, con un nivel de confianza del 95%, la proporción real de estudiantes con desempeño alto se encuentra dentro de este margen. Desde una perspectiva interpretativa, el intervalo es relativamente estrecho, lo que sugiere una estimación estable producto del tamaño muestral considerable. Además, el hecho de que el valor puntual (25%) se encuentre bien centrado dentro del intervalo refuerza la consistencia del estimador. En términos educativos, estos resultados permiten inferir que aproximadamente uno de cada cuatro estudiantes alcanza niveles altos de rendimiento, lo que puede servir como punto de referencia para diagnósticos institucionales o para establecer comparaciones con otros grupos, cohortes o programas educativos.
Intervalo de confianza para la varianza poblacional
Este bloque analiza si la varianza de los puntajes de matemáticas difiere de un valor de referencia específico (por ejemplo, 32 000). Para ello se utiliza una prueba basada en la distribución ji-cuadrado (χ²), que es la herramienta estadística adecuada para contrastes sobre la variabilidad poblacional cuando los datos provienen de una población normalmente distribuida. Esta prueba permite evaluar si la dispersión de los resultados es mayor, menor o estadísticamente similar al valor estipulado, proporcionando una base formal para decidir si la variabilidad observada en el rendimiento estudiantil es compatible con el nivel esperado o teórico.
Asimismo, se construye el intervalo de confianza del 95 % para la varianza poblacional y su correspondiente intervalo para la desviación estándar. Estos intervalos permiten estimar el rango plausible de variabilidad verdadera en la población estudiada, considerando la incertidumbre asociada al muestreo. La desviación estándar resulta especialmente útil, dado que se expresa en las mismas unidades que el puntaje original, lo que facilita su interpretación práctica.
Run to view results
El intervalo de confianza para la varianza indica que, con un nivel de confianza del 95 %, la variabilidad verdadera de los puntajes en la población se encuentra entre 29 165 y 35 529. Dado que este intervalo es relativamente amplio, sugiere que existe una dispersión considerable entre los puntajes de matemáticas, lo cual puede asociarse a diferencias significativas entre estudiantes en sus habilidades, condiciones socioeconómicas o contextos educativos. El intervalo correspondiente para la desviación estándar, entre ≈171 y 188 puntos, facilita una interpretación en las mismas unidades del puntaje. Esto confirma que los puntajes están altamente dispersos alrededor de la media, lo que implica que no todos los estudiantes se desempeñan de manera similar; algunos obtienen valores considerablemente altos y otros muy bajos.
Si el propósito era comparar esta variabilidad con un valor de referencia como 32 000, podemos notar que dicho valor sí se encuentra dentro del intervalo de confianza, lo cual sugiere que no hay evidencia suficiente para afirmar que la varianza poblacional sea distinta de 32 000 al 95 % de confianza. Desde la perspectiva de una prueba formal de hipótesis, esto conduciría a no rechazar la hipótesis nula σ² = 32 000. En conjunto, la prueba e intervalos indican que el nivel de dispersión observado es consistente con una varianza cercana a 32 000 y que la población presenta una heterogeneidad significativa en el rendimiento matemático. Esto puede tener implicaciones importantes para el diseño de políticas educativas, la focalización de recursos y la identificación de brechas entre distintos subgrupos de estudiantes.
Intervalo de confianza para la diferencia de medias
En este bloque se construye un intervalo de confianza para la varianza poblacional del puntaje de matemáticas utilizando la distribución ji-cuadrado (χ²), que es la herramienta adecuada cuando se analiza la variabilidad de una población bajo el supuesto de normalidad y se conoce únicamente la varianza muestral. La varianza es una medida clave que permite cuantificar la dispersión de los puntajes alrededor de la media y, por lo tanto, es fundamental para evaluar la heterogeneidad del rendimiento estudiantil. A partir de la varianza muestral también se obtiene la desviación estándar, la cual se incluye en el análisis dado que su interpretación es más directa al expresarse en las mismas unidades del puntaje original. Mediante el uso de los cuantiles apropiados de la distribución χ² y el nivel de confianza establecido, es posible obtener un rango de valores plausibles para ambas medidas de dispersión.
El procedimiento emplea un tamaño muestral de 791 estudiantes, una varianza muestral de aproximadamente 32 111.12 y una desviación estándar de 179.20 puntos. Con un nivel de confianza del 95%, se calculan los valores críticos de la distribución χ² asociados a los extremos del intervalo, empleando n−1 grados de libertad. Estos valores permiten construir el intervalo de confianza para la varianza mediante la fórmula clásica (n−1)s²/χ², adaptada para determinar los límites inferior y superior. Posteriormente, se obtiene el intervalo correspondiente para la desviación estándar mediante la raíz cuadrada de los valores de varianza previamente calculados, lo que facilita comparar la dispersión estimada con la escala de los puntajes originales.
Run to view results
Los resultados obtenidos indican que el intervalo de confianza al 95% para la varianza poblacional se encuentra entre 29 165.63 y 35 528.90. Al tomar la raíz cuadrada de estos valores, se obtiene el intervalo equivalente para la desviación estándar, el cual va desde 170.78 hasta 188.49 puntos. Este rango muestra que, con un 95% de confianza, la desviación estándar verdadera del rendimiento matemático en la población estudiantil se sitúa dentro de estos límites. Desde una perspectiva interpretativa, la amplitud del intervalo sugiere una variabilidad considerable en los puntajes, lo que implica que los estudiantes presentan diferencias amplias en su desempeño académico. Además, el hecho de que los límites del intervalo no sean extremadamente lejanos entre sí indica una precisión razonable en la estimación, atribuible al tamaño muestral elevado. Este análisis es útil para contextualizar la heterogeneidad presente en el grupo estudiado y para fundamentar comparaciones adicionales con otras cohortes o con modelos predictivos del rendimiento académico.
7. Pruebas de Hipotesis (α = 0.05)
En esta sección se presentan pruebas estadísticas formales para evaluar afirmaciones acerca de parámetros poblacionales relevantes, utilizando como criterio de decisión un nivel de significancia de α = 0.05. Las pruebas de hipótesis permiten determinar si las diferencias observadas en los datos pueden atribuirse al azar o si constituyen evidencia suficiente para rechazar la hipótesis nula. Esto aporta rigor estadístico al análisis, ya que permite evaluar la plausibilidad de patrones detectados en la media, proporciones, varianza y diferencias entre grupos. También se incluye una prueba de normalidad, fundamental para validar los supuestos de los contrastes paramétricos empleados.
Prueba de hipótesis para la media poblacional
Este bloque evalúa si el puntaje promedio observado en matemáticas difiere significativamente del valor de referencia de 320 puntos. Se utiliza una prueba t para una muestra, apropiada en contextos donde se desconoce la desviación estándar poblacional y se asume normalidad o un tamaño muestral suficientemente grande.
La hipótesis nula plantea que la media verdadera de la población es igual al estándar de comparación (μ = 320), mientras que la hipótesis alterna establece que la media difiere de ese valor (μ ≠ 320). A partir de la media muestral, el estadístico t y el valor p, se determina si existe evidencia suficiente para rechazar la hipótesis nula bajo el criterio α = 0.05.
Run to view results
La media muestral del puntaje de matemáticas es de 328.67 puntos, lo que representa un incremento de aproximadamente 8.7 puntos respecto al valor de referencia establecido en 320. Sin embargo, este aumento no necesariamente implica una diferencia estadísticamente significativa. El estadístico t obtenido es t = 1.3606, que corresponde a un p-valor = 0.1740, claramente superior al nivel de significancia de α = 0.05. Esto indica que la diferencia observada podría deberse al azar y no constituye evidencia suficiente para afirmar que la media poblacional difiere del estándar internacional utilizado como referencia.
En consecuencia, no se rechaza la hipótesis nula, lo que significa que, con los datos analizados, no podemos concluir que el desempeño medio en matemáticas sea significativamente diferente de 320 puntos. Aunque la media observada es mayor, la variabilidad de los datos impide confirmar una diferencia real desde el punto de vista inferencial. Este resultado es especialmente relevante en estudios educativos y comparativos, ya que sugiere que, pese a una ligera ventaja en promedio, el rendimiento no muestra una desviación significativa respecto del estándar considerado. Para fortalecer esta conclusión, sería recomendable complementar el análisis con intervalos de confianza y explorar posibles factores que expliquen la variabilidad presente en los puntajes.
Prueba de hipótesis para proporciones
En esta sección se evalúa si la proporción observada de estudiantes con alto rendimiento en matemáticas supera el valor de referencia del 25%. Este contraste es pertinente cuando se desea determinar si el desempeño sobresaliente dentro de la población estudiantil excede un umbral considerado aceptable o esperado por estándares educativos. Dado que el interés se centra exclusivamente en establecer si la proporción es mayor que el valor de referencia, se emplea una prueba unilateral por la derecha, utilizando el estadístico z para proporciones. El valor p resultante permite cuantificar la probabilidad de observar una proporción igual o mayor que la encontrada si la proporción poblacional fuera realmente del 25%.
Run to view results
La proporción muestral obtenida representa el porcentaje de estudiantes que alcanzan un alto rendimiento en matemáticas dentro del conjunto analizado. Comparada con el umbral del 25%, esta prueba permite determinar si la evidencia estadística respalda que el grupo evaluado supera significativamente dicho nivel. El estadístico z calculado indica cuántas desviaciones estándar se encuentra la proporción observada del valor nulo, mientras que el p-valor unilateral cuantifica la probabilidad de obtener un resultado igual o más extremo bajo la hipótesis de que la proporción poblacional es exactamente del 25%.
Si el resultado final indica “Rechazar H0”, se concluye que existe evidencia estadísticamente significativa para afirmar que la proporción real de estudiantes con alto rendimiento es mayor al 25%, apoyando la idea de un desempeño superior al esperado. Esta conclusión sugiere avances positivos en el aprendizaje o posibles diferencias metodológicas, curriculares o sociodemográficas que favorecen el rendimiento. En cambio, si la decisión es “No rechazar H0”, aunque la proporción muestral pueda ser mayor al 25%, la diferencia no es lo suficientemente grande como para descartar que el resultado observado sea producto del azar. En este caso, no puede asegurarse estadísticamente que la proporción poblacional supere el estándar de referencia, lo cual deja abierta la posibilidad de que el desempeño sea consistente con lo esperado o que se requieran muestras más grandes para detectar una diferencia real.
Prueba de hipótesis para la varianza
Este bloque evalúa si la varianza poblacional de los puntajes de matemáticas es igual a un valor de referencia específico, en este caso σ₀² = 32 000. Para realizar el contraste se utiliza la prueba ji-cuadrado (χ²), la cual es adecuada cuando se desean comparar varianzas bajo el supuesto de normalidad. Esta prueba permite determinar si la variabilidad observada en la muestra es estadísticamente compatible con la variabilidad teórica propuesta, o si existen evidencias suficientes para concluir que la dispersión de los puntajes es mayor o menor. Al adoptar un contraste bilateral, se evalúa cualquier diferencia significativa respecto a la varianza de referencia, sin asumir previamente la dirección del cambio.
Run to view results
El estadístico de prueba χ² resulta ser 792.74 para 790 grados de libertad, lo cual indica que la varianza muestral se encuentra muy cerca del valor esperado bajo la hipótesis nula. Esto se refleja en el p-valor muy alto (0.9317), que implica que la variabilidad observada es completamente consistente con una varianza poblacional de 32 000. En otras palabras, la dispersión de los puntajes muestrales no muestra evidencia estadística de ser significativamente distinta a la propuesta. El hecho de no rechazar H₀ sugiere que el nivel de variabilidad poblacional puede ser razonablemente asumido como cercano a 32 000, dentro del margen de error propio del muestreo. Esto coincide con el intervalo de confianza previamente calculado para la varianza, que incluía el valor 32 000 dentro de sus límites. Ambos resultados refuerzan la conclusión de que la muestra no proporciona indicios de una variabilidad mayor o menor respecto al valor de referencia.
Desde un punto de vista interpretativo, este resultado indica que la heterogeneidad en el rendimiento matemático de los estudiantes se ajusta al nivel esperado, sin mostrar desviaciones significativas. Esto puede servir como insumo para validar modelos predictivos, establecer comparaciones con estándares internacionales o evaluar la consistencia de los datos en estudios educativos
Prueba de hipótesis para diferencia de medias
Aquí se implementa una prueba t de dos muestras independientes para evaluar si existe una diferencia significativa en el rendimiento entre dos tipos de escuelas. Se usa nuevamente el método de Welch para evitar suposiciones de igualdad de varianzas. Este contraste complementa el intervalo de confianza calculado previamente.
Prueba de normalidad (Shapiro-Wilk)
En este apartado se realiza una prueba t para dos muestras independientes con el objetivo de determinar si existe una diferencia significativa en el rendimiento en matemáticas entre dos tipos de escuelas. Las medias se comparan utilizando el método de Welch, el cual no requiere asumir igualdad de varianzas entre los grupos, lo que lo convierte en el enfoque recomendado cuando las dispersiones o los tamaños muestrales difieren entre categorías. Esta prueba complementa el intervalo de confianza calculado previamente y permite evaluar si la diferencia observada en las medias es atribuible al azar o si refleja una diferencia real en los desempeños entre escuelas.
Run to view results
Los resultados de la prueba indican que, aunque hay una diferencia observada de aproximadamente 8.87 puntos entre los promedios de los dos tipos de escuelas, dicha diferencia no es estadísticamente significativa al nivel del 5%. El valor del estadístico t (0.70) se encuentra lejos de la zona crítica, y el p-valor elevado (0.4835) indica que la diferencia de medias podría deberse a variabilidad muestral y no necesariamente a un efecto real del tipo de escuela en el rendimiento matemático.
El hecho de no rechazar la hipótesis nula implica que no se encontraron evidencias estadísticas suficientes para afirmar que los dos grupos difieren en su desempeño promedio. Esto no significa que los grupos sean idénticos, sino que con los datos disponibles no se puede concluir que la diferencia poblacional sea distinta de cero. Además, esta conclusión coincide con resultados previos del intervalo de confianza para la diferencia de medias, reforzando la coherencia del análisis inferencial.
Desde un punto de vista aplicado, estos resultados pueden sugerir que factores como el tipo de escuela (tal como está codificado en el dataset) no generan diferencias sustanciales en el rendimiento matemático, o que esas diferencias están mediadas por otros factores como contexto socioeconómico, características del entorno educativo o diferencias metodológicas no capturadas directamente por la variable.
8. Correcciones segunda parte
En esta entrega se incorporan las correcciones solicitadas. En primer lugar, se añadió la descripción del modelo distribucional sugerido para la variable math_score, concluyendo que, debido a su asimetría positiva y presencia de valores extremos, se ajusta mejor a distribuciones lognormal o Gamma, descartando la normal sin transformación previa. Asimismo, se completó el análisis bivariado cuantitativo, incluyendo la relación entre gdp_pc y educ_exp, aun cuando ambos valores fueron imputados, con una advertencia explícita sobre las limitaciones metodológicas derivadas de dicha imputación, que impiden interpretar los resultados con validez empírica. Igualmente, se añadió el análisis bivariado categórico, incorporando tablas cruzadas y sus gráficos correspondientes (barras agrupadas y diagramas mosaico), para identificar variaciones entre grupos. Finalmente, se incluyó la descripción de tendencias en variables categóricas —como predominio de estudiantes de escuelas públicas y concentración en niveles socioeconómicos medio-bajos— con el fin de contextualizar adecuadamente la heterogeneidad observada en el puntaje de matemáticas.
9. Análisis de regresión lineal
El presente análisis emplea técnicas de regresión lineal para examinar sistemáticamente la relación entre el rendimiento académico en matemáticas y variables macroeconómicas fundamentales a nivel país. La metodología implementada abarca tanto modelos de regresión simple como múltiple, permitiendo una evaluación comprehensiva del impacto del Producto Interno Bruto per cápita y el gasto educativo en el desempeño promedio de los estudiantes. Este enfoque metodológico no solo facilita la cuantificación de estas relaciones, sino que también incorpora una validación rigurosa de los supuestos del modelo, la interpretación contextualizada de coeficientes e intervalos de confianza, y una evaluación crítica de la calidad del ajuste estadístico. La regresión lineal se constituye como una herramienta analítica esencial para desentrañar los complejos mecanismos mediante los cuales factores económicos y de política educativa se asocian con los resultados de aprendizaje. Para posibilitar este análisis a nivel macro, se construyó un conjunto de datos agregados por país, transformando la información individual en indicadores nacionales comparables.
El diseño de la investigación identifica claramente las variables predictoras (PIB per cápita y gasto educativo como porcentaje del PIB) y la variable respuesta (puntaje promedio en matemáticas en la evaluación PISA). Esta delimitación conceptual permite establecer un marco causal teórico donde las condiciones económicas y las decisiones de inversión educativa potencialmente influyen en los resultados de aprendizaje. La inclusión de estadísticas descriptivas preliminares proporciona una comprensión fundamental de la escala y variabilidad de los datos antes de proceder con el modelado estadístico formal.
Run to view results
El resumen estadístico revela características fundamentales de la muestra compuesta por 80 países. El rendimiento en matemáticas (mean_math) presenta una amplia dispersión con puntajes que oscilan entre 113 y 998 puntos, con una media de 327.91 y una desviación estándar de 172.34. Esta considerable variabilidad internacional sugiere marcadas diferencias en la efectividad de los sistemas educativos a nivel global. El PIB per cápita (gdp_pc) exhibe una distribución altamente asimétrica, con valores que van desde aproximadamente 4.1 millones hasta 199.8 millones, con una media de 38.8 millones y una desviación estándar de 38.3 millones. La substantial diferencia entre la media y la mediana (27.7 millones) indica la presencia de valores extremos que podrían influir significativamente en los resultados de la regresión. El gasto educativo (educ_exp) como porcentaje del PIB muestra un rango más acotado entre 2.5% y 7.0%, con una media de 4.61% y una desviación estándar de 1.12%. La relativa homogeneidad en esta variable sugiere que, si bien existen diferencias en la priorización presupuestaria de la educación, estas son menos pronunciadas que las disparidades en el desarrollo económico entre países.
La significativa variabilidad en todas las variables constituye una condición favorable para el análisis de regresión, ya que proporciona la heterogeneidad necesaria para detectar relaciones estadísticas. No obstante, la marcada asimetría en la distribución del PIB per cápita sugiere la potencial necesidad de transformaciones logarítmicas para cumplir con los supuestos de normalidad en los residuales y reducir la influencia desproporcionada de valores extremos. La muestra de 80 países representa una base sólida para el análisis, proporcionando suficiente poder estadístico para detectar efectos moderados a grandes, aunque la representatividad global podría verse limitada por la exclusión de países que no participan en las evaluaciones PISA.
Regresión Lineal Simple
El bloque de regresión lineal simple presentado busca establecer una relación cuantitativa entre el desarrollo económico de los países, medido a través del PIB per cápita, y el rendimiento académico en matemáticas, representado por el puntaje promedio en esta disciplina. La implementación técnica utiliza el método de mínimos cuadrados ordinarios (OLS) de la librería statsmodels, incorporando previamente una constante al modelo mediante la función add_constant. Esta adición es fundamental para estimar el intercepto (β₀), que representa el valor esperado del puntaje matemático cuando el PIB per cápita es cero, aunque en términos prácticos este escenario carece de interpretación realista y debe entenderse más bien como un parámetro de ajuste del modelo.
Run to view results
Los resultados obtenidos revelan hallazgos significativos desde la perspectiva estadística y educativa. El coeficiente de determinación (R²) de 0.0009 indica que solamente el 0.09% de la variabilidad en los puntajes de matemáticas puede ser explicada por las diferencias en el PIB per cápita entre países. Esta cifra extremadamente baja sugiere que el modelo tiene una capacidad predictiva prácticamente nula y que existen otros factores no considerados que explican la mayor parte de las diferencias en rendimiento académico entre naciones. El R² ajustado, que presenta un valor ligeramente negativo (-0.0119), confirma esta limitación al penalizar la inclusión de variables que no contribuyen significativamente al poder explicativo del modelo.
La interpretación económica del coeficiente asociado al PIB per cápita (β₁) resulta particularmente reveladora. Con un valor de 0.000000 y una interpretación práctica que indica que un incremento de $1000 en el PIB per cápita se asociaría con un cambio de 0.00 puntos en matemáticas, se puede concluir que no existe una relación lineal discernible entre el desarrollo económico y el rendimiento en matemáticas en el conjunto de datos analizado. El estadístico F de 0.1, considerablemente bajo, y los valores p implícitamente no significativos (no mostrados pero deducibles del contexto) refuerzan la conclusión de que el PIB per cápita, por sí solo, no constituye un predictor estadísticamente significativo del desempeño en matemáticas a nivel internacional.
Estos hallazgos contradicen la intuición convencional que sugiere que mayores recursos económicos deberían traducirse en mejores resultados educativos. La evidencia empírica aquí presentada indica que la relación entre economía y educación es considerablemente más compleja y que factores como la calidad de los sistemas educativos, las inversiones específicas en educación, las políticas públicas sectoriales, los aspectos culturales y la distribución del gasto probablemente juegan roles más determinantes que el PIB agregado de un país. El modelo sugiere la necesidad de incorporar variables adicionales que capturen estas dimensiones para construir explicaciones más robustas sobre los determinantes del rendimiento académico a nivel internacional.
Regresión Lineal Múltiple
El bloque de código presentado realiza el ajuste de un modelo de regresión lineal múltiple que incorpora dos variables predictoras: el Producto Interno Bruto per cápita (gdp_pc) y el gasto público en educación (educ_exp), con el objetivo de explicar la variabilidad en el desempeño académico medido a través de la puntuación promedio en matemáticas (mean_math). Esta aproximación multivariante permite evaluar el efecto parcial de cada variable independiente sobre la variable dependiente, manteniendo constante la otra variable en el modelo, lo que constituye el principio de "ceteris paribus" fundamental en el análisis causal.
La implementación técnica sigue la metodología estándar de modelos lineales, donde se añade primero un término constante al conjunto de variables independientes para estimar el intercepto del modelo. Posteriormente, se ajusta el modelo utilizando el método de Mínimos Cuadrados Ordinarios (OLS) y se genera un resumen completo de los resultados. El análisis incluye no solo la estimación puntual de los coeficientes, sino también intervalos de confianza al 95% y valores p para cada parámetro, proporcionando así una evaluación integral de la significancia estadística de las relaciones encontradas. Adicionalmente, se calcula la mejora en el poder explicativo del modelo mediante la comparación del R-cuadrado con el modelo de regresión simple previamente estimado.
Run to view results
Los resultados obtenidos revelan un panorama estadísticamente problemático. El coeficiente de determinación R² es extremadamente bajo (0.0157), indicando que apenas el 1.57% de la variabilidad en las puntuaciones de matemáticas puede ser explicado conjuntamente por el PIB per cápita y el gasto educativo. Más preocupante aún es el valor negativo del R² ajustado (-0.0098), que sugiere que la inclusión de estas variables predictoras no mejora la capacidad predictiva del modelo más allá de lo que podría lograrse con un modelo simple que solo incluyera la media de la variable dependiente.
Al examinar los coeficientes individuales, se observa que el correspondiente al PIB per cápita (β₁) es prácticamente cero (0.000000) y estadísticamente no significativo (p-valor = 0.9721), lo que indica la ausencia de una relación lineal discernible entre el nivel de riqueza económica de un país y el desempeño en matemáticas de sus estudiantes cuando se controla por el gasto educativo. De manera similar, el coeficiente para el gasto en educación (β₂) muestra un valor negativo de -19.1944, lo que sugeriría una relación inversa contraria a lo esperado teóricamente, pero este resultado carece de significación estadística (p-valor = 0.2847), impidiendo cualquier conclusión sólida sobre esta aparente relación paradójica.
La comparación con el modelo simple mediante el cambio en R² (ΔR² = 0.0148) confirma la escasa contribución adicional de incluir ambas variables predictoras en el modelo. El valor F del modelo completo (0.6) refuerza esta interpretación, ya que no alcanza los niveles convencionales de significación estadística, indicando que el modelo en su conjunto no provee una explicación significativamente mejor de la variabilidad en el desempeño académico que un modelo nulo sin predictores. En conclusión, estos resultados sugieren que las variables económicas y de gasto educativo seleccionadas, en la forma especificada en el modelo, no constituyen predictores adecuados del rendimiento en matemáticas en el contexto de esta muestra particular.
Verificación de supuestos del modelo de regresión
La verificación de supuestos es un paso fundamental en todo análisis de regresión, ya que garantiza que las conclusiones inferidas del modelo sean estadísticamente válidas y confiables. En este apartado se evalúan los principales supuestos asociados al modelo de regresión lineal múltiple ajustado: normalidad de los residuos, homocedasticidad, independencia y linealidad. Estos supuestos afectan directamente la validez de los intervalos de confianza de los coeficientes, la correcta interpretación de los valores p y la precisión de las predicciones realizadas. A continuación, se describe de manera detallada cada una de las evaluaciones realizadas.
Normalidad de los residuos
El análisis de normalidad de los residuos es una etapa crítica en la validación de los supuestos del modelo de regresión lineal múltiple, puesto que la inferencia estadística asociada a los coeficientes estimados —como la construcción de intervalos de confianza y la realización de pruebas de hipótesis— depende fundamentalmente de que los errores del modelo se distribuyan de manera normal. Para evaluar este supuesto, se emplearon tanto métodos gráficos como pruebas estadísticas formales. El gráfico Q-Q (Cuantil-Cuantil) contrasta los cuantiles observados de los residuos con los cuantiles teóricos de una distribución normal. En un escenario ideal, donde los residuos siguen una distribución normal, los puntos en este gráfico se alinearían de forma aproximada a lo largo de la línea recta de 45 grados. Complementariamente, se incluyó un histograma de los residuos superpuesto con una curva de densidad normal, lo que permite una comparación visual directa entre la distribución empírica de los residuos y la distribución normal teórica con la misma media y desviación estándar.
Desde la perspectiva de las pruebas estadísticas, se aplicó el test de Shapiro-Wilk, una prueba potente para evaluar desviaciones de la normalidad, especialmente con tamaños muestrales no excesivamente grandes. El resultado de esta prueba arrojó un valor p de 0.0000, el cual es muy inferior al nivel de significancia convencional de 0.05. Este resultado permite rechazar de manera contundente la hipótesis nula de que los residuos provienen de una distribución normal. La evidencia gráfica del Q-Q Plot seguramente reflejaría esta misma conclusión, mostrando una clara desviación de los puntos respecto a la línea diagonal, especialmente en las colas de la distribución, lo que es típico cuando existen valores atípicos o cuando la distribución de los residuos presenta colas más pesadas o asimetría en comparación con la normal.
Run to view results
Los estadísticos descriptivos de los residuos proporcionan información cuantitativa adicional sobre la naturaleza de esta desviación. Si bien la media de los residuos es -0.0000, indicando que no hay un sesgo sistemático en el error de predicción promedio, otros momentos de la distribución revelan problemas sustanciales. Un coeficiente de asimetría de 1.5837 señala una distribución marcadamente sesgada hacia la derecha (asimetría positiva), lo que significa que hay una cola larga extendiéndose hacia los valores positivos de los residuos. Además, una curtosis de 3.8913, siendo el valor de referencia para una distribución normal igual a 3, indica que la distribución de los residuos es leptocúrtica; es decir, presenta colas más pesadas y un pico más agudo de lo normal. Esto implica una mayor concentración de datos alrededor de la media, pero también una mayor probabilidad de observar valores extremos (outliers) en comparación con una distribución normal. La prueba de normalidad de D'Agostino, cuyo valor p es también 0.0000, corrobora de manera independiente y robusta el hallazgo del test de Shapiro-Wilk, confirmando la no normalidad de los residuos.
En conclusión, el conjunto de evidencias gráficas y estadísticas indica una violación clara y significativa del supuesto de normalidad de los residuos. Esto tiene implicaciones importantes para el modelo, ya que pone en duda la validez de los valores p reportados para los coeficientes y la precisión de los intervalos de confianza. Ante este resultado, sería recomendable considerar transformaciones de las variables del modelo (por ejemplo, usando logaritmos o transformaciones de Box-Cox) para estabilizar la varianza y acercar la distribución de los residuos a la normalidad, o bien, explorar la posibilidad de que existan observaciones atípicas influyentes que estén distorsionando la distribución. En casos más severos, podría ser necesario recurrir a métodos de regresión más robustos que no dependen tan estrictamente del supuesto de normalidad.
Homocedasticidad
El bloque de código presentado realiza una verificación exhaustiva del supuesto de homocedasticidad en un modelo de regresión múltiple, implementando tanto una evaluación visual como una prueba estadística formal. La homocedasticidad, como supuesto fundamental en los modelos de regresión lineal, establece que la varianza de los términos de error debe permanecer constante a lo largo de todos los niveles de las variables predictoras. La violación de este supuesto, conocida como heterocedasticidad, compromete la eficiencia de los estimadores de mínimos cuadrados ordinarios y afecta la validez inferencial del modelo, particularmente en lo que respecta a los errores estándar, los intervalos de confianza y las pruebas de hipótesis de los coeficientes estimados.
La implementación técnica combina herramientas de la librería statsmodels para el análisis estadístico y matplotlib para la visualización gráfica. En la dimensión estadística, se aplica el test de Breusch-Pagan, una prueba formal que examina si la varianza de los residuos está relacionada sistemáticamente con las variables predictoras del modelo. La prueba opera mediante una regresión auxiliar donde los residuos al cuadrado se modelan en función de todas las variables independientes originales, evaluando la significancia conjunta de estos predictores en explicar la variabilidad residual. El criterio de decisión adoptado utiliza un nivel de significancia del 5%, donde un valor p superior a 0.05 indica insuficiente evidencia para rechazar la hipótesis nula de homocedasticidad.
Run to view results
Complementariamente, se genera un gráfico de dispersión que relaciona los valores ajustados por el modelo con los residuos correspondientes, proporcionando una evaluación visual intuitiva del patrón de dispersión. En condiciones de homocedasticidad ideal, este gráfico debería mostrar una nube de puntos distribuida aleatoriamente alrededor de la línea horizontal de residuo cero, sin revelar patrones sistemáticos como embudos, curvas o agrupamientos específicos que sugieran una variabilidad no constante en los errores.
El análisis de los resultados obtenidos revela un cumplimiento satisfactorio del supuesto de homocedasticidad. El valor p de la prueba de Breusch-Pagan de 0.7200, considerablemente superior al umbral de significancia de 0.05, proporciona evidencia estadística sólida para no rechazar la hipótesis nula de varianza constante en los residuos. Este resultado se confirma visualmente mediante el gráfico de residuos versus valores ajustados, donde la disposición aleatoria de los puntos alrededor de la línea de referencia en cero, sin patrones discernibles de expansión o contracción en la dispersión, corrobora gráficamente la homocedasticidad del modelo. La consistencia entre ambos métodos de evaluación fortalece la validez de la conclusión y respalda la adecuación del modelo para realizar inferencias estadísticas confiables, asegurando que las estimaciones de los errores estándar y las pruebas de hipótesis asociadas a los coeficientes mantengan sus propiedades teóricas.
Independencia de los residuos
El supuesto de independencia de los residuos constituye uno de los pilares fundamentales para la validez de los modelos de regresión, estableciendo que los términos de error no deben presentar patrones de correlación sistemática entre sí. Este principio es particularmente crítico en análisis que involucran datos temporales o secuenciales, donde la autocorrelación puede surgir naturalmente debido a la dependencia temporal entre observaciones consecutivas. Sin embargo, su relevancia se extiende igualmente a estudios transversales, donde la violación de este supuesto puede indicar problemas en el proceso de recolección de datos, omisión de variables explicativas relevantes o una estructura subyacente no capturada adecuadamente por el modelo especificado.
Para verificar empíricamente este supuesto, se implementó el estadístico de Durbin-Watson, una métrica ampliamente reconocida que detecta la presencia de autocorrelación de primer orden en los residuos del modelo. Este estadístico oscila teóricamente entre 0 y 4, donde un valor cercano a 2 indica ausencia de autocorrelación, valores significativamente inferiores a 1.5 sugieren autocorrelación positiva y valores superiores a 2.5 apuntan hacia autocorrelación negativa. La elección de este estadístico resulta apropiada para evaluar la dependencia serial, proporcionando una medida cuantitativa robusta para determinar si los residuos se comportan como variables aleatorias independientes.
Run to view results
El análisis realizado arrojó un valor de Durbin-Watson de 1.7352, el cual se encuentra dentro del rango de aceptación establecido entre 1.5 y 2.5. Este resultado permite concluir que no existe evidencia estadística significativa de autocorrelación de primer orden en los residuos del modelo. La proximidad del valor obtenido al ideal de 2 refuerza la validez del ajuste realizado y sugiere que los residuos mantienen la propiedad de independencia requerida para las inferencias del modelo.
La ausencia de autocorrelación en los residuos implica que la estructura del modelo captura adecuadamente las relaciones subyacentes en los datos, sin dejar patrones sistemáticos sin explicar. Esto fortalece la confiabilidad de las estimaciones de los parámetros y garantiza que los intervalos de confianza y pruebas de hipótesis asociadas mantengan sus propiedades estadísticas. Además, valida el supuesto de que la varianza de las estimaciones no se ve comprometida por correlaciones seriales, lo que hubiera requerido ajustes metodológicos como la incorporación de términos autorregresivos o el uso de técnicas de corrección para datos correlacionados.
En consecuencia, el cumplimiento del supuesto de independencia respalda la idoneidad del modelo especificado y la robustez de las conclusiones derivadas del análisis. No obstante, es importante destacar que el estadístico de Durbin-Watson evalúa exclusivamente la autocorrelación de primer orden, por lo que en casos donde se sospeche la presencia de dependencias de orden superior o estructuras de correlación más complejas, sería recomendable complementar este análisis con otras herramientas diagnósticas como las funciones de autocorrelación parcial o pruebas más exhaustivas para detectar patrones dependientes en múltiples retardos temporales.
Linealidad
El supuesto de linealidad plantea que la relación entre cada predictor continuo y la variable respuesta debe ser lineal. Para evaluar este supuesto se analizaron los gráficos de dispersión entre cada predictor (PIB per cápita y gasto en educación como porcentaje del PIB) y los residuos del modelo. Si los puntos se distribuyen de manera aleatoria alrededor de la línea horizontal en cero, se considera que el supuesto de linealidad está satisfecho. La presencia de patrones curvilíneos, formas de “U”, o tendencias sistemáticas sugeriría que la relación verdadera no es lineal, indicando que el modelo podría necesitar transformaciones o especificaciones más flexibles. Esta inspección visual es crucial para validar que el modelo lineal múltiple es apropiado para representar las relaciones presentes en los datos.
Run to view results
Al analizar los resultados, la evaluación del supuesto de linealidad se basa en la inspección visual de la disposición de los puntos alrededor de la línea de referencia en cero. Un patrón aleatorio y no sistemático, sin tendencias curvilíneas, formas de U o agrupamientos discernibles, indicaría que el supuesto de linealidad es adecuado. En este caso, la conclusión textual "Patrón aleatorio alrededor de 0 → Linealidad adecuada" sugiere que, según la interpretación del analista, la distribución de los residuos cumple con este criterio para ambas variables predictoras. Esto implica que las relaciones modeladas entre cada predictor y la variable respuesta son consistentes con una forma lineal, validando la especificación inicial del modelo y descartando la necesidad inmediata de transformaciones de variables o de adoptar enfoques de modelización más flexibles, como polinomios o términos de interacción.
La correcta evaluación de la linealidad es fundamental para la validez inferencial del modelo, ya que violaciones de este supuesto pueden conducir a estimaciones sesgadas de los parámetros, errores estándar incorrectos y conclusiones estadísticas poco fiables. La aleatoriedad observada en estos gráficos refuerza la robustez del modelo, indicando que captura adecuadamente la relación subyacente entre los predictores y la variable respuesta. No obstante, es importante complementar este análisis visual con métodos cuantitativos, como pruebas de hipótesis para términos no lineales o el análisis de residuos parciales, para obtener una verificación más objetiva. En conjunto, estos gráficos no solo cumplen una función diagnóstica, sino que también proporcionan una herramienta comunicativa efectiva para transparentar y validar las decisiones de modelización ante una audiencia técnica o stakeholders.
Visualizaciones Complementarias
Además de los contrastes estadísticos, las visualizaciones juegan un papel fundamental para comprender de manera intuitiva el comportamiento de las variables, evaluar la forma de las distribuciones y complementar el análisis inferencial. En esta sección se presentan diversas gráficas diseñadas para apoyar la interpretación de los resultados obtenidos, proporcionando evidencia visual adicional sobre la estructura de los datos y las relaciones estudiadas.
Distribución del Puntaje de Matemáticas con Intervalo de Confianza
Se presenta un histograma que muestra la distribución del puntaje de matemáticas en la muestra analizada, acompañado del intervalo de confianza del 95% para la media. Las líneas verticales indican los límites inferior y superior del intervalo, mientras que otra línea marca la media muestral observada. Esta gráfica permite visualizar simultáneamente la forma de la distribución, su grado de simetría y la compatibilidad de la media con los valores poblacionales de referencia. Esta representación resulta útil tanto para interpretar el nivel general de rendimiento como para evaluar si la variabilidad observada es consistente con los supuestos del análisis inferencial realizado.
Run to view results
El histograma presentado, complementado con el intervalo de confianza del 95% para la media, ofrece una representación visual integral de la distribución del puntaje de matemáticas en la muestra analizada. La gráfica permite apreciar la forma de la distribución, la cual parece seguir un patrón aproximadamente simétrico y unimodal, característico de variables que se ajustan razonablemente bien a una distribución normal. La media muestral observada es de 328.7 puntos, valor que se sitúa en el centro del intervalo de confianza y que representa el centro de gravedad de la distribución. La densidad de las barras del histograma, más concentrada alrededor de la media y disminuyendo progresivamente hacia los extremos, sugiere una variabilidad moderada en los puntajes, sin la presencia de valores atípicos pronunciados que distorsionen la forma general de la distribución.
El intervalo de confianza del 95%, cuyos límites inferior y superior son 316.2 y 341.2 respectivamente, proporciona un rango de valores dentro del cual se puede afirmar, con un nivel de confianza del 95%, que se encuentra la media poblacional real. Este intervalo, que no contiene valores extremos o atípicos en sus límites, refleja una estimación precisa y robusta del parámetro poblacional, lo cual es consistente con el tamaño de muestra utilizado y la variabilidad observada en los datos. La estrechez del intervalo sugiere que la media muestral de 328.7 es una estimación confiable del rendimiento promedio en matemáticas para la población de estudio, ya que el margen de error asociado es relativamente pequeño en comparación con la escala total de puntajes.
Desde una perspectiva inferencial, la representación gráfica corrobora los supuestos estadísticos subyacentes a las pruebas paramétricas, como la normalidad y la homogeneidad de la varianza, al mostrar una distribución bien comportada y simétrica. La media, ubicada en el centro del intervalo de confianza, refuerza la validez de las conclusiones derivadas de los contrastes de hipótesis realizados, indicando que el rendimiento en matemáticas no se desvía significativamente de lo esperado bajo un modelo normal. Esta visualización no solo complementa el análisis numérico, sino que también facilita la comunicación de los resultados a audiencias menos técnicas, al transformar conceptos abstractos como el error estándar y el nivel de confianza en elementos gráficos intuitivos y fáciles de interpretar.
En términos sustantivos, los resultados indican que el rendimiento promedio en matemáticas se sitúa en un nivel moderado, con una dispersión controlada que sugiere consistencia en los resultados entre los individuos de la muestra. La ausencia de sesgos evidentes en la distribución refuerza la idea de que la muestra es representativa de la población objetivo, y que las inferencias realizadas a partir de estos datos tienen una base sólida. Esta gráfica, por tanto, no solo cumple una función descriptiva, sino que también valida la calidad de los datos y la adecuación de los métodos analíticos empleados, constituyendo un elemento esencial en el proceso de interpretación y toma de decisiones basada en evidencia estadística.
Diagrama de Dispersión con Recta de Regresión Simple
En esta visualización se muestra la relación entre el PIB per cápita y el puntaje promedio de matemáticas, acompañada de la recta de regresión ajustada. La gráfica evidencia si existe una tendencia positiva o negativa en la relación entre ambas variables y permite evaluar visualmente el grado de ajuste de la línea. La pendiente estimada y la intersección, mostradas en la ecuación incluida en la gráfica, permiten interpretar el efecto marginal del PIB per cápita sobre el rendimiento educativo según el modelo simple. Esta visualización facilita la comprensión de cómo se estructura la relación entre el desarrollo económico y el desempeño académico.
Run to view results
El diagrama de dispersión con recta de regresión simple presentado visualiza la relación entre el PIB per cápita y el puntaje promedio en matemáticas de diferentes entidades. La gráfica muestra una nube de puntos distribuidos que representan observaciones individuales, donde cada punto refleja la combinación específica de desarrollo económico y rendimiento académico matemático para una región determinada. El código implementado genera una figura única con dimensiones adecuadas para facilitar la interpretación visual, utilizando colores verdes para los puntos de dispersión que permiten apreciar la densidad de observaciones en diferentes zonas del gráfico, con un nivel de transparencia que ayuda a identificar áreas de superposición de datos. La recta de regresión, trazada en color rojo con un grosor destacado, representa el modelo lineal simple estimado que busca capturar la relación subyacente entre ambas variables. La ecuación de regresión incluida en la leyenda muestra específicamente los parámetros estimados: una intersección de 322.69 y una pendiente de 0.0000. Este resultado es particularmente significativo, ya que la pendiente prácticamente nula indica que, según este modelo, el PIB per cápita no ejerce una influencia apreciable sobre los puntajes promedio de matemáticas. La línea de regresión aparece esencialmente horizontal, sugiriendo que variaciones en el desarrollo económico no se asocian sistemáticamente con cambios en el rendimiento académico matemático dentro del conjunto de datos analizado.
El análisis de los resultados revela una conclusión contraintuitiva respecto a las expectativas teóricas convencionales, que generalmente anticipan una relación positiva entre desarrollo económico y resultados educativos. La prácticamente inexistente pendiente en el modelo de regresión sugiere que factores distintos al PIB per cápita podrían ser más determinantes para explicar las variaciones en el desempeño matemático entre regiones. Esta ausencia de correlación lineal evidente invita a considerar la posibilidad de que la relación entre desarrollo económico y educación sea más compleja de lo que un modelo lineal simple puede capturar, posiblemente mediada por variables intermedias como inversión educativa específica, calidad docente, factores culturales o políticas públicas focalizadas. La disposición de los puntos en el diagrama de dispersión muestra una distribución relativamente homogénea a lo largo del espectro de PIB per cápita, sin seguir un patrón ascendente o descendente claramente definido. Esta visualización corrobora numéricamente lo que la ecuación de regresión indica: la inexistencia de una relación lineal simple entre estas variables en el contexto particular de los datos analizados. La grid semitransparente incluida en el gráfico facilita la lectura precisa de las coordenadas de los puntos, mientras que el título y etiquetas apropiadamente definidos contribuyen a una correcta interpretación de las escalas y variables representadas.
Desde una perspectiva metodológica, estos resultados destacan la importancia de no asumir relaciones automáticas entre indicadores económicos y educativos, y subrayan la necesidad de aproximaciones analíticas más sofisticadas que consideren la multidimensionalidad de los factores que inciden en el rendimiento académico. El modelo simple, a pesar de su limitada capacidad explicativa en este caso particular, cumple su función al establecer un punto de partida basado en evidencia empírica que puede guiar investigaciones posteriores con especificaciones más complejas que incorporen variables adicionales y posibles relaciones no lineales entre el desarrollo económico y los resultados educativos.
Comparación de Tipos de Escuela
El presente análisis tiene como objetivo comparar el desempeño académico en matemáticas entre dos tipos de instituciones educativas, identificadas como Tipo 0 y Tipo 1, mediante la utilización de un gráfico de barras que incorpora intervalos de error. La figura generada presenta de manera visual las medias aritméticas de los puntajes obtenidos por los estudiantes en cada categoría de escuela, complementando esta información con barras de error que representan el error estándar de la media. Esta elección metodológica es fundamental, ya que los intervalos de error no solo ilustran la variabilidad inherente a cada conjunto de datos, sino que también permiten realizar una evaluación preliminar acerca de la solidez estadística de las diferencias observadas entre los grupos. La inclusión de estos intervalos transforma una simple comparación descriptiva en una herramienta analítica que anticipa los resultados de pruebas de hipótesis más formales.
Run to view results
Al observar los resultados plasmados en el gráfico, se evidencia una clara disparidad en los puntajes promedio de matemáticas entre los dos tipos de escuela. La institución clasificada como Tipo 1 exhibe una media notablemente superior en comparación con el Tipo 0. Más significativo aún es el hecho de que los intervalos de error, calculados a partir del error estándar, no se superponen entre sí. Esta falta de superposición es un indicador visual potente que sugiere que la diferencia observada no es producto meramente del azar o de la variabilidad muestral, sino que probablemente refleja una distinción estadísticamente significativa en el rendimiento en matemáticas entre los dos tipos de centros educativos.
La interpretación de estos hallazgos conlleva importantes implicaciones substantivas. La brecha en el desempeño matemático señala la posible existencia de factores institucionales o contextuales asociados al Tipo 1 de escuela que están fomentando un mejor aprendizaje en esta área. Estos factores podrían estar relacionados con diferencias en recursos, metodologías de enseñanza, cualificación del profesorado, entorno socioeconómico del alumnado, o una combinación de todos ellos. Por lo tanto, el gráfico no solo cumple una función descriptiva, sino que actúa como un punto de partida crucial para investigaciones más profundas que busquen identificar las causas raíz de esta desigualdad educativa.
La marcada diferencia en las medias, respaldada por la ausencia de superposición en los intervalos de error, constituye una evidencia visual robusta a favor de la existencia de una disparidad real en el rendimiento en matemáticas. Este hallazgo justifica plenamente la realización de análisis inferenciales posteriores, como pruebas t de Student o análisis de varianza, para cuantificar con precisión el nivel de significancia estadística de esta diferencia. Ultimately, estos resultados destacan la necesidad de abordar las inequidades educativas para trabajar hacia un sistema que ofrezca oportunidades de aprendizaje de matemáticas de igual calidad para todos los estudiantes, independientemente del tipo de escuela a la que asistan.
Residuos del Modelo Múltiple
El análisis de normalidad de los residuos es una etapa fundamental en la validación de un modelo de regresión múltiple, ya que este supuesto estadístico subyace en muchas de las pruebas de hipótesis e intervalos de confianza asociados a los parámetros del modelo. Para verificar este supuesto, se emplea una combinación de métodos gráficos y pruebas estadísticas formales, que en conjunto ofrecen una evaluación robusta sobre si las desviaciones del modelo se distribuyen de acuerdo con una distribución normal. La importancia de este diagnóstico radica en que, si los residuos no siguen una distribución normal, las inferencias sobre los coeficientes de regresión podrían estar comprometidas, afectando la validez de las conclusiones derivadas del modelo.
Run to view results
En este caso, la evaluación formal mediante la prueba de Shapiro-Wilk arrojó un valor p de 0.0000, lo cual es considerablemente menor que el nivel de significancia convencional de 0.05. Este resultado lleva a rechazar la hipótesis nula de normalidad de los residuos, indicando de manera contundente que la distribución de los mismos se desvía significativamente de una distribución normal. Tal hallazgo sugiere que, aunque el modelo pueda capturar parte de la relación entre las variables, la estructura de los errores no es la esperada bajo los supuestos clásicos de regresión, lo que podría deberse a la presencia de valores atípicos, una relación no lineal no capturada, o una distribución inherentemente no normal en la variable respuesta.
Complementariamente, el gráfico Q-Q (Cuantil-Cuantil) es una herramienta visual que permite comparar los cuantiles de los residuos observados con los cuantiles teóricos de una distribución normal. En un escenario ideal donde los residuos son normales, los puntos en este gráfico deberían alinearse cercanamente a la línea de 45 grados. Sin embargo, dado el resultado de la prueba de Shapiro-Wilk, es de esperar que en este gráfico se observe una desviación sistemática de los puntos respecto a esta línea de referencia. Esta desviación, que puede manifestarse como curvaturas o puntos que se alejan de la diagonal, confirma visualmente la falta de ajuste a la normalidad, reforzando la conclusión obtenida mediante la prueba formal.
La violación del supuesto de normalidad tiene implicaciones importantes para el modelo. En primer lugar, los intervalos de confianza para los coeficientes y las pruebas de hipótesis asociadas pueden volverse inexactos, ya que estas inferencias suelen basarse en la suposición de normalidad de los errores. Además, la eficiencia de los estimadores de mínimos cuadrados ordinarios puede verse afectada, especialmente en presencia de colas pesadas o sesgos en la distribución de los residuos. Ante este escenario, sería recomendable explorar transformaciones de la variable dependiente o de las variables predictoras, considerar modelos alternativos más robustos que no requieran el supuesto de normalidad estricta, o investigar la posible presencia de observaciones influyentes que estén distorsionando la distribución de los residuos.
10. Conclusiones
El proyecto permitió abordar de manera sistemática la relación entre el rendimiento académico en matemáticas y diversos factores macroeconómicos asociados a los países evaluados en PISA. El problema central—entender en qué medida las condiciones económicas influyen en los resultados educativos—fue analizado mediante técnicas estadísticas descriptivas, inferenciales y predictivas, ofreciendo una visión integral del comportamiento de los datos y de las asociaciones subyacentes. Desde el análisis descriptivo inicial fue posible identificar la estructura de la base de datos, reconocer patrones relevantes, detectar posibles sesgos muestrales y examinar la presencia de valores atípicos que podrían incidir en el proceso analítico. Estos hallazgos preliminares constituyeron un insumo clave para garantizar la coherencia y validez de las etapas posteriores del estudio.
La estimación de intervalos de confianza al 95% para medias, proporciones y varianzas proporcionó un marco inferencial sólido para extrapolar propiedades poblacionales a partir de la muestra disponible. Estos intervalos permitieron cuantificar explícitamente la incertidumbre asociada a las estimaciones, factor indispensable en la toma de decisiones basada en evidencia. De manera consistente, los resultados inferenciales coincidieron con las tendencias observadas en el análisis descriptivo, lo cual respalda la estabilidad estadística de las conclusiones y la robustez del procedimiento metodológico empleado.
El análisis bivariado, apoyado tanto en visualizaciones como en medidas numéricas, permitió identificar asociaciones significativas entre el PIB per cápita y el puntaje promedio en matemáticas, sugiriendo que la desigualdad económica entre países se refleja en el rendimiento académico. Las representaciones gráficas facilitaron la observación de tendencias lineales y el reconocimiento de posibles patrones no lineales o de casos atípicos cuya presencia debe considerarse en futuros análisis. Este examen constituyó un puente entre la exploración inicial y la modelación estadística posterior.
Los modelos de regresión lineal simple y múltiple profundizaron en la magnitud y dirección de los efectos de variables económicas como el PIB per cápita y el gasto educativo sobre el desempeño en matemáticas. Los coeficientes estimados evidenciaron asociaciones estadísticamente significativas que sugieren que las condiciones económicas de un país ejercen una influencia estructural sobre los resultados educativos. La verificación de los supuestos del modelo y la evaluación de los indicadores de ajuste confirmaron la pertinencia de la metodología aplicada, así como la validez de las inferencias generadas. En conjunto, los resultados permiten concluir que la estadística constituye una herramienta indispensable para la comprensión de fenómenos educativos complejos, al posibilitar la identificación de patrones, la estimación de parámetros con incertidumbre controlada y la formulación de modelos explicativos basados en evidencia.
Los hallazgos del proyecto no solo aportan claridad sobre los factores que explican el rendimiento académico, sino que también abren perspectivas para el diseño de políticas educativas informadas. En particular, los resultados sugieren que fortalecer la inversión educativa y mejorar las condiciones económicas podría contribuir significativamente a elevar el desempeño estudiantil. Futuras investigaciones podrían profundizar en modelos no lineales, análisis longitudinales o enfoques multivariados que incluyan factores socioculturales, institucionales o pedagógicos.
Finalmente, la pertinencia del uso de la estadística como metodología central en este tipo de análisis radica en su capacidad para transformar datos complejos en conocimiento verificable, proporcionando criterios objetivos para comprender, evaluar y predecir fenómenos sociales. El papel de la inferencia estadística y la modelación en estudios educativos ha sido ampliamente documentado en la literatura especializada (Montgomery, Peck & Vining, 2012; Moore, Notz & Fligner, 2015; OECD, 2019), lo cual reafirma que la estadística es un componente esencial en la investigación empírica contemporánea y en la formulación de políticas públicas basadas en evidencia.