Trabajo Práctico Integrado N.º 2
Análisis exploratorio (analítico y visual)
Cargando datos
Visualizando las primeras 5 filas
Visualizando las últimas 5 filas
Resumen estadístico
Tipos de datos
Eliminación de datos duplicados
Después de eliminar las filas duplicadas:
Eliminación de columnas irrelevantes
Renombrando columnas
Búsqueda de valores nulos
Detección y eliminación de outliers
Correlaciones y frecuencias
Preguntas
¿Qué factores son los que más influyen sobre las calificaciones de los estudiantes?
Codificaremos las columnas que contienen características mixtas no-numéricas de la siguiente forma:
De esta forma podemos elaborar un mapa de calor para ver como se correlacionan estas características con las calificaciones de los estudiantes:
Con ayuda de este mapa podemos tener una idea el valor de correlación entre cada característica, ya hemos visto que entre las calificaciones de las asignaturas hay fuertes correlaciones y no es de extrañar, ya que las 4 asignaturas pertenecen al campo de las ciencias exactas, pero lo que nos interesa en esta sección es la relación de las calificaciones con respecto al resto de características disponibles en el dataset, por eso debemos hacer un enfoque en el siguiente sector del mapa de calor:
Observando este sector podemos ver varias cosas
¿Hay alguna relación entre el promedio de notas obtenidas y el hecho de haber realizado el curso preparatorio?
Conclusión: Si bien la cantidad de alumnos que no realizo el curso preparatorio casi duplica a la de quienes lo han completado, esta diferencia no se ve reflejada significativamente en el promedio de notas. Se recomienda auditar los contenidos del curso, a fines de lograr una mejora en el rendimiento académico y aumentar el interés del alumnado.
¿Cómo afecta en las calificaciones de los alumnos el estado laboral de los mismos?
A simple vista no podemos extraer mucha información, ambos grupos parecen presentar desempeños similares en la mayoría de asignaturas. Veamos como se ve afectado el promedio de ambos grupos:
En conclusión, podemos decir que el estado laboral de los estudiantes afecta muy poco en las calificaciones. Como comentario, para poder dar una respuesta más certera a esta pregunta deberíamos analizar como afecta el estado laboral del estudiante en el porcentaje de deserciones, pero no contamos con esta información, ya que supongo que se han tenido en cuenta solamente aquellos alumnos que han llegado a las instancias finales de las asignaturas.
¿Cuánto influye el nivel de estudio alcanzado por los padres en las calificaciones de sus hijos?
Podemos observar que los hijos de padres que han alcanzado niveles de educación tales como maestrías o licenciaturas tienen calificaciones mayormente altas, para hijos de padres que han alcanzado niveles tales como grados de asociado o alguna educación superior las calificaciones no son tan altas como el anterior grupo, pero son más altas que las calificaciones de aquellos hijos con padres que solo alcanzaron niveles de educación de secundaria o bachilleratos. Veamos que pasa con el promedio de las calificaciones:
Aquí podemos corroborar que el análisis anteriormente realizado es correcto. Se recomienda a la institución encuestar al alumnado para conocer sobre el estado del apoyo escolar que se le brinda en su hogar y así poder generar programas de apoyo para los estudiantes que más lo necesiten.
¿Cómo es el desempeño en cada asignatura de acuerdo al género?
Claramente, podemos ver que las chicas tienen un mejor desempeño que los chicos en al menos 3 de las 4 asignaturas, siendo estás Física, Química y Álgebra, pero en Matemáticas la balanza se inclina a favor de los chicos. Veamos cuanta es la diferencia de las calificaciones en promedio:
Si bien no hay una gran brecha entre las calificaciones promedio de hombres y mujeres, existe una diferencia que debería analizarse teniendo en cuenta otros factores tales como el nivel de estudio de los padres, el tipo de almuerzo o si han realizado el curso de preparatorio, también podemos atribuir esta diferencia a la prioridad que cada grupo ha puesto sobre cada asignatura, pero esto es un aspecto que no podremos analizar por falta de información. Por ejemplo, veamos como es el almuerzo de hombres y mujeres, que como ya vimos es el factor dentro de nuestro dataset que más influye sobre las calificaciones:
Podemos ver qué dentro de la población de estudiantes que tienen almuerzos estándar, la cantidad de hombres y mujeres es casi pareja, pero hay un desbalance en la población de estudiantes que tienen almuerzos free o reducidos, siendo hombres los de mayor cantidad en esta categoría, si bien no es tanta la diferencia podría influir en la diferencia de calificaciones entre ambos grupos. Ahora veamos qué porcentaje de hombres y mujeres completaron el curso de preparatorio:
La diferencia nos dice que hubo un 1.62% más de hombres que finalizaron el curso, como ya dijimos completar el curso beneficiaba ligeramente las calificaciones de los estudiantes, pero claramente esto no alcanzo para que los hombres igualen las calificaciones de las mujeres. Veamos también el porcentaje de hijas e hijos con padres con determinado nivel de educación:
Sucede algo similar, los hijos/as con padres con niveles de educación más altos conseguirán mejores calificaciones, los dos niveles más altos de educación son liderados por padres con hijas, pero nos es tanta la diferencia, al menos en la categoría de licenciaturas, en cambio, para el tercer y cuarto nivel más alto de educación que son liderados por padres con hijos existe una amplia diferencia en ambos niveles, a priori los hombres deberían tener la ventaja con sus calificaciones, pero no es así.
En conclusión, estos análisis nos dicen que las chicas han realizado un excelente trabajo, ¡Felicitaciones, muy bien por ellas!. Chicos, lo siento, deben esforzarse un poco más. Se recomienda analizar el contenido de las asignaturas para causar mayor interés en el grupo con menor rendimiento.
¿El tipo de almuerzo influye en las calificaciones de los estudiantes?
Con este simple gráfico podemos observar como sé potencian las calificaciones promedio debido al tipo de almuerzo del estudiante, veamos que pasa con las calificaciones individuales de cada estudiante:
Solamente con observar como les fue a los estudiantes en Matemáticas podemos decir que el tipo de almuerzo es un factor que influye bastante en las calificaciones. Y esto es claro, ya que nuestro cerebro necesita energía para funcionar correctamente, pues los alimentos nos proporcionan dicha energía. La institución debe analizar la posibilidad de aportar algún tipo de alimento, como una merienda o viandas, a sus estudiantes para que estos mejoren su rendimiento académico sustancialmente, además debe encuestarse a los estudiantes acerca de su rutina alimentaria fuera de la institución en busca de alumnos que presenten problemas de acceso a una alimentación saludable.
¿Qué implicancia tienen las etnias de los estudiantes?
Conclusión: Los grupos E, B y C presentan promedios similares, el grupo D presenta el promedio más alto y, a diferencia del resto, el grupo A presenta el promedio más bajo de todos, casualmente este grupo son los de menos población, esto puede deberse a que este grupo no sea nativo del país, y el bajo promedio, que tampoco es muy distinto del resto, puede deberse a factores de adaptabilidad de la propia etnia, podrían presentar dificultades para interpretar el lenguaje nativo o simplemente están acostumbrados a otro tipo de enseñanza, se recomienda realizar encuestas al alumnado sobre el desarrollo de las asignaturas, las dificultades que se les presentan y sobre el desempeño de los profesores para detectar y descartar posibles problemas.