Introducción y marco teórico
La Evaluación Diagnóstica de Conocimientos y Habilidades (EDICH) es una prueba que se aplica al comienzo de cada año lectivo a la generación de ingreso a la Facultad de Ciencias de la Universidad de la República. Se implementó en 2003 y a partir de entonces se ha seguido aplicando sin interrupciones, aunque con algunas variaciones y ajustes con miras a mejorarla. Esta evaluación consiste en preguntas de múltiple opción agrupadas por áreas. En el caso de las licenciaturas en Ciencias Biológicas y en Bioquímica, las áreas son matemática, física, química y biología. En el caso de las licenciaturas en Matemática y en Física, las áreas se reducen a matemática y física. Es de destacar que la EDICH es de asistencia obligatoria, pero no es eliminatoria (Abella et al., 2010); esto implica que no hay presión en obtener buenos resultados, por lo cual para el estudiante funciona como un test de evaluación personal. En la Facultad de Ciencias hay otras licenciaturas, pero tienen una cantidad relativamente baja de ingresos (en comparación con las anteriores), por lo cual no fueron consideradas aquí.
El interés en este estudio es analizar los resultados de la EDICH para saber si presenta algún sesgo (es decir, si sus preguntas favorecen a uno u otro sexo) respecto al sexo de los participantes. Con respecto a esto último, los ingresos generales a la Facultad de Ciencias tienen una proporción 1:1 que es característica del área Tecnologías, Ciencias de la Naturaleza y el Hábitat (Dirección General de Planeamiento (DGPlan), Universidad de la República (Udelar), 2022). Esta proporción se mantiene en los ingresos a la Licenciatura en Ciencias Biológicas, pero se transforma en 2:1 a favor de las mujeres en la Licenciatura en Bioquímica, mientras que en las licenciaturas en Matemática y en Física la proporción se invierte, siendo de 2:1 a favor de los hombres, característico de las áreas STEM (Science, Technology, Engineering and Mathematics). Esta variedad en las proporciones hace que la Facultad de Ciencias sea un lugar potencialmente interesante para este tipo de estudios.
Cuando se estudia el sesgo por sexo en las evaluaciones en general, se ha observado que el contenido de las preguntas puede influir en los resultados de las evaluaciones. Por ejemplo, Wilson et al. (2016), en un estudio que abarcó exámenes de física de múltiple opción realizados en Australia a lo largo de ocho años, encontraron que había un sesgo a favor de los hombres. Ellos adjudicaron este sesgo principalmente a factores tales como el contenido de las preguntas, el contexto de estas y la presentación de los datos (ecuaciones, diagramas, etc.). Lo mismo se encontró en estudios realizados en Estados Unidos (Docktor y Heller, 2008) y en el Reino Unido (Bates et al., 2013).
También hay que tener en cuenta que el formato de las preguntas, que en la EDICH es de múltiple opción, podría repercutir de manera diferencial según el sexo de quien realiza la prueba. Existen numerosos estudios relacionados con esta temática en los que algunos autores postulan que el formato de múltiple opción no influenciaría (Wright et al., 2016), mientras que otros mantienen que sí (Graetz y Karimi, 2022; Griselda, 2020; Stanger-Hall, 2012).
Adicionalmente, varios autores han encontrado que el hecho de ser evaluadas presenta una desventaja para las mujeres, ya sea como amenaza del estereotipo o bien como ansiedad (Graetz y Karim, 2022; Griselda, 2020; Régner et al., 2016; Salehi et al., 2019; Spencer et al., 2016; Steele y Aronson, 1995; Wright et al., 2016). La amenaza del estereotipo se refiere a la obtención de resultados académicos más bajos de lo esperado en situaciones en que los integrantes de un grupo determinado se sienten amenazados por la posibilidad de que su desempeño confirmará -ya sea ante otros o ante ellos mismos- el estereotipo negativo acerca de las habilidades del grupo al que pertenecen. El hecho de ser evaluado aumenta la preocupación acerca de ser juzgado estereotípicamente, lo que lleva a su vez a un impedimento de procesar eficientemente la información que se presenta, resultando en un mal desempeño. Por ejemplo, las mujeres que se sienten amenazadas por su estereotipo tenderán a presentar un desempeño académico por debajo del de sus pares masculinos, aun poseyendo capacidades equivalentes o superiores (Régner et al., 2016; Spencer et al., 2016; Steele y Aronson, 1995). Respecto a la ansiedad, en un estudio de Salehi et al. (2019) que involucró a más de 5.000 estudiantes en pruebas universitarias de nivel introductorio, se encontró que las mujeres tuvieron rendimientos más bajos que los hombres. Estos autores encontraron una correlación entre los rendimientos bajos de las mujeres en estas pruebas y la ansiedad que les generaba la prueba. Sin embargo, en otras instancias de evaluación que no implicaban una prueba formal, como por ejemplo actividades de laboratorio, no solo no se encontraron sesgos a favor de los hombres, sino que hubo casos en que las mujeres tuvieron un rendimiento académico por encima del de sus pares masculinos.
Finalizando esta introducción, se observa que la Mesa Interinstitucional Mujeres en Ciencia, Innovación y Tecnología (2020) concluyó que el ámbito educativo no es neutral al género, sino que habría ciertas normas de género que condicionan las trayectorias de hombres y mujeres y resultan en el alejamiento de estas últimas de las áreas STEM a lo largo de los distintos niveles educativos (Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura UNESCO, 2017).
Objetivos
El objetivo de este estudio es analizar la EDICH para investigar si en la ella existe un sesgo hacia uno u otro sexo y, en caso afirmativo, tratar de determinar sus causas.
Contexto
El análisis que se detalla a continuación se refiere a los resultados de la aplicación de la EDICH en cinco años consecutivos, de 2015 a 2019 inclusive, restringido a cuatro cohortes de estudiantes correspondientes a las licenciaturas en Ciencias Biológicas (abreviado Biología), Bioquímica, Física y Matemática. En ese período hubo un total de 1.494 estudiantes, de los cuales 748 eran hombres y 746 mujeres. Más precisamente, hubo 332 hombres en Biología, 105 en Bioquímica, 166 en Física y 143 en Matemática, y 416 mujeres en Biología, 197 en Bioquímica, 65 en Física y 70 en Matemática.
Las cuatro cohortes se dividieron en dos bloques, uno formado por Biología y Bioquímica y el otro por Física y Matemática. Quienes integraban el primer bloque debieron responder preguntas en cuatro áreas: matemática, física, química y biología, mientras que los del segundo solo tuvieron preguntas de matemática y física. Cabe destacar que de las 16 preguntas del área física presentes en la prueba del segundo bloque, las primeras 12 coincidían con las del primer bloque. Algo similar sucedió con las preguntas del área matemática, en que de las 20 preguntas en la prueba del segundo bloque, las primeras 12 coincidían con las del primer bloque.
Metodología
Lo primero que se hizo fue calcular, para cada uno de los dos bloques, en cada año, las medias (es decir, el puntaje promedio) obtenidas en las pruebas de las distintas áreas. Así, para el bloque Biología-Bioquímica se calcularon las medias obtenidas por los estudiantes hombres en cada una de las pruebas de matemática, física, química y biología. Lo mismo se hizo con las de las estudiantes mujeres y con el total de estudiantes. Eso se repitió en el bloque Física-Matemática con las pruebas de matemática y física (en la sección siguiente están los resultados). Al analizar las medias se observó que los rendimientos generales en cualquiera de las distintas áreas fueron bajos para ambos sexos y que las medias de las mujeres fueron casi siempre inferiores a las de los hombres.
Se pasó luego a analizar si esta diferencia en el rendimiento entre mujeres y hombres era significativa. Dados los bajos valores de las medias, no se pudo utilizar el simple criterio de aprobado/no aprobado para analizar los rendimientos en la prueba EDICH, ya que rara vez se alcanzó el nivel de suficiencia (más de 50 puntos en 100). Fue por ello que se decidió establecer tres categorías de rendimiento: alto, medio y bajo, para lo cual se convirtieron las notas obtenidas a porcentajes y luego se halló la media aritmética para cada área temática y para cada cohorte; también se halló el desvío estándar correspondiente a cada caso. Se definieron así las siguientes categorías:
Rendimiento bajo = toda nota menor que la media aritmética menos el desvío estándar
Rendimiento medio = toda nota entre la media aritmética menos el desvío estándar y la media aritmética más el desvío estándar
Rendimiento alto = toda nota mayor que la media aritmética más el desvío estándar
Esta categorización de los rendimientos usando el desvío estándar está inspirada en el método utilizado por Régner et al. (2016).
Una vez establecidas las tres categorías, se procedió a realizar el test de chi-cuadrado para analizar si había diferencias significativas entre los distintos rendimientos, es decir, para saber si las diferencias obtenidas podían deberse o no al azar (Agresti, 2007; Cortés et al., 2014). La diferencia se considera significativa cuando el valor del chi-cuadrado es mayor de 5,99 (para dos grados de libertad y un valor p menor a 0,05). Este análisis se hizo para los cinco años en estudio y para ambos bloques. El problema del test del chi-cuadrado es que su valor aumenta con el tamaño de la muestra, tendiendo a hacer pensar que existe correlación cuando no la hay. Eso nos afecta porque en nuestro estudio vamos a tener que comparar el comportamiento de las cuatros cohortes en cinco períodos distintos, con variaciones importantes en la cantidad de alumnos. Para remediarlo se suele aplicar, y fue lo que hicimos, otro estadístico llamado el coeficiente V de Cramer, que toma valores entre 0 y 1. Solo cuando el valor del chi-cuadrado es superior a 5,99 y el valor del V de Cramer es 0,30 o mayor, se considera que hay una diferencia significativa. Esto se debe a que a partir del valor 0,30 el estadístico de Cramer nos dice que existe una asociación de magnitud moderada entre las variables en estudio (Baguley, 2009; Cortés et al., 2014).
Como resultado de aplicar los estadísticos anteriores se detectaron diferencias significativas en los resultados de algunas preguntas del área física, por lo cual se analizó la facilidad relativa de cada pregunta de esta área, para intentar determinar si estaba relacionada con el sexo de quien respondía la pregunta, según lo descrito por Wilson et al. (2016). Con este fin, para cada pregunta (y en cada año) se calculó el porcentaje de aprobación de estudiantes hombres, obtenido realizando el cociente entre la cantidad de estudiantes hombres que respondieron bien la pregunta sobre el total de estudiantes hombres que respondieron la pregunta y luego multiplicándolo por 100:
En forma análoga se obtuvo el porcentaje de aprobación de estudiantes mujeres. Finalmente se obtuvo la facilidad relativa, definida como la resta del porcentaje de aprobación de estudiantes hombres menos el porcentaje de aprobación de estudiantes mujeres:
Los valores positivos de la facilidad relativa señalan una ventaja para los hombres; los negativos, para las mujeres. Nótese que si las preguntas tuviesen la misma facilidad para hombres y mujeres, este valor sería 0. En su aplicación, cuando el valor de la facilidad relativa es superior a +1,5 se consideró que está a favor de los hombres, cuando el valor es inferior a -1,5, que está a favor de las mujeres, y cuando la diferencia en facilidad relativa está entre -1,5 y +1,5 que no favorece a ningún sexo. Además, a cada pregunta le asociamos una tendencia de acuerdo al siguiente criterio: cuando en tres o más años a los hombres les va mejor se le adjudica la letra M (masculino), cuando ocurre lo mismo con las mujeres se le adjudica la F (femenino) y cuando no hay predominancia de uno sobre el otro se le adjudica la N (neutro). Recuérdese que estamos evaluando un período de cinco años.
En el análisis de los resultados del párrafo anterior resultó que había preguntas de las tres tendencias, por lo cual para tratar de entender mejor lo que ocurría con las preguntas del área física se decidió analizar cada pregunta de manera individual, nuevamente tomando como referencia el trabajo realizado por Wilson et al. (2016). En dicho trabajo, se establecían cinco dimensiones distintas para clasificar las preguntas de las pruebas de física:
a. Contenido: los conocimientos que un estudiante debe tener para responder la pregunta.
b. Proceso: las habilidades necesarias para responder la pregunta (interpretar una gráfica, aplicar una fórmula, etc.).
c. Presentación: cómo se presenta la información, i.e., si hay ecuaciones, gráficas o si es mayoritariamente texto.
d. Contexto: grado de abstracción a partir de experiencias personales, i.e., si el estudiante pudo haber vivido o experimentado una situación similar.
e. Dificultad: qué tan compleja es la pregunta, por ejemplo, el número de pasos o de conceptos necesarios para resolverla.
Cada una de estas dimensiones tiene, a su vez, distintas categorías. Por ejemplo, en la dimensión contenido las categorías fueron: ecuación, gráfica, texto y diagrama (tabla 9, al final). Lo mismo sucede con las otras. Luego, para cada pregunta con tendencia M o F, se miraron las dimensiones anteriores para ver en qué categorías caía. Es decir, en las preguntas que parecían tener cierto sesgo, se fijó en el análisis de sus dimensiones con el fin de intentar determinar las causas.
Resultados y discusión
En las tablas 1 y 2 se presentan las medias por área para cada uno de los dos bloques, Biología-Bioquímica y Física-Matemática. En ambas tablas G es la media general, ♀ es la media obtenida por las mujeres del bloque y ♂ es la media de los hombres. El puntaje máximo para cada prueba es 100.
Tabla 1: Medias de rendimiento por área, en el bloque Ciencias Biológicas-Bioquímica
Año | Matemática | Física | Química | Biología | ||||||||
G | ♀ | ♂ | G | ♀ | ♂ | G | ♀ | ♂ | G | ♀ | ♂ | |
2015 | 47,3 | 45,8 | 49,3 | 31,4 | 27,9 | 35,8 | 45,8 | 44,7 | 47,1 | 54,3 | 54,2 | 54,4 |
2016 | 48,2 | 47,8 | 48,8 | 30,5 | 28,7 | 32,6 | 43,1 | 41,3 | 45,1 | 54,5 | 50,3 | 59,7 |
2017 | 45,2 | 45,0 | 45,5 | 27,9 | 26,4 | 30,1 | 43,0 | 41,6 | 45,3 | 54,4 | 53,3 | 56,3 |
2018 | 48,7 | 47,8 | 50,2 | 29,2 | 27,7 | 31,5 | 44,1 | 42,6 | 46,3 | 55,0 | 54,3 | 56,1 |
2019 | 41,6 | 40,7 | 43,1 | 27,5 | 24,7 | 31,6 | 39,1 | 37,0 | 42,2 | 52,0 | 49,7 | 55,2 |
Tabla 2: Medias de rendimiento por área, en el bloque Física-Matemática
Año | Matemática | Física | ||||
---|---|---|---|---|---|---|
G | ♀ | ♂ | G | ♀ | ♂ | |
2015 | 53,7 | 47,7 | 57,1 | 34,0 | 26,8 | 37,9 |
2016 | 62,3 | 61,6 | 62,6 | 42,8 | 36,4 | 45,6 |
2017 | 60,4 | 61,7 | 59,7 | 44,8 | 44,0 | 45,3 |
2018 | 63,9 | 54,2 | 67,1 | 39,5 | 32,3 | 41,9 |
2019 | 67,0 | 62,1 | 69,2 | 44,5 | 37,3 | 47,6 |
Analizando las tablas anteriores se observa que las medias de las mujeres son siempre más bajas que las de los hombres, con la única excepción del año 2017 para la prueba del área matemática correspondiente al bloque Física-Matemática.
A continuación se busca determinar en qué casos esas diferencias en las medias son significativas. Las tablas 3 y 4 resumen los resultados de aplicar los test de chi-cuadrado y V de Cramer. En ambas tablas, junto al año figura entre paréntesis el número total de estudiantes que integra cada cohorte; M representa las preguntas del área matemática; F las de física; Q las de química, y B las de biología. Estas tablas presentan las diferencias en el rendimiento por sexo dentro de cada una de las dos licenciaturas que componen el bloque. La palabra No indica que las diferencias halladas no fueron significativas; en cambio, cuando las diferencias entre lo esperado y lo observado resultaron significativas se consigna Sí junto con el valor del V de Cramer. Además, en los casos en que la V de Cramer es superior a 0,30, la zona correspondiente aparece sombreada.
Tabla 3: Resultados del test de chi-cuadrado para el bloque Biología-Bioquímica
2015 (n = 179) | 2016 (n = 212) | 2017 (n = 193) | 2018 (n = 224) | 2019 (n = 242) | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Diferencias | M | F | Q | B | M | F | Q | B | M | F | Q | B | M | F | Q | B | M | F | Q | B |
Intralic. en Cs. Biológicas | No | No | No | No | No | No | No | Sí 0,22 | No | No | No | No | No | No | No | No | No | No | No | Sí 0,20 |
Intralic. en Bioquímica | No | No | No | No | No | No | No | No | No | No | No | No | No | No | No | No | No | Sí 0,41 | Sí 0,29 | No |
Tabla 4: Resultados del test de Chi-cuadrado para el bloque Física/Matemática
2015 (n = 67) | 2016 (n = 97) | 2017 (n = 81) | 2018 (n = 97) | 2019 (n = 102) | ||||||
---|---|---|---|---|---|---|---|---|---|---|
Diferencias | M | F | M | F | M | F | M | F | M | F |
Intralic. en Física | No | No | No | No | No | No | No | No | No | Sí 0,35 |
Intralic. en Matemática | No | Sí 0,50 | No | No | No | No | No | No | Sí 0,36 | No |
En términos generales se puede observar que no existen diferencias significativas en los rendimientos de las distintas áreas según el sexo de quien responde las preguntas. Solo hay cuatro excepciones, tres de las cuales corresponden a preguntas del área física y una al área matemática (véanse las casillas sombreadas en las tablas 3 y 4). Estas diferencias implican que en dichos casos el desempeño de las mujeres está por debajo de lo que se esperaría si los resultados de alto, medio y bajo se distribuyeran de manera independiente del sexo.
Adicionalmente, al analizar las diferencias intralicenciatura del año 2019 para las licenciaturas en Física y en Matemática (tabla 4, fila 1/columna 10 y fila 2/columna 9), se observa que las mujeres inscritas en Física no tienen diferencias significativas con sus pares masculinos a la hora de responder las preguntas del área matemática; sin embargo, a estas mismas mujeres les va significativamente peor que a los hombres cuando tienen que responder las preguntas del área física. Algo análogo ocurre en la Licenciatura en Matemática, pero intercambiando los roles de las preguntas de física con las de matemática. Esto podría estar indicando la ocurrencia del fenómeno de amenaza del estereotipo. Cabe aclarar que no es la única explicación posible para estos resultados del año 2019, ya que no se realizaron otros estudios, como por ejemplo para medir ansiedad.
En los datos obtenidos, llama la atención que tres de los cuatro casos en los que se encontraron diferencias significativas en el rendimiento según sexo correspondían al área física (tablas 3 y 4). Además, las medias generales de los resultados en las preguntas del área física (en ambos bloques) son las más bajas de todas las áreas, con un valor promedio de 29,2 en 100 para el bloque Biología-Bioquímica y un promedio de 41,5 en 100 para el bloque Física-Matemática (tablas 1 y 2). Por lo tanto se decidió profundizar en las preguntas del área física, en ambos bloques.
A continuación se presentan cuatro tablas numeradas 5, 6, 7 y 8, en las que aparece el valor de la facilidad relativa de cada pregunta del área física, por año y por licenciatura, según lo descrito en la sección “Metodología”. En las tablas 5 y 6 se ve la facilidad relativa de cada una de las 12 preguntas del área física para el bloque Biología-Bioquímica. En las tablas 7 y 8 se ve la facilidad relativa de las 16 preguntas del área física para el bloque Física-Matemática. Recuérdese que las 12 primeras preguntas de física del bloque Física-Matemática son las mismas que las del bloque Biología-Bioquímica. Cuando el valor de la facilidad relativa es superior a +1,5 se colorea la casilla en verde (está a favor de los hombres), cuando el valor es inferior a -1,5 se colorea en violeta (está a favor de las mujeres) y cuando está entre -1,5 y +1,5 aparece en blanco. Finalmente se agregó la fila Tendencia, determinada de acuerdo al criterio de predominancia de facilidad relativa por tres años, descrito en la sección “Metodología”.
Tabla 5: Facilidad relativa de cada pregunta del área física para la Licenciatura en Biología
Licenciatura en Biología | P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 | P9 | P10 | P11 | P12 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
2015 | -6,1 | 0,1 | -3,7 | 3,5 | 6,7 | 17,8 | -7,5 | 18,9 | 9,0 | 15,1 | -2,0 | 10,3 |
2016 | 17,7 | 3,4 | -7,9 | -19,6 | 6,8 | 12,9 | -2,8 | 14,0 | 14,0 | 15,5 | 0,2 | 11,9 |
2017 | 0,1 | 8,3 | 3,4 | 15,3 | 9,5 | 8,5 | -8,3 | 4,1 | -3,7 | 18,9 | 0,2 | 6,0 |
2018 | 5,8 | 7,3 | -8,2 | -4,7 | 5,1 | 14,5 | -0,7 | 20,7 | 5,7 | 1,9 | 4,9 | 5,1 |
2019 | -4,6 | 12,3 | 2,2 | 1,4 | 17,4 | -1,4 | 2,1 | 14,2 | 17,9 | 3,1 | 0,6 | 7,5 |
Tendencia | N | M | F | N | M | M | F | M | M | M | N | M |
Tabla 6: Facilidad relativa de cada pregunta del área física para la Licenciatura en Bioquímica
Licenciatura en Bioquímica | P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 | P9 | P10 | P11 | P12 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
2015 | 12,6 | 9,0 | 11,9 | 2,9 | 20,5 | 1,4 | 0,5 | 40,5 | 24,0 | 16,4 | 4,3 | 5,7 |
2016 | -18,6 | 0,0 | 0,0 | -2,6 | 20,8 | 10,0 | -2,6 | 20,3 | 5,2 | -25,1 | -5,6 | 5,2 |
2017 | 5,6 | 14,0 | -3,5 | 1,1 | 1,1 | -19,4 | -6,5 | 3,0 | -16,9 | -0,8 | -4,6 | -3,5 |
2018 | -8,8 | 9,3 | -6,6 | 14,1 | 10,6 | 10,0 | 9,1 | -19,4 | 6,2 | -6,8 | 8,4 | 22,1 |
2019 | 21,6 | 5,6 | 2,3 | 12,9 | 18,8 | 35,2 | -2,0 | 11,3 | 30,1 | 10,2 | 2,7 | 15,8 |
Tendencia | M | M | N | M | M | M | F | M | M | N | M | M |
Si se analizan las 12 preguntas para este primer bloque en su conjunto, se ve que la mitad de ellas (preguntas 2, 5, 6, 8, 9 y 12) presentan un sesgo a favor de los hombres, mientras que solo en una (pregunta 7) hay un sesgo a favor de las mujeres. Además, en el caso de Biología a las mujeres también les va mejor en la pregunta 3. Siguiendo con Biología, hay tres casos de neutralidad (preguntas 1, 4 y 11), mientras que en Bioquímica hay dos casos (preguntas 3 y 10).
Tabla 7: Facilidad relativa de cada pregunta del área física para la Licenciatura en Física
Licenciatura en Física | P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 | P9 | P10 | P11 | P12 | P13 | P14 | P15 | P16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2015 | -5,5 | -3,2 | 24,5 | 3,6 | 18,6 | 27,7 | -18,2 | 13,6 | 7,7 | -9,5 | 30,0 | 24,5 | -6,8 | -7,3 | 6,8 | 1,8 |
2016 | -1,2 | -5,5 | -17,1 | 12,2 | 7,4 | 12,5 | 3,8 | 10,0 | 47,4 | -3,0 | 21,4 | 22,9 | -6,2 | 5,8 | 23,8 | 6,1 |
2017 | 0,0 | 6,7 | -16,7 | -10,0 | -13,3 | 3,3 | -16,7 | -6,7 | -20,0 | -3,3 | -16,7 | 6,7 | 3,3 | 0,0 | -20,0 | -10,0 |
2018 | 4,2 | 11,8 | 10,9 | 10,1 | 26,1 | 34,0 | 18,1 | 32,8 | 21,8 | -0,8 | 12,2 | 30,7 | 12,6 | 18,5 | 20,6 | 21,0 |
2019 | -3,3 | 8,9 | 4,4 | 14,4 | -19,4 | 16,1 | -6,7 | 26,1 | 27,8 | 16,7 | 21,7 | 42,8 | 7,2 | 20,0 | 5,0 | 18,3 |
Tendencia | F | M | M | M | M | M | F | M | M | F | M | M | M | M | M | M |
Tabla 8: Facilidad relativa de cada pregunta del área física para la Licenciatura en Matemática
Licenciatura en Matemática | P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 | P9 | P10 | P11 | P12 | P13 | P14 | P15 | P16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2015 | 23,7 | 43,5 | 14,7 | 20,4 | 44,5 | -17,7 | 8,7 | 6,4 | 34,4 | 28,1 | -2,3 | 4,0 | 12,4 | -26,4 | 14,0 | 27,1 |
2016 | 18,8 | 3,2 | 8,4 | -3,9 | 9,1 | 24,0 | -14,9 | -13,6 | 7,1 | -13,0 | 20,1 | -8,4 | -2,6 | 6,5 | 33,8 | 13,6 |
2017 | 1,2 | 8,8 | 32,1 | 7,1 | 17,2 | -6,1 | -0,2 | 5,6 | -8,8 | 20,6 | 3,2 | -33,8 | 2,7 | -0,2 | 16,7 | 4,9 |
2018 | 1,3 | 18,5 | 4,1 | 13,8 | 23,8 | -16,9 | 0,5 | 23,6 | 18,7 | 5,9 | -12,1 | -29,0 | -7,4 | 3,1 | -2,3 | -4,4 |
2019 | 3,8 | 13,4 | 5,0 | -4,3 | 13,9 | -6,1 | 16,6 | 12,1 | 10,5 | 8,8 | -2,1 | 28,8 | -1,3 | 21,8 | -7,3 | 15,5 |
Tendencia | M | M | M | M | M | F | N | M | M | M | F | F | N | M | M | M |
Analizando las 16 preguntas para este segundo bloque en su conjunto, se ve que nueve de ellas (preguntas 2, 3, 4, 5, 8, 9, 14, 15 y 16) presentan un sesgo a favor de los hombres. En el caso de la Licenciatura en Física, las mujeres responden mejor en tres preguntas: 1, 7 y 10, y no existen preguntas neutras. En el caso de la Licenciatura en Matemática, las mujeres responden mejor a tres preguntas: 6, 11 y 12, y hay dos preguntas neutras, la 7 y la 13.
La presencia de diferencias significativas entre hombres y mujeres en el rendimiento en las preguntas del área física de la EDICH podría vincularse a una facilidad relativa a favor de los hombres en estas. Para estudiar esto último, se asignaron categorías en cada una de las cinco dimensiones descritas en la sección “Metodología” y se clasificó cada pregunta de acuerdo a estas categorías. En base a esto se construyó la tabla 9, en la que aparecen las categorías en las cuales se clasifica cada pregunta, junto con su tendencia (tomada de las tablas 5 a 8); esto para todas las preguntas del área física en las cuatro licenciaturas.
Tabla 9: Categorización y tendencia relativa de cada pregunta del área física
Dimensiones | P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 | P9 | P10 | P11 | P12 | P13 | P14 | P15 | P16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Presentación | ecuación | gráfica | gráfica | texto | texto | texto | texto | texto | texto | diagrama | diagrama | texto | texto | diagrama | texto | diagrama |
Contexto | abstracto | libro de texto | libro de texto | real/no personal | libro de texto | libro de texto | libro de texto | libro de texto | real/no personal | libro de texto | libro de texto | real/no personal | libro de texto | libro de texto | real/no personal | libro de texto |
Contenido | análisis dimensional | cinemática/ proyectiles | cinemática unidim. | cinemática unidim. | cinemática/ mov. circular | dinámica, trabajo y energía | dinámica choques | dinámica mov. oscilatorio | ondas | electrostática | corriente y resistencia | óptica | electrostática | electrostática | corriente circuitos | óptica |
Proceso | identif. fuerza | interpretar diagrama | interpretar diagrama | identif. fuerza | identif. fuerza | identif. fuerza | identif. fuerza | identif. fuerza | hacer cálculos | identif. fuerza | identif. fuerza | identif. fuerza | identif. fuerza | interpretar ecuación | interpretar ecuación | interpretar diagrama |
Dificultad | concepto único | más de un concepto | más de un concepto | más de un concepto | concepto único | más de un concepto | más de un concepto | más de un concepto | más de un concepto | más de un concepto | dim. espacial única | dim. espacial única | más de un paso | dim. espacial única | más de un concepto | más de un concepto |
Tendencia Lic. Fís. | F | M | M | M | M | M | F | M | M | F | M | M | M | M | M | M |
Tendencia Lic. Mat. | M | M | M | M | M | F | N | M | M | M | F | F | N | M | M | M |
Tendencia Lic. Cs. Biol. | N | M | F | N | M | M | F | M | M | M | N | M | N/A | N/A | N/A | N/A |
Tendencia Lic. Bioq. | M | M | N | M | M | M | F | M | M | N | M | M | N/A | N/A | N/A | N/A |
Nota: Las cuatro filas de tendencias resumen las correspondientes de las tablas 5 a 8. Las 12 primeras preguntas fueron comunes a todas las licenciaturas, mientras que las preguntas 13 a 16 fueron solo para física y matemática, de ahí el N/A (no aplica) en las dos últimas filas. Se emplearon las siguientes abreviaciones: unidim.= unidimensional, mov. = movimiento, identif. = identificar, dim. = dimensión.
Analizando las preguntas en su conjunto y teniendo en cuenta la tendencia asignada a cada una, se ve que solamente en una (pregunta 7) les va mejor a las mujeres. Hay siete (preguntas 2, 5, 8, 9, 14, 15 y 16) en que la tendencia siempre favorece a los hombres. Finalmente, hay cinco (preguntas 1, 3, 10, 11 y 13) que resultan un poco más balanceadas ya que a veces les va mejor a los hombres, otras veces a las mujeres y en otras la tendencia es neutra.
Al analizar la pregunta 7 se observa que se diferencia en la dimensión contenido, ya que es la única pregunta de dinámica de choques. Un análisis similar de las siete preguntas con predominancia masculina absoluta deja en evidencia que también es esta dimensión, la del contenido, que hace que estas preguntas se diferencien de las demás. En este grupo aparece, por ejemplo, la única pregunta sobre proyectiles. Del mismo modo, la única pregunta sobre movimiento circular, la única sobre ondas, sobre dinámica del movimiento oscilatorio y sobre corriente y circuitos pertenecen a este grupo “masculino”. Las otras dimensiones, i.e., presentación, contexto, proceso y dificultad, no estarían incidiendo en la facilidad relativa de cada pregunta.
Wilson et al. (2016) hallaron que las tres dimensiones que influían más en la facilidad relativa de cada pregunta eran contexto, presentación y contenido. En cuanto a la dimensión contexto, encontraron que la categoría “real y posiblemente experimentado” era la que les otorgaba una clara ventaja a los hombres. En nuestro caso, no tenemos preguntas con este contexto. En lo que se refiere a la dimensión presentación, los autores encontraron ventajas a favor de los hombres en preguntas que presentaban la información a través de un diagrama. En nuestro caso, hay cuatro preguntas que caen en esta categoría, dos de ellas están en el grupo de predominancia masculina absoluta mientras que las otras dos están en el grupo de las preguntas más “balanceadas”. Esto indicaría que, en nuestro caso, esta dimensión por sí sola no sería la responsable de conferir ventajas a un sexo u otro. Finalmente, ellos encuentran que la dimensión contenido también estaría influyendo en la facilidad relativa de las preguntas, en especial cuando se trata de proyectiles. Nuestro análisis coincide totalmente con el de estos autores en cuanto a que la dimensión contenido estaría influenciando la facilidad relativa de las preguntas planteadas.
Conclusiones finales
En cuanto al análisis de la existencia de diferencias en los rendimientos entre alumnos hombres y mujeres en la EDICH, se puede concluir que, si bien las mujeres tuvieron casi siempre rendimientos inferiores, estas diferencias en la amplia mayoría de los casos no llegan a ser significativas: solo en 4 casos en 60 se encontraron diferencias significativas (tablas 3 y 4), lo cual nos dice que en el 93 % de los casos no las hubo. Por lo tanto, se puede concluir que en términos generales en las preguntas de la EDICH existe independencia del sexo. Este resultado está en consonancia con lo obtenido por Dietz et al. (2012) en Estados Unidos (en el sentido de que hay diferencias, pero estas no son significativas como para poder catalogarse como un sesgo) y en contraposición con lo de Bates et al. (2013) en el Reino Unido y de Wilson et al. (2016) en Australia. Sin embargo corresponde notar que los contextos de los estudios citados tienen diferencias con los nuestros: en los casos de Estados Unidos y Reino Unido, se refieren a los resultados del FCI (el Force Concept Inventory, que es un test de conocimientos de física), realizado en cursos introductorios de física a nivel universitario, mientras que los de Australia corresponden al examen para integrar el equipo de estudiantes que asistirá a olimpiadas de física. En los dos primeros casos los estudiantes requieren ciertas calificaciones para asistir a esos cursos, mientras que en el tercero son elegidos por los profesores como los mejores alumnos para representar a sus instituciones. Estas situaciones son distintas de la nuestra, en la cual no se exigen requisitos particulares para realizar la EDICH y tampoco les genera ninguna repercusión académica el resultado obtenido. Es decir, se tomaron los artículos citados para obtener modelos estadísticos que se pudiesen adaptar a nuestro caso, pero no se repitieron sus experiencias.
Volviendo al resultado obtenido en el análisis, hay que tener en cuenta de que si bien no se obtuvo evidencia de que la diferencia de rendimiento entre estudiantes hombres y mujeres se deba a la existencia de un sesgo en las preguntas, este podría ser consecuencia del formato de la prueba (múltiple opción) como mantienen algunos autores (Graetz y Karim, 2022; Griselda, 2020; Stanger-Hall, 2012). Eso sería difícil de comprobar en nuestro caso, dado que la prueba EDICH tiene un formato único, además de las dificultades que se presentan para realizar evaluaciones masivas con otros tipos de formatos.
Más allá de lo anterior, se encontraron cuatro casos (uno en 2015 y tres en 2019, tablas 3 y 4) en los cuales las mujeres obtuvieron rendimientos significativamente más bajos de lo que se esperaría si estos fuesen independientes del sexo. Esto sucedió en los dos bloques en estudio, Biología-Bioquímica y Física-Matemática. Tres de estos cuatro casos se encontraron en preguntas del área física. Por lo tanto, se profundizó en el análisis de las preguntas de esta área y en la mayoría de los casos se observó un sesgo a favor de los hombres. Luego, aplicando la metodología desarrollada por Wilson et al. (2016), se encontró que la dimensión contenido de las preguntas podría ser determinante a la hora de conferir ventajas a uno u otro sexo. Esto estaría en consonancia con los trabajos de Wilson et al. (2016) y de Salehi et al. (2019), en el sentido de que en las preguntas del área física habría un sesgo que favorece a los hombres.
En base a lo anterior, se entiende que se deberían revisar las preguntas del área física de la EDICH, priorizando aquellas con contenidos más balanceados.