Implicaciones prácticas
En el marco de la preocupación por los niveles de aprendizaje alcanzados en lectura y comprensión de textos en América Latina, esta revisión arroja luz sobre la evaluación de las habilidades de alfabetización inicial que no suelen estar incluidas en los dispositivos de evaluación internacionales y regionales.
Los resultados de esta revisión demuestran la necesidad de desarrollar instrumentos de evaluación de la alfabetización inicial por fuera de los focos de desarrollo (Argentina, Chile, Colombia y México).
Los resultados de esta revisión demuestran la necesidad de desarrollar instrumentos de evaluación de la escritura.
Introducción
La lectura y la escritura constituyen dos de los comportamientos más complejos y diferenciales de la especie humana y representan un objetivo prioritario en todos los sistemas educativos. Desde una perspectiva cognitiva, aprender a leer y a escribir supone el dominio progresivo de dos componentes: el sistema de escritura y los procesos subyacentes a la comprensión y la producción textual (Diuk, 2023; Scarborough, 2001).
En los sistemas de escritura fonográfica, aprender a leer implica, ante todo, comprender el principio alfabético, es decir, la noción de que los grafemas representan, de manera sistemática, unidades lingüísticas con significado. En el caso del español, esas unidades son los fonemas, lo que subraya el rol de la conciencia fonológica en el aprendizaje (Defior et al., 2008). El aprendizaje de la lectura también supone el dominio de las reglas de conversión de grafemas en fonemas, cuyo manejo posibilita consolidar una ruta entre las áreas especializadas en el procesamiento del lenguaje oral y las áreas visuales implicadas en el procesamiento de palabras escritas (Dehaene, 2015), y la construcción de un léxico ortográfico que posibilita el reconocimiento automático de las palabras mediante una ruta más directa y rápida (Chimenti & Abusamra, 2021).
La escritura, por su parte, también involucra mecanismos específicos. De acuerdo con los modelos de doble ruta (Coltheart et al., 2001; Coslett, 2003; Ellis & Young, 1988; Protopapas et al., 2016; Schurz et al., 2010), implica competencias de tipo fonológico -para la aplicación de las reglas de conversión fonema-grafema- y ortográfico -para la escritura de palabras que contienen sonidos que pueden representarse con más de un grafema y para escribir correctamente, en el caso del español, las palabras que contienen h, que no representa ningún sonido. En este sentido, aprender a escribir requiere automatizar las habilidades de transcripción, que incluyen tanto los procesos léxicos como los motores que permiten exteriorizar el código grafémico independientemente del soporte de escritura utilizado.
Los modelos teóricos, como el modelo de visión simple de la lectura (Gough & Tunmer, 1986; Hoover & Gough, 1990) y los de visión simple -y no tan simple- de la escritura (Berninger et al., 2002; Berninger & Winn, 2008), distinguen entre habilidades de bajo y alto orden. Las primeras implican el aprendizaje del código escrito, que en la lectura comprende la decodificación y el reconocimiento de palabras y en la escritura, los procesos grafomotores y de codificación ortográfica. Las habilidades de alto orden, en cambio, se ponen en juego en la comprensión de textos, que implica la integración de la información textual con los conocimientos previos del lector (León & van Dijk, 2022), y en la producción, que requiere la puesta en marcha de procesos de planificación y revisión para generar, estructurar y editar el contenido del texto (Hayes, 2012). En los primeros grados de la escuela primaria, uno de los objetivos esenciales de la enseñanza es que niñas y niños aprendan a dominar, de modo progresivo, las habilidades de bajo orden tanto en términos de eficacia -es decir, de precisión y velocidad- como de fluidez. El desempeño en decodificación y fluidez lectora se asocia con la comprensión (Cirino et al., 2013; Duncan et al., 2016; García & Cain, 2014; Kang et al., 2019), en tanto que las habilidades de transcripción predicen la fluidez escritora, así como la calidad y longitud de los textos que se escriben (Berninger et al., 2002; Berninger & Winn, 2008; Miranda et al., 2020). Leer y escribir de modo fluido deja recursos cognitivos disponibles para abordar los procesos más sofisticados y demandantes que requieren la comprensión y la producción de textos (Diuk, 2023; Scarborough, 2001). Por consiguiente, y aun cuando el objetivo último de la lectura y la escritura es comprender y producir mensajes escritos, atender a las habilidades de bajo orden es crucial, especialmente en el inicio de la escolaridad formal.
Aunque la lectura y la escritura comparten procesos cognitivo-lingüísticos y conocimientos comunes (Kim, 2020), se trata de actividades independientes. A diferencia de la lectura, la escritura es una actividad psicolingüística de tipo productivo y, por lo tanto, es más costosa y demandante en términos de los procesos cognitivos involucrados (Jiménez-Fernández & Calet Ruiz, 2020). Así, un buen desempeño en decodificación no asegura una escritura ortográficamente correcta (Jiménez et al., 2009). Esto es particularmente evidente en el caso del español, cuyo sistema ortográfico, a pesar de ser transparente para la lectura, tiende a la homofonía heterográfica en la escritura, con fonemas que pueden representarse por más de un grafema (Sánchez-Abchi et al., 2009). Por eso, a lo largo de la escolaridad, las dificultades suelen ser más persistentes que en la escritura, con aspectos como, por ejemplo, las marcas acentuales que resultan de adquisición tardía (Figueroa-Leighton et al., 2025). Todas estas particularidades ponen de manifiesto la especificidad de la lectura y de la escritura y, por consiguiente, la necesidad de un abordaje igualmente específico para evaluar cada habilidad.
Diversos programas de evaluación han identificado la existencia de dificultades en el desempeño en lectura y, en menor medida, en escritura de estudiantes de educación primaria y secundaria en América Latina. En la última edición del Programa para la Evaluación Internacional de Estudiantes (PISA, por sus siglas en inglés), implementado en 14 países latinoamericanos, se encontró que el 55 % de los estudiantes de 15 años que fueron evaluados tiene dificultades para comprender textos simples (Organización para la Cooperación y el Desarrollo Económicos (OCDE), 2023). En el marco del Estudio Regional Comparativo y Explicativo (ERCE), llevado a cabo en 16 países, se encontró que el 40 % de los estudiantes de 3er grado y el 60 % de 6º no alcanzaron el nivel mínimo de competencias en comprensión lectora (Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (Unesco), 2022a). Esto implica que, al leer textos adecuados para su edad, no lograron localizar información explícita ni generar inferencias a partir de información claramente sugerida, destacada o reiterada. Aunque en los documentos del ERCE no se formulan generalizaciones sobre el desempeño en la escritura en la región, en los reportes de países como Argentina (UNESCO, 2022b) se advierte que hacia el final de la educación primaria aún persisten los desafíos vinculados con el dominio de procesos de base como las relaciones entre grafemas y fonemas y la ortografía convencional de las palabras. Si bien en diversos estudios (Alcaraz et al., 2013; Atorresi et al., 2019; Zabaleta et al., 2016) se ha analizado y discutido la validez de este tipo de pruebas, los resultados dan cuenta de los desafíos existentes en materia de lectura y escritura en América Latina. Además, abren la pregunta acerca de los logros en alfabetización inicial. Sin embargo, en estos programas de evaluación no se incluyen tareas que evalúen de modo específico habilidades de nivel inferior, que son condición necesaria para un adecuado desempeño en comprensión y producción de textos (Abusamra, Ferreres et al., 2022; Berninger et al., 2002; Berninger & Winn, 2008; Diuk, 2023; Gough & Tunmer, 1986; Hoover & Gough, 1990; Miranda et al., 2020; Scarborough, 2001).
En los últimos años, se han publicado diversas revisiones sistemáticas vinculadas con la evaluación de las habilidades de bajo orden. En un estudio previo (Abusamra, Chimenti, Difalcis et al., 2024), se identificaron 91 instrumentos orientados a evaluar habilidades de alfabetización inicial en español y portugués, utilizados en investigaciones con población de América Latina, España y Portugal. Dias et al. (2016) identificaron 52 instrumentos que permiten valorar diversos aspectos de la lectura en portugués tanto en población brasileña de desarrollo típico como con diversos trastornos. Por su parte, Carvalho y Souza (2023) revisaron 151 estudios implementados en Brasil y hallaron que, en primer grado de la escuela primaria, la decodificación es el proceso cognitivo más ampliamente estudiado a partir de la evaluación del reconocimiento de palabras, el acceso al léxico y la fluidez. De manera más reciente, adoptando el modelo de visión simple de la escritura (Berninger et al., 2002), Buchanan et al. (2024) revisaron 59 estudios empíricos que, en su mayoría, empleaban diversas medidas de evaluación de las habilidades de transcripción con población anglófona de nivel inicial. También se han publicado revisiones sistemáticas que sintetizan información disponible sobre intervenciones basadas en evidencia en los primeros grados de escuela primaria, como la de Balbi et al. (2018), que sistematizó 20 estudios, de los cuales solo uno se llevó a cabo con población hispanohablante. En una revisión de 108 estudios, Stone (2019) encontró que hay poca evidencia sólida con respecto al impacto de diversos programas en los resultados en alfabetización inicial en América Latina y el Caribe.
Aunque estas revisiones constituyen un importante aporte a la investigación sobre la alfabetización inicial y, específicamente, la evaluación de las habilidades de nivel inferior implicadas en la lectura y la escritura, es posible advertir algunas limitaciones que configuran un vacío de conocimiento. El alcance de algunas revisiones (Balbi et al., 2018; Stone, 2019) excede la identificación de instrumentos de evaluación y, en los casos en los que se identifican (Abusamra, Chimenti, Difalcis et al., 2024; Buchanan et al., 2024; Carvalho & Souza, 2023; Dias et al., 2016), los instrumentos no necesariamente están orientados a la evaluación en español o bien la población evaluada incluye niños y niñas de países fuera de América Latina. En particular, los instrumentos desarrollados en España tienen una aplicabilidad que resulta limitada en el contexto latinoamericano, debido a las diferencias dialectológicas entre las distintas variedades del español (Chela-Flores, 2023). Además, de acuerdo con los datos del Instituto Cervantes (Fernández Vítores, 2023), alrededor del 90 % de los hablantes de español como L1 son latinoamericanos.
Por lo tanto, este estudio tiene como objetivo sistematizar las características más relevantes de los instrumentos de evaluación de las habilidades de bajo orden implicadas en la lectura y la escritura en español utilizados en la investigación en América Latina. Específicamente, la pregunta de investigación que orienta la presente revisión es: ¿cuáles y cómo son los instrumentos orientados a la evaluación de la lectura y la escritura en español utilizados en estudios empíricos desde el año 2000 con población de educación primaria en la región?
Los hallazgos de este estudio revisten un doble interés, tanto para la investigación como para la práctica profesional. La sistematización de los instrumentos existentes puede permitir no solo identificar cuáles y cómo son las tareas utilizadas para evaluar las habilidades de bajo orden implicadas en la lectura y la escritura, sino también para promover el diseño de nuevos instrumentos en español que atiendan a aspectos potencialmente subrepresentados en los existentes. Asimismo, puede constituir un aporte relevante para la práctica de las y los profesionales implicados en la identificación temprana de posibles dificultades de aprendizaje, lo que constituye un punto de partida ineludible para una adecuada intervención, tanto en el ámbito educativo como en el ámbito clínico.
Metodología
Se llevó a cabo una revisión sistemática siguiendo los criterios propuestos por las guías PRISMA (Marmo et al., 2022; Page et al., 2021).
Estrategia de búsqueda
La búsqueda de publicaciones se llevó a cabo en agosto de 2024 en las bases SCOPUS, Web of Science, ERIC, SciELO y LA Referencia. La búsqueda se realizó sobre a partir de las combinaciones de las palabras clave, mediante los operadores AND y OR, organizadas en dos ejes: uno referido a las habilidades de lectura y escritura (lectura, leer, decodificar, escritura, escribir, ortografía) y otro, a la evaluación (evaluación, prueba, instrumento, test, batería, herramienta). En Scopus y Web of Science la búsqueda se realizó en inglés a partir de las traducciones de las palabras clave (reading, read, writing, write, decoding, orthography, assessment, evaluation, measure, test, battery, instrument, assessment method). En ERIC se utilizó su tesauro para afinar la búsqueda mediante descriptores. De este modo, las palabras buscadas fueron: reading ability, reading skills, writing ability, writing skills, educational assessment, writing tests, reading tests. En todos los casos se utilizaron operadores de truncamiento y, además, se realizó un filtro temporal en la búsqueda inicial. En Scopus, Web of Science y ERIC también se utilizó el filtro por países. Finalmente, se realizó una búsqueda adicional: se rastrearon las citas de interés de los estudios previamente encontrados, se consultó vía mail a expertas y expertos en la temática y se entrevistó a referentes de diversos países de habla hispana. Para ello, se contactó a seis especialistas -una de Paraguay, dos de Argentina y tres de Uruguay-, que en todos los casos respondieron la consulta.
Selección de estudios y criterios de elegibilidad
Para la selección de publicaciones de esta revisión, por un lado, se consideraron los siguientes criterios de inclusión: (1) trabajos empíricos que reportan el uso de instrumentos para evaluar habilidades de lectura o escritura, (2) estudios con población de los primeros grados de escuela primaria (i.e. 1ero, 2do y 3er grado de Argentina o equivalente), (3) con niñas y niños de desarrollo típico cuya L1 es el español, (4) en el contexto latinoamericano, (5) cuyos resultados fueron publicados en el período 2000-2024. Además, se consideraron los siguientes criterios de exclusión: (1) trabajos que reportaran instrumentos implementados con población localizada fuera de América Latina o cuya L1 no fuera el español, (2) trabajos con población infantil con trastornos del desarrollo o dificultades del aprendizaje que no incluyeran grupos de control de desarrollo típico.
Por otro lado, se utilizó un enfoque de dos pasos: una vez detectados y eliminados los registros duplicados, a partir del título y el resumen se verificó el cumplimiento o no de los criterios de inclusión. Esta primera selección se llevó a cabo mediante el software Rayyan (Ouzzani et al., 2016). De manera inicial, el 10 % de los registros fue doblemente codificado por la primera y la segunda autora. Para determinar la concordancia más allá del azar, se calculó el coeficiente kappa de Cohen, cuyo valor fue de 0.19, lo que indica un leve grado de acuerdo (Landis & Koch, 1977). Sin embargo, el porcentaje de acuerdo observado fue del 86 %, lo cual sugiere un nivel aceptable de coincidencia en las decisiones tomadas. Cabe señalar que el coeficiente kappa puede subestimar el grado real de acuerdo en contextos con casos ambiguos (Feinstein & Cicchetti, 1990). En esta etapa preliminar, la evaluación se realizó sobre títulos y resúmenes que, en muchos casos, no ofrecían información suficiente para aplicar la totalidad de los criterios de inclusión, lo que afectó el valor de kappa a pesar de que muchas decisiones fueron razonables desde ambos puntos de vista. Todos los casos en que hubo desacuerdo inicial fueron cuidadosamente revisados mediante el diálogo, con la participación y supervisión de la tercera autora. Una vez resueltos estos casos y clarificados los criterios de inclusión, la primera y la segunda autoras evaluaron los registros restantes de manera independiente.
Luego, se llevó a cabo una lectura a texto completo de las publicaciones seleccionadas por título y resumen a fin de volver a verificar que se cumplieran todos los criterios establecidos. En esta segunda selección, se excluyeron 26 estudios que no reportaban el uso de instrumentos para evaluar habilidades de lectura o escritura: en algunos casos se trataba de estudios teóricos (p. ej., de revisión: Arrimada et al., 2020; Piacente & Titarelli, 2008; Porta, 2008) y en otros, de estudios empíricos en los que se indaga el desempeño en lectura y escritura pero o bien se mide de forma indirecta (p. ej., a través de cuestionarios destinados a docentes y familias y de los cuadernos de clase de las y los estudiantes, Bazán Ramírez et al., 2007) o bien no se reporta con suficiente detalle cuáles son los instrumentos utilizados (p. ej., Chiappe & González, 2014). También se excluyeron 18 estudios implementados con estudiantes de segundo ciclo de educación primaria (p. ej., Ferroni, 2020; Villalonga et al., 2014), cuatro llevados a cabo fuera de América Latina (p. ej., en Estados Unidos: Swanson et al., 2021) y un estudio desarrollado con población hablante de portugués (Rodrigues & Postalli, 2019).
Análisis de los estudios incluidos
En primer término, a fin de realizar un análisis descriptivo de las principales características de los estudios incluidos, considerando su frecuencia y distribución, se construyó una hoja de cálculo en la que, para cada publicación, se consignaron las siguientes categorías: año de publicación, país de implementación, grados o edades de los participantes evaluados e instrumentos utilizados. En segundo lugar, se procedió a caracterizar cada uno de los instrumentos identificados considerando las siguientes dimensiones: habilidades evaluadas, cantidad de pruebas y aspectos que valoran, tiempo total y modalidad de administración, población destinataria, ámbito -clínico o educativo- de aplicación y existencia de estudios psicométricos. Asimismo, se contabilizó el número de estudios que reportan el uso de cada instrumento. La codificación de todas las categorías fue efectuada en conjunto por las tres autoras.
Resultados
La búsqueda realizada en las bases de datos resultó en un total de 2.503 registros, a los que se añadieron 15 más a través de la búsqueda adicional. En la Figura 1 se puede observar en detalle el diagrama del enfoque de dos pasos utilizado para la selección de artículos, que derivó en la inclusión de 92 publicaciones que cumplieron con los criterios de inclusión.
Características generales de los estudios revisados
La Figura 2 ilustra la frecuencia de los estudios revisados a lo largo del tiempo, representada por el año de publicación. A partir del año 2010, hubo un aumento en el número de publicaciones, que asciende de uno o dos por año a cinco. Entre 2010 y 2023 -a excepción de 2019- la cantidad anual de publicaciones se mantuvo relativamente estable, oscilando entre cuatro y ocho publicaciones por año.
En cuanto a la distribución por país de los estudios incluidos, Argentina representa el mayor número de publicaciones, con un total de 22 (Tabla 1). Le siguen Chile, Colombia y México, que junto con Argentina representan el 72 % de los estudios incluidos en la revisión. En los estudios restantes, la población evaluada proviene, en orden decreciente, de Perú, Uruguay, Costa Rica, Ecuador, Guatemala, Cuba, Honduras y Nicaragua. En los estudios en los que se informa el curso escolar, además de la edad, se constata que la población evaluada se distribuye de manera equilibrada entre 1ero (n= 44), 2do(n= 42) y 3er grado (n= 41).
Tabla 1: Países de los estudios revisados

Nota: La cantidad de publicaciones totaliza 98 (en lugar de 92), dado que cuatro estudios (Bazán & Gove, 2010; Cuadro et al., 2023; García de la Cadena et al., 2014; Querejeta et al., 2013) reportan la evaluación de estudiantes procedentes de diversos países, por lo que fueron contabilizados más de una vez.
En cada estudio se suele utilizar más de un instrumento a fin de evaluar diversos aspectos implicados en la lectura o la escritura. En 13 publicaciones (Diuk, Borzone et al., 2009; Diuk, Ferroni et al., 2017; Ferroni & Diuk, 2014; Ferroni et al., 2016a; Gonzaga Betancurth, 2021; Jaichenco & Wilson, 2013; León et al., 2022; Marder, 2011; Nava Martínez, 2021; Porta et al., 2021; Sánchez-Abchi et al., 2007, 2009; Sánchez-Hernández et al., 2009) se reporta el uso de instrumentos diseñados ad hoc por las y los investigadores -principalmente para evaluar habilidades de escritura-. En 16 estudios (Alpuche Hernández & Vega Pérez, 2014; Begeny, 2019; Begeny et al., 2012; Bravo-Valdivieso et al., 2006a, 2006b; Carpio-Brenes, 2014; Chacón Lacera, 2022; Coloma, Pavez et al., 2012; Coloma, De Barbieri et al., 2020; Coloma, Silva et al., 2015; González Hernández et al., 2016; Hudson et al., 2013; Infante et al., 2012; Pino & Bravo, 2005; Riffo et al., 2018; Tapia Pérez et al., 2017) se utilizan instrumentos que no son de libre acceso ni se encuentran disponibles para su consulta.11 Finalmente, en 70 publicaciones se reporta el uso de 23 instrumentos de evaluación que, por resultar accesibles, se sistematizan a continuación.
Instrumentos de evaluación de la alfabetización inicial en español
En la Tabla 2 .se identifican los instrumentos revisados, que se presentan listados de acuerdo con la habilidad -lectura o escritura- que evalúan. Para cada instrumento, se consignan los autores y población destinataria según curso escolar o edad y, asimismo, se indica la cantidad de estudios localizados en la presente revisión que reportan su uso con población latinoamericana hispanohablante que asiste a 1ero, 2do y 3er grado de educación primaria.
En la Tabla 3 se identifican los aspectos de la lectura y la escritura que son valorados de modo específico en 22 de los 23 instrumentos. Asimismo, se consignan las tareas con las que mayoritariamente se evalúan dichos aspectos. El programa ELEA fue el único que no se incorporó en la Tabla 3, debido a que evalúa, únicamente, el conocimiento del lenguaje escrito antes del inicio de la lectura formal a través de tareas de reconocimiento (nombres, días de la semana, relación entre números y cantidad de elementos, estructuras textuales a partir de textos orales).
Como puede observarse en la Tabla 3 ., los instrumentos revisados incluyen subpruebas que permiten evaluar habilidades de bajo y alto orden implicadas en la lectura y la escritura. En general, predominan las tareas que específicamente evalúan procesos de bajo nivel implicados en la decodificación -lectura- y en la transcripción -escritura-. En este sentido, las que se relevan con mayor frecuencia en los instrumentos identificados son las de lectura en voz alta de palabras (15 de 22 instrumentos), no-palabras (10/22) y textos (10/22), así como las de escritura al dictado de palabras (9/22) y oraciones (9/22). Asimismo, son frecuentes las tareas orientadas a evaluar conciencia fonológica (10/22) y principio alfabético (9/22). No obstante, 14 instrumentos también incluyen tareas de comprensión de textos.

Notas:1 Posee una tarea que es, al mismo tiempo, conciencia fonológica y principio alfabético. 2 Solo precisión. 3 Solo fluidez.
A continuación, se ofrece una síntesis de las principales características de los instrumentos identificados. Para ello, los instrumentos se agrupan de acuerdo con la habilidad -lectura o escritura- evaluada. Para cada agrupación, la síntesis da cuenta de los países de procedencia de los instrumentos, la existencia de estudios psicométricos, el ámbito de aplicación, el tiempo total y la modalidad de administración de las tareas. Además, se recaban particularidades de las tareas incluidas en algunos instrumentos, lo que complementa la información sintetizada en la Tabla 3.
Instrumentos que evalúan lectura
De los 23 instrumentos relevados, 10 evalúan procesos de lectura (Tabla 2). Estos instrumentos se emplean en 31 estudios localizados en la revisión (Balbi et al., 2020; Bazán & Gove, 2010; Bravo-Valdivieso et al., 2006a, 2006b; Cadavid-Ruiz, Quijano Martínez et al., 2016; Cannock & Suárez 2014; Cayhualla Quihui et al., 2011; China, 2018; Collazos-Campo et al., 2020; Costa Ball et al., 2011; Coveñas, 2020; Cuadro & Costa Ball, 2014; Cuadro et al., 2013, 2023; Ferroni, 2021; Flores Reyes & Moreira Mora, 2022; Galicia Moyeda et al., 2015; García de la Cadena et al., 2014; Gómez Pérez et al., 2011; Lara-Díaz et al., 2010; Marchant et al., 2007; Parrales Robles & Vidaurre Andía, 2023; Pearson, 2012; Pearson, Siegel et al., 2013, Pearson, Juárez et al. 2023; Pino & Bravo, 2005; Quezada et al., 2023; Ramírez-Calixto et al., 2020; Rosas et al., 2011; Vásquez & Muñetón, 2023; Zugarramurdi et al. 2022). A la hora de evaluar habilidades específicamente implicadas en la lectura, el instrumento utilizado con mayor frecuencia es el PROLEC/PROLEC-R, cuyo uso se reporta en un tercio de estos estudios.
En relación con los países de procedencia, uno fue elaborado en Argentina (Batería JEL), uno en Uruguay (Lexiland), tres en Chile (ABCDeti, ELEA y Pruebas de Dominio Lector) y uno fue diseñado en conjunto por dos países: Chile y Uruguay (ELFE II). Tres instrumentos (PROLEC/PROLEC-R, TECLE y SICOLE/SICOLE-R), que fueron elaborados en España, reportan investigaciones que han utilizado el instrumento en población de habla hispana latinoamericana (SICOLE/SICOLE-R) o adaptaciones. En el caso del PROLEC/PROLEC-R, la adaptación fue hecha en Perú (Cayhualla Quihui et al., 2011), y en el caso del TECLE, en Uruguay (Cuadro & Costa-Ball, 2020) y Argentina (China, 2018). Finalmente, un instrumento (EGRA/ELGI) fue elaborado por una agencia de un organismo internacional (Banco Mundial). Todos los instrumentos presentan estudios psicométricos, ya sea de validez, de confiabilidad o baremos.
Además, todos tienen aplicación educativa y, en algunos casos (ABCDeti, JEL, Lexiland, PROLEC/PROLEC-R), también son de uso clínico. La extensión de los instrumentos, tanto en cantidad de pruebas como en el tiempo que insume su administración, es variada. Se han relevado herramientas que cuentan con una sola tarea (Dominio lector, TECLE), cuyo tiempo de administración es de entre 1 y 5 minutos, hasta herramientas que cuentan con 13 tareas, cuyo tiempo de administración es de alrededor de media hora (ABCDeti).
En la Tabla 3 se consignan las habilidades evaluadas por cada herramienta. En relación con la conciencia fonológica, se observan diferentes tareas. ABCDeti posee una tarea de segmentación de sílabas y dos de reconocimiento (de sonido inicial y final y de sílaba inicial y final). La Batería JEL contiene tareas de omisión y sustitución de sonidos, de deletreo y de composición de palabras por el nombre de la letra. EGRA presenta una tarea de identificación de sonidos inicial de palabra y otra de reconocimiento en la que se debe decidir qué dos palabras de un grupo de tres tienen el mismo sonido inicial. Lexiland evalúa las habilidades fonológicas a partir de cuatro tareas: segmentación, ensamblaje, emparejamiento por inicio de palabra y emparejamiento por rima. Finalmente, el PROLEC/PROLEC-R contiene dos tareas (una de identificación de nombres o sonidos de las letras2 y otra de decisión de pares de palabras iguales o diferentes destinada a evaluar la habilidad de segmentar e identificar las letras que componen cada palabra) y el SICOLE- SICOLE-R, cuatro: una de aislamiento (seleccionar un dibujo de entre tres que comienza por el mismo fonema que la palabra que se escuchó), una de síntesis (unir fonemas que se presentan para formar una palabra), una de omisión (decir cómo queda una palabra que escucha si se elimina el fonema inicial) y una de segmentación. Respecto del conocimiento del principio alfabético, las tareas se centran en el reconocimiento del nombre de las letras y el reconocimiento de grafemas.
La fluidez y precisión lectora es evaluada en todos los instrumentos revisados. En el caso del PROLEC/PROLEC-R, una de las diferencias entre ambas ediciones es que el PROLEC evalúa solamente la precisión en lectura de palabras y no-palabras (y no la fluidez); y el PROLEC-R evalúa tanto precisión como fluidez. Dos instrumentos se diseñaron exclusivamente para evaluar precisión y fluidez (Dominio lector y TECLE). Dominio lector posee una tarea para 1ro (que posee ocho oraciones) y otra tarea para 2do a 8vo (que posee fragmentos textuales). El TECLE es una tarea cronometrada que posee oraciones a las que les falta la última palabra y cuatro opciones de respuesta en cada una para completar.
En relación con la evaluación del vocabulario, el Lexiland es el único instrumento que incluye otra herramienta para evaluar ese aspecto (el Peabody de Dunn et al., 2006), en lugar de consignar nuevas tareas/estímulos. Finalmente, tres instrumentos (ABCDeti, Lexiland y SICOLE/SICOLE-R) poseen tareas de velocidad de denominación, y, además, el SICOLE/SICOLE-R posee tareas de procesamiento sintáctico (género, número, orden de palabras, palabras funcionales, estructura gramatical y signos de puntuación).
Instrumentos que evalúan escritura
Tres de los 23 instrumentos incluidos en la revisión, elaborados en Argentina (BEEsc), España (PROESC) y Uruguay (TEO), están específicamente orientados a la evaluación de la escritura (Tabla 2). Su uso se reporta en un total de cinco publicaciones (Acharte & Mendoza Martinez, 2012; Costa Ball et al., 2011; Cuadro & Costa Ball, 2014; Cuadro et al. 2013; Difalcis et al., 2022). Los tres instrumentos cuentan con baremos obtenidos con la población de cada país de procedencia. En el caso del PROESC, de origen español, se reporta una adaptación (Acharte & Mendoza Martinez, 2012) que dispone de un estudio de validez y baremación con población de Perú. A diferencia de la BEEsc, que dispone únicamente de baremos con población de Argentina, tanto el PROESC como el TEO cuentan con estudios psicométricos que incluyen medidas de validez y fiabilidad. Los tres instrumentos pueden administrarse de manera colectiva.
Sin embargo, mientras que el TEO es un instrumento de screening de alcance educativo cuya administración insume tres minutos, tanto la BEEsc como el PROESC, aplicables en los ámbitos clínico y educativo, son baterías compuestas por seis subpruebas que demandan entre 40 y 60 minutos de administración. La mayoría de las subpruebas de las dos baterías valoran aspectos vinculados con las habilidades de transcripción, desde el conocimiento de las reglas de correspondencia entre fonemas y grafemas hasta la competencia ortográfica y el uso de mayúscula inicial, acentuación y signos de puntuación. Para ello, las baterías incluyen subpruebas de dictado de sílabas, palabras, no-palabras y oraciones, así como también de copia de texto (Tabla 3). La BEEsc, además, incluye tres subpruebas que evalúan la velocidad grafomotora y una subprueba de dictado de texto para valorar competencia ortográfica, lo que conlleva algunas ventajas: además de constituir una situación de escritura más natural, permite poner en evidencia problemas ortográficos relacionados con la segmentación léxica que no se manifiestan en el dictado de palabras aisladas, que suele ser la tarea más frecuente para valorar habilidades de transcripción. Por su parte, el TEO valora específicamente la eficacia ortográfica, es decir, la precisión y velocidad en el reconocimiento de palabras correctamente escritas, y dispone de una prueba complementaria de dictado de palabras (TEO-D) (Cuadro et al., 2013). Por último, las baterías también incluyen subpruebas de escritura productiva, orientadas a evaluar habilidades de planificación escrita en el nivel textual.
Instrumentos que evalúan lectura y escritura
Diez de los 23 instrumentos revisados valoran procesos tanto de lectura como de escritura (Tabla 2). Estos instrumentos se utilizan en un total de 39 estudios (Alsina Quintero et al., 2011; Balbi et al., 2020; Bohórquez Montoya & Quijano Martínez, 2014; Bravo-Valdivieso et al., 2006b; Cabrera, 2017; Cadavid-Ruiz, Quijano Martínez et al., 2016, Cadavid-Ruiz, Jiménez et al., 2019; Camarillo Salazar et al., 2021; Cardona Cardona & Cadavid Ruiz, 2013; Cardona Tangarife & Varela Cifuentes, 2017; Carpio-Brenes & Méndez Chacón, 2017, 2018; Coloma, De Barbieri et al., 2020; Coloma, Sotomayor et al., 2015; Crispin Lannes, 2013; De los Reyes Aragón et al., 2008; Diuk & Ferroni, 2012; Esquía Flores, 2022; Ferroni et al., 2016b; Fumagalli et al., 2017; Gómez Velázquez et al., 2010; González-Valenzuela et al., 2023; Guevara Benítez et al., 2008; Ison & Korzeniowski, 2016; Kim & Pallante, 2012; Martínez et al., 2023; Orozco Ospino, 2022; Pino & Bravo, 2005; Porta et al., 2021; Querejeta et al., 2013; Quijano et al., 2020; Sarmiento-Bolaños et al., 2016; Schnurbusch et al., 2018; Silva Maceda & Romero Contreras, 2017; Strasser et al., 2017; Torrado et al., 2018; Torres Morales & Granados Ramos, 2014; Urquijo, 2010; Urquijo et al., 2015). Los instrumentos utilizados con mayor frecuencia a la hora de evaluar aspectos implicados tanto en la lectura como en la escritura son tres: la ENI/ENI-2 (en el 31 % de los estudios de este grupo), el LEE (23 %) y la Batería III Woodcock Muñoz (18 %).
A excepción de la PAI, que es un instrumento de screening, cuya administración insume alrededor de 30 minutos, las herramientas agrupadas en esta categoría son baterías que constan de entre 3 y 79 subpruebas que se administran en un intervalo de entre una y tres horas y media. Mientras que cuatro baterías (BECOLE, Éxito Escolar, IDEA y LEE) permiten valorar específicamente procesos de lectura y escritura o habilidades matemáticas, cinco (Batería III Woodcock Muñoz, BENDE, ENI/ENI-2, ENLEF y EVALÚA-2) también evalúan otros dominios cognitivos, tales como la atención, la memoria y las funciones ejecutivas. Los instrumentos relevados son de aplicación individual, a excepción de BECOLE, EVALÚA-2 y PAI, que pueden administrarse de modo colectivo -con subpruebas específicas de implementación individual (p. ej., BECOLE: lectura en voz alta de texto; PAI: conocimiento del alfabeto)-. Algunos instrumentos (Batería III Woodcock Muñoz, BENDE, ENI/ENI-2, ENLEF, Éxito escolar, LEE) fueron diseñados para la detección de dificultades de aprendizaje en el contexto clínico, mientras que otros (BECOLE, EVALÚA-2, LEE, IDEA, PAI) se utilizan también o exclusivamente en el ámbito educativo.
En general, las herramientas agrupadas en esta categoría fueron elaboradas en América Latina y cuentan tanto con medidas de validez y confiabilidad como con baremos obtenidos con población de Argentina (LEE), Chile (BENDE), Colombia (ENI/ENI-2, ENLEF), México (ENI/ENI-2, IDEA) y Perú (PAI). Constituyen excepciones a esta generalización tanto Éxito Escolar, que no cuenta con medidas de validez, como tres de los instrumentos relevados que, si bien disponen estudios psicométricos, fueron baremados con población hispanohablante de Estados Unidos (Batería III Woodcock Muñoz) y de España (BECOLE, EVALÚA-2).
Las subpruebas incluidas en estos instrumentos permiten valorar diversos aspectos de la lectura (Tabla 3). En primer lugar, algunas valoran las habilidades de conciencia fonológica y el conocimiento del principio alfabético. Específicamente, se incluyen subpruebas de segmentación fonémica (LEE, PAI) y reconocimiento de sonido inicial o final (ENLEF, PAI). Además, hay subpruebas orientadas a evaluar el conocimiento de las letras (Batería Woodcok Muñoz, ENLEF, Éxito Escolar, LEE, PAI) y la conciencia de lo impreso (PAI). En segundo lugar, se incluyen subpruebas que valoran el conocimiento del vocabulario y el acceso léxico mediante tareas de emparejamiento de palabras con imágenes o con sus definiciones y tareas de decisión léxica en las que se debe determinar si cada estímulo presentado es o no una palabra. La mayoría de los instrumentos permite evaluar fluidez y precisión lectora; para ello, se incluyen tareas de lectura en voz alta de diversos tipos de estímulos, desde sílabas, palabras y no-palabras hasta oraciones y textos. El BECOLE, asimismo, incluye pseudohomófonos. El LEE, específicamente, proporciona una valoración específica de la prosodia, a través de la lectura y la comprensión de pares de oraciones que contienen las mismas palabras, pero difieren en los signos de puntuación. Algunos instrumentos (BECOLE, BENDE) también permiten valorar la comprensión de estructuras gramaticales. Por último, hay instrumentos que constan de subpruebas de comprensión de oraciones y de textos (Tabla 3).
Para evaluar escritura, los diez instrumentos valoran habilidades de transcripción mediante subpruebas tanto de copia como de dictado de estímulos correspondientes a diferentes niveles lingüísticos, que abarcan desde letras y sílabas hasta textos (Tabla 3). Más allá de este punto en común, se presentan particularidades en las tareas y aspectos evaluados. La batería ENLEF consta de una tarea de escritura de grafemas a partir de sonidos. Además, en algunos instrumentos se valoran cualitativamente los aspectos grafomotores (BECOLE, EVALÚA-2) e incluso se evalúa el automatismo motor a través de la escritura del nombre (BENDE, ENI/ENI-2, PAI). Dos instrumentos miden la fluidez en la escritura mediante la cantidad de palabras escritas en un minuto (ENI/ENI-2) y la producción de oraciones a partir de imágenes y palabras en siete minutos (Batería III Woodcock Muñoz). Algunos instrumentos (como la BECOLE) también constan de ítems que valoran el conocimiento de las reglas de ortografía, el uso de signos de puntuación y la producción de estructuras sintácticas en el nivel oracional. Finalmente, otros evalúan dimensiones propias del nivel textual, como coherencia narrativa y la longitud del texto (ENI/ENI-2), estructuración narrativa (IDEA) o coherencia, cohesión, estructuración sintáctica y calidad textual (Batería III Woodcock Muñoz).
Discusión
En esta revisión se incluyeron 92 estudios empíricos en los que se reporta el uso de distintos instrumentos orientados a evaluar la lectura y la escritura en español con población latinoamericana en el último cuarto de siglo. América Latina es una región en la que aparecen indicadores de alarma en torno al desempeño en tareas que implican lectura y escritura (OCDE, 2023; UNESCO, 2022a), lo que pone de relieve la importancia de contar con una sistematización de las características más relevantes de los instrumentos que se utilizan en la investigación. En este sentido, a partir de los estudios incluidos, se identificaron 23 instrumentos, cuyo análisis pone de relieve algunas tendencias y abre la discusión hacia la proyección de futuros trabajos en el área.
En la gran mayoría de las publicaciones revisadas, la población evaluada proviene de Argentina, Chile, Colombia y México. Este resultado coincide con estudios previos que muestran que en estos cuatro países se concentra la investigación empírica en lectura y escritura en la escuela secundaria (Tonani & Chimenti, 2024), y la publicación de volúmenes especiales de revistas con foco en lectura y escritura en el nivel superior (Navarro & Colombi, 2022). Estos datos, en conjunto con los de la presente revisión, aportan pistas sobre los focos de desarrollo de iniciativas de investigación sobre alfabetización en América Latina.
El análisis de los 23 instrumentos identificados da cuenta de la complejidad de la lectura y la escritura en tanto constructos evaluados. Los instrumentos orientados a la evaluación de procesos de lectura constan de tareas que valoran los aspectos que la ciencia de la lectura (Abusamra, Chimenti & Tiscornia, 2021; Abusamra, Ferreres et al., 2022; Kim & Snow, 2021; National Reading Panel, 2000; Snow, 2021; Snowling et al., 2022) ha identificado como centrales para el aprendizaje de esta habilidad: conciencia fonológica, principio alfabético, fluidez lectora, vocabulario y comprensión lectora. En efecto, las tareas más frecuentes son las de lectura en voz alta -orientadas a valorar precisión o fluidez en la lectura de estímulos correspondientes a diversos niveles lingüísticos- y las de comprensión de textos. Asimismo, son frecuentes las tareas que valoran habilidades de conciencia fonológica y conocimiento del principio alfabético y comprensión de textos. Estos resultados coinciden, en parte, con los hallazgos reportados por Carvalho y Souza (2023) para la evaluación de la lectura en portugués en Brasil.
Por su parte, los instrumentos orientados a la evaluación de procesos de escritura constan de tareas que valoran los componentes que juegan un rol clave en su aprendizaje (Berninger et al., 2002; Berninger & Winn, 2008), con un evidente predominio de subpruebas orientadas a valorar las habilidades de transcripción en distintos niveles lingüísticos -en especial, en los niveles léxico y oracional mediante tareas de dictado-. No obstante, tal como se ha señalado en estudios previos (Buchanan et al., 2024), en términos comparativos es mayor la cantidad de tareas orientadas a la evaluación de la lectura que de la escritura.
De acuerdo con los resultados obtenidos en esta revisión, los instrumentos empleados con mayor frecuencia para evaluar lectura y escritura en población hispanohablante de los primeros grados de educación primaria son la Batería III Woodcok Muñoz, la ENI/ENI-2, el LEE y el PROLEC/PROLEC-R. Se trata de cuatro baterías de evaluación que incluyen diferentes subpruebas orientadas a valorar diversas habilidades implicadas en la alfabetización inicial. A excepción de cuatro instrumentos de screening (Pruebas de Dominio Lector, PAI, TECLE y TEO), los instrumentos incluidos en la revisión consisten en baterías que poseen varias tareas. En general, están orientados a la evaluación en el contexto escolar, aunque algunos (Batería III Woodcock Muñoz, BENDE, ENI/ENI-2, ENLEF) fueron específicamente diseñados para el ámbito clínico. Además, se recaban instrumentos que son adaptaciones -ya sea de una variedad del español a otra (PROESC, PROLEC/PROLEC-R y TECLE) o de otra lengua al español (ELFE II)- e instrumentos que no necesariamente cuentan con baremos obtenidos con población local (Batería III Woodcock Muñoz, BECOLE, EVALÚA-2, SICOLE/SICOLE-R).
Esto último abre la pregunta acerca de su grado de adecuación a las características culturales de las poblaciones evaluadas y a las particularidades lingüísticas y dialectológicas (Chela-Flores, 2023) de sus respectivas variedades del español. Tales particularidades son especialmente visibles en el nivel léxico. Dada la variedad y extensión geográfica de la lengua española, existen diferencias de vocabulario incluso entre variedades percibidas como próximas, como lo son la argentina y la uruguaya del español rioplatense (Ahumada, 2023; Coll & Resnik, 2018). En este sentido, considerar la procedencia de la población con la que se efectúa la baremación de un instrumento es un aspecto crucial en el contexto de su uso práctico, por ejemplo, cuando se busca comparar el desempeño de un niño o una niña con el recogido en los baremos para detectar eventuales dificultades.
Los hallazgos de la presente revisión, asimismo, ponen de manifiesto la necesidad de diseñar y validar instrumentos específicamente orientados a la evaluación de la escritura en español. Los resultados, en efecto, dan cuenta de un predominio de instrumentos que evalúan la lectura por sobre la escritura. Este desbalance replica la tendencia existente en el ámbito de la psicología cognitiva y la psicolingüística, en el que el abordaje de la escritura y, en particular, el desarrollo de instrumentos de evaluación de la escritura han quedado relegados frente a la preeminencia de la decodificación y la comprensión de textos (Miranda et al., 2020). En América Latina, además, las pruebas estandarizadas de escritura son menos frecuentes que las de lectura (Navarro et al., 2019; Zabaleta et al., 2016). Tal como se ha puesto de manifiesto en diversos estudios (p. ej., Döhla & Heim, 2016; Figueroa-Leighton et al., 2025; Miranda, 2019), durante el desarrollo es frecuente que los niños sean lectores proficientes antes de dominar la ortografía y sus inconsistencias. Por eso, es fundamental contar con instrumentos que permitan la evaluación de los aspectos involucrados en una habilidad tan compleja como es la escritura, para la cual persisten las dificultades, incluso más allá de los primeros grados de educación primaria.
La presente revisión muestra que es necesario continuar indagando la evaluación de las habilidades de nivel inferior implicadas en la lectura y la escritura, en especial con población hispanohablante de países latinoamericanos que no aparecen representados en los estudios identificados. Asimismo, sería relevante sistematizar de qué modo se evalúan las habilidades de nivel inferior en instrumentos dirigidos a estudiantes de 4to grado de educación primaria en adelante. Por último, en futuros estudios sería de interés examinar en detalle las propiedades psicolingüísticas de los estímulos empleados en los instrumentos, así como también comparar las características específicas de las tareas que en distintos instrumentos permiten valorar el mismo constructo.
Conclusiones
Una lectura comprensiva y una escritura debilitadas tienen serias repercusiones no solo en el plano educativo, sino también en el social. Este estudio puede constituir un aporte tanto para el ámbito de la investigación como para los ámbitos educativo y clínico. Conocer las características de los instrumentos de evaluación existentes puede contribuir al desarrollo de iniciativas teóricamente fundamentadas de seguimiento y monitoreo de la lectura y la escritura en el comienzo de la educación primaria en el ámbito educativo. Asimismo, es un punto de partida necesario tanto para el diseño de nuevos instrumentos como para la adaptación de los ya existentes en virtud de las características específicas de la población destinataria. En el contexto latinoamericano, es fundamental continuar desarrollando instrumentos fundamentados teóricamente que atiendan a las particularidades lingüísticas de las distintas variedades del español y que cuenten no solo con estudios psicométricos, sino también con baremos obtenidos con poblaciones locales. Esto último podría, a su vez, contribuir a la detección temprana de dificultades vinculadas con el lenguaje escrito.



















