← Artículos

Método

La regla del 95 %: por qué la dificultad lo es todo

Para leer con comodidad en un idioma nuevo, necesitas conocer de antemano casi todas las palabras de la página. Ese único hecho — y el volumen que implica — es el corazón del aprendizaje basado en la lectura, y la razón por la que StepText funciona como funciona.

Toma una novela en un idioma que estás aprendiendo antes de estar listo, y ya sabes lo que pasa. Traduces la primera frase como un rompecabezas, buscas cuatro palabras en la segunda y cierras el libro en silencio en la tercera. No fue un fallo de motivación. Fue un fallo de cobertura, y la cobertura es la idea más útil del aprendizaje basado en la lectura de la que casi nadie fuera de la investigación habla.

Cuántas palabras necesitas conocer

La "cobertura" es la proporción de las palabras de una página que ya conoces. El hallazgo fundacional aquí proviene del estudio de 2000 de Marcella Hu y Paul Nation: para una lectura cómoda e independiente — la que haces por placer, sin diccionario — necesitas conocer alrededor del 98 % de las palabras corrientes. En torno al 95 % es un mínimo viable con cierto esfuerzo; baja al 90 % y la comprensión se desmorona.

Esos porcentajes suenan abstractos hasta que los conviertes en palabras desconocidas. Con una cobertura del 95 %, una palabra de cada veinte es nueva — aproximadamente una por línea, unas veinte por página. Ese es el borde superior de lo tolerable. Con el 98 %, es una palabra de cada cincuenta — un par por página — las suficientemente pocas como para que puedas adivinarlas por el contexto y seguir avanzando. La distancia entre "agotador" y "disfrutable" es asombrosamente estrecha, y se mide en unos pocos puntos porcentuales de vocabulario.

Una nota honesta al pie, porque prometimos honestidad: la cifra precisa del 98 % proviene de un estudio de 66 universitarios, y una replicación de 2023 no pudo reproducirla del todo. Trátala como una regla general fuerte, no como una ley de la física. La forma del hallazgo — la comprensión depende de conocer la gran mayoría de las palabras, y se desploma por debajo de eso — es sólida. La cifra exacta es una orientación.

Qué significa eso en vocabulario real

¿Qué tamaño de vocabulario exige una cobertura del 95–98 %? Para textos generales, los investigadores estiman en torno a 3.000–5.000 familias de palabras para alcanzar ~95 %, y alrededor de 8.000–9.000 para alcanzar la zona de comodidad del ~98 %. Eso es muchísimas palabras, y explica por qué el salto de "estudié lo básico" a "puedo leer un libro de verdad" se siente tan enorme. No te falta un truco. Te faltan varios miles de palabras, y solo hay una forma eficiente de conseguirlas.

El problema del huevo y la gallina que la lectura resuelve — y crea

Aquí está el aprieto. La mejor manera de aprender esos miles de palabras es leer mucho, porque las palabras se aprenden sobre todo encontrándolas en contexto, una y otra vez. Pero no puedes leer mucho hasta que ya conoces miles de palabras. La cobertura es a la vez la recompensa de la lectura y su precio de entrada.

La salida de emergencia tradicional es el lector graduado: un libro escrito con un vocabulario controlado para que la cobertura se mantenga lo bastante alta como para ser comprensible mientras aún te exige un poco. Funciona exactamente según el principio anterior: mantén escasas las palabras desconocidas, deja unas pocas para adivinar, deja que la propia lectura las enseñe. El famoso lema de Krashen para el punto óptimo es "i+1": entrada un poco más allá de tu nivel actual. La cobertura es lo que "un poco más allá" significa de verdad en números.

Cuánta lectura hace falta de verdad

Aquí es donde la investigación se vuelve contundente. Paul Nation calculó cuánto texto necesitarías para encontrar las 9.000 familias de palabras más frecuentes las veces suficientes para aprenderlas, y la respuesta va desde un par de cientos de miles de palabras para las bandas comunes hasta unos pocos millones de palabras para las más raras. En libros, eso está en algún punto entre dos y veinticinco novelas de lectura. Por separado, un estudio de Beglar & Hunt halló que los aprendices que de verdad leían más rápido habían leído del orden de 200.000 palabras en un año.

Se siguen dos cosas. Primero: la lectura realmente puede aportar el vocabulario de un idioma por sí sola — el volumen existe, es alcanzable. Segundo: el volumen es grande, y las palabras más raras necesitan una cantidad de texto genuinamente grande. No hay ninguna versión de esto en la que veinte minutos de toques te lleven hasta allí. La tarea es hacer que una gran cantidad de lectura comprensible sea algo que de verdad vayas a hacer.

Por qué las palabras llegan despacio, y por partes

También ayuda saber que el vocabulario no llega en un único momento limpio. El trabajo de Stuart Webb sobre la repetición muestra que un par de encuentros inician el proceso, alrededor de diez construyen un conocimiento parcial, y pueden hacer falta veinte o más antes de que conozcas de forma fiable la ortografía, el significado y la gramática de una palabra todo a la vez. Un estudio de caso de Pigada & Schmitt halló que la forma de una palabra (cómo se escribe) se fija rápido, mientras que su significado requiere muchos más encuentros. La lectura es un proceso lento, parcial y acumulativo, que es precisamente la razón por la que necesita ser de gran volumen y lo bastante cómoda como para sostenerse.

Dónde entra StepText

Ahora todo el diseño cobra sentido. La parte difícil del aprendizaje basado en la lectura es el precipicio de la cobertura: el texto auténtico está demasiado por encima de la línea del 95 % para ser legible, y los lectores graduados acaban por agotarse. La mezcla de StepText es una forma de fabricar buena cobertura a demanda. Empezamos un texto mayormente en un idioma que ya conoces — cobertura cercana al 100 % por construcción — y luego entretejemos el idioma meta a un nivel que tú eliges, de modo que la proporción desconocida se eleve suavemente en lugar de toda de golpe. Siempre estás leyendo en la banda comprensible, y la banda se mueve contigo.

Por eso también la proporción es ajustable y por eso sube con el tiempo. No estamos decorando el texto; estamos ajustando su dificultad para mantenerte justo más allá del borde de lo que conoces — el lugar donde, según nos repite la investigación, ocurre de verdad el aprendizaje.

Nada de esto es un atajo. El volumen sigue habiendo que leerlo; las palabras siguen llegando despacio y por partes. Lo que la calibración te compra es la capacidad de seguir adelante — de poner las dos a veinticinco novelas sin estrellarte contra el muro en la página tres. En el aprendizaje basado en la lectura, la dificultad no es una variable más entre muchas. Lo es todo.

Fuentes

  1. Hu, M. & Nation, P. (2000). Unknown Vocabulary Density and Reading Comprehension. Reading in a Foreign Language 13(1).
  2. Kremmel, B. et al. (2023). Replicating Hu & Nation (2000). Language Learning.
  3. Nation, I.S.P. (2014). How much input do you need to learn the most frequent 9,000 words? Reading in a Foreign Language 26(2).
  4. Beglar, D. & Hunt, A. (2014). Pleasure reading and reading rate gains. Reading in a Foreign Language 26(1).
  5. Webb, S. (2007). The Effects of Repetition on Vocabulary Knowledge. Applied Linguistics 28(1).
  6. Pigada, M. & Schmitt, N. (2006). Vocabulary acquisition from extensive reading: a case study. Reading in a Foreign Language.
  7. Krashen, S. The Case for Comprehensible Input.