Método
A regra dos 95%: por que a dificuldade é o jogo inteiro
Para ler com conforto em um novo idioma, você precisa já conhecer quase todas as palavras da página. Esse único fato — e o volume que ele implica — é o coração do aprendizado pela leitura, e a razão pela qual o StepText funciona do jeito que funciona.
Pegue um romance em um idioma que você está aprendendo antes de estar pronto e você já sabe o que vai acontecer. Você traduz a primeira frase como um quebra-cabeça, procura quatro palavras na segunda e, em silêncio, fecha o livro na terceira. Não foi uma falha de motivação. Foi uma falha de cobertura — e a cobertura é a ideia mais útil do aprendizado pela leitura de que quase ninguém fora da pesquisa fala.
Quantas palavras você precisa conhecer
"Cobertura" é a parcela das palavras de uma página que você já conhece. A descoberta fundadora aqui vem do estudo de 2000 de Marcella Hu e Paul Nation: para uma leitura confortável e independente — do tipo que você faz por prazer, sem dicionário — você precisa conhecer cerca de 98% das palavras corridas. Em torno de 95% é um mínimo viável com algum esforço; caia para 90% e a compreensão desmorona.
Essas porcentagens soam abstratas até você transformá-las em palavras desconhecidas. Com 95% de cobertura, uma palavra em cada vinte é nova — mais ou menos uma por linha, cerca de vinte por página. Esse é o limite superior do tolerável. Com 98%, é uma palavra em cada cinquenta — algumas por página — poucas o suficiente para que você as adivinhe pelo contexto e siga em frente. A distância entre "exaustivo" e "prazeroso" é chocantemente estreita, e se mede em alguns pontos percentuais de vocabulário.
Uma nota de rodapé honesta, porque prometemos honestidade: o número preciso de 98% vem de um estudo com 66 universitários, e uma replicação de 2023 não conseguiu reproduzi-lo por completo. Trate-o como uma forte regra prática, não como uma lei da física. O formato da descoberta — a compreensão depende de conhecer a grande maioria das palavras e despenca abaixo disso — é sólido. O número exato é uma diretriz.
O que isso significa em vocabulário real
Quão grande precisa ser um vocabulário para ter 95–98% de cobertura? Para textos gerais, os pesquisadores estimam cerca de 3.000 a 5.000 famílias de palavras para chegar a ~95%, e por volta de 8.000 a 9.000 para chegar à zona de conforto de ~98%. São muitas palavras — e isso explica por que o salto de "estudei o básico" para "consigo ler um livro de verdade" parece tão enorme. Não é que esteja faltando um truque. Estão faltando vários milhares de palavras, e há apenas uma forma eficiente de obtê-las.
O problema do ovo e da galinha que a leitura resolve — e cria
Aqui está o impasse. A melhor forma de aprender esses milhares de palavras é ler muito, porque as palavras são em grande parte aprendidas ao encontrá-las em contexto, vez após vez. Mas você não consegue ler muito até já conhecer milhares de palavras. A cobertura é ao mesmo tempo a recompensa da leitura e a sua taxa de entrada.
A saída de emergência tradicional é o leitor graduado: um livro escrito com um vocabulário controlado, de modo que a cobertura permaneça alta o suficiente para ser compreensível enquanto ainda estica você um pouco. Funciona exatamente pelo princípio acima — mantenha as palavras desconhecidas esparsas, deixe algumas para adivinhar, deixe a própria leitura ensiná-las. O famoso slogan de Krashen para o ponto ideal é "i+1": entrada um pouco além do seu nível atual. A cobertura é o que "um pouco além" de fato significa em números.
Quanta leitura é realmente necessária
É aqui que a pesquisa fica revigorante. Paul Nation calculou quanto texto você precisaria para encontrar as 9.000 famílias de palavras mais frequentes vezes suficientes para aprendê-las — e a resposta varia de algumas centenas de milhares de palavras para as faixas comuns até alguns milhões de palavras para as mais raras. Em livros, isso fica em algum ponto entre dois e vinte e cinco romances de leitura. Separadamente, um estudo de Beglar & Hunt descobriu que os aprendizes que de fato ficaram mais rápidos na leitura tinham lido na ordem de 200.000 palavras em um ano.
Duas coisas decorrem disso. Primeira: a leitura realmente consegue entregar o vocabulário de um idioma sozinha — o volume existe, é alcançável. Segunda: o volume é grande, e as palavras mais raras exigem uma quantidade genuinamente enorme de texto. Não há versão disso em que vinte minutos de toques na tela levem você até lá. A tarefa é tornar uma grande quantidade de leitura compreensível algo que você realmente vá fazer.
Por que as palavras vêm devagar e em pedaços
Também ajuda saber que o vocabulário não chega em um único momento limpo. O trabalho sobre repetição de Stuart Webb mostra que um par de encontros inicia o processo, cerca de dez constroem um conhecimento parcial, e pode levar vinte ou mais antes de você conhecer de forma confiável a grafia, o significado e a gramática de uma palavra, tudo de uma vez. Um estudo de caso de Pigada & Schmitt descobriu que a forma de uma palavra (como ela é grafada) gruda rápido, enquanto o seu significado leva muitos outros encontros. A leitura é um processo lento, parcial e cumulativo — que é exatamente por que ela precisa ser de alto volume e confortável o suficiente para se sustentar.
Onde o StepText entra
Agora o projeto inteiro faz sentido. A parte difícil do aprendizado pela leitura é o penhasco da cobertura: o texto autêntico está longe demais acima da linha dos 95% para ser legível, e os leitores graduados acabam se esgotando. A mescla do StepText é uma forma de fabricar boa cobertura sob demanda. Começamos um texto majoritariamente em um idioma que você já conhece — cobertura perto de 100% por construção — e então tecemos o idioma-alvo nele em um nível que você escolhe, de modo que a parcela desconhecida sobe suavemente em vez de toda de uma vez. Você está sempre lendo na faixa compreensível, e a faixa se move com você.
É também por isso que a proporção é ajustável e por que ela sobe com o tempo. Não estamos decorando o texto; estamos ajustando sua dificuldade para manter você logo além do limite do que você conhece — o lugar onde, como a pesquisa não para de nos dizer, o aprendizado de fato acontece.
Nada disso é um atalho. O volume ainda precisa ser lido; as palavras ainda chegam devagar e em pedaços. O que a calibração compra para você é a capacidade de continuar — de ler os dois a vinte e cinco livros sem bater na parede na página três. No aprendizado pela leitura, a dificuldade não é uma variável entre muitas. É o jogo inteiro.
Fontes
- Hu, M. & Nation, P. (2000). Unknown Vocabulary Density and Reading Comprehension. Reading in a Foreign Language 13(1).
- Kremmel, B. et al. (2023). Replicating Hu & Nation (2000). Language Learning.
- Nation, I.S.P. (2014). How much input do you need to learn the most frequent 9,000 words? Reading in a Foreign Language 26(2).
- Beglar, D. & Hunt, A. (2014). Pleasure reading and reading rate gains. Reading in a Foreign Language 26(1).
- Webb, S. (2007). The Effects of Repetition on Vocabulary Knowledge. Applied Linguistics 28(1).
- Pigada, M. & Schmitt, N. (2006). Vocabulary acquisition from extensive reading: a case study. Reading in a Foreign Language.
- Krashen, S. The Case for Comprehensible Input.