parole scritte
interroga:  SCRIPTA  ·  BSU  ·  CIVITA

la base di dati SCRIPTA


esplorazioni verbali


invenzioni verbali


Mettere le parole al loro posto

Il «Vocabolario minimo» alla prova

Per testare la bontà del Vocabolario minimo ho pensato che una delle bellissime favole moderne di Gianni Rodari poteva rappresentare un ottimo banco di prova. Lo favole di Rodari sono testi semplici ma non banali, scritti con cura per essere compresi dai bambini e quindi mi aspettavo che, almeno in linea di principio, nessuna delle parole impiegate dall'autore risultasse sconosciuta al Vocabolario minimo.

Ecco perciò il testo di Alice Cascherina, contenuto nella raccolta Favole al telefono, con le parole, che il Vocabolario minimo non ha riconosciuto, messe in evidenza.

Questa è la storia di Alice Cascherina, che cascava sempre e dappertutto.

Il nonno la cercava per portarla ai giardini:

- Alice! Dove sei, Alice?

- Sono qui, nonno.

- Dove, qui?

- Nella sveglia.

Sì, aveva aperto lo sportello della sveglia per curiosare un po', ed era finita tra gli ingranaggi e le molle, ed ora le toccava di saltare continuamente da un punto all'altro per non essere travolta da tutti quei meccanismi che scattavano facendo tic-tac.

Un'altra volta il nonno la cercava per darle la merenda:

- Alice! Dove sei, Alice?

- Sono qui, nonno.

- Dove, qui?

- Ma proprio qui, nella bottiglia. Avevo sete, ci sono cascata dentro.

Ed eccola là che nuotava affannosamente per tenersi a galla. Fortuna che l'estate prima, a Sperlonga, aveva imparato a fare la rana.

- Aspetta che ti ripesco.

Il nonno calò una cordicina dentro la bottiglia, Alice vi si aggrappò e vi si arrampicò con destrezza. Era brava in ginnastica.

Un'altra volta ancora Alice era scomparsa. La cercava il nonno, la cercava la nonna, la cercava una vicina che veniva sempre a leggere il giornale del nonno per risparmiare quaranta lire.

- Guai a noi se non la troviamo prima che tornino dal lavoro i suoi genitori, - mormorava la nonna, spaventata.

- Alice! Alice! Dove sei, Alice?

Stavolta non rispondeva. Non poteva rispondere. Nel curiosare in cucina era caduta nel cassetto delle tovaglie e dei tovaglioli e ci si era addormentata. Qualcuno aveva chiuso il cassetto senza badare a lei. Quando si svegliò, Alice si trovò al buio, ma non ebbe paura: una volta era caduta in un rubinetto, e là dentro sì che faceva buio.

"Dovranno pur preparare la tavola per la cena, - rifletteva Alice. - E allora apriranno il cassetto". Invece nessuno pensava alla cena, proprio perché non si trovava Alice. I suoi genitori erano tornati dal lavoro e sgridavano i nonni: - Ecco come la tenete d'occhio!

- I nostri figli non cascavano dentro i rubinetti, - protestavano i nonni, - ai nostri tempi cascavano soltanto dal letto e si facevano qualche bernoccolo in testa.

Finalmente Alice si stancò di aspettare. Scavò tra le tovaglie, trovò il fondo del cassetto e cominciò a batterci sopra con un piede.

Tum, tum, tum.

- Zitti tutti, - disse il babbo, - sento battere da qualche parte.

Tum, tum, tum, chiamava Alice.

Che abbracci, che baci quando la ritrovarono. E Alice ne approfittò subito per cascare nel taschino della giacca di papà e quando la tirarono fuori aveva fatto in tempo a impiastricciarsi tutta la faccia giocando con la penna a sfera.

A prima vista le parole sconosciute sembrano parecchie, ma ad uno sguardo più attento non sono poi così numerose. Alice, Cascherina, Sperloga sono nomi propri, e quindi sono stati esclusi per principio dal Vocabolario minimo, benché il lemmario unico le contempli per parte di COLFIS. In definitiva, le parole sconosciute sono dodici, e sono elencate qui di seguito in ordine di rango.

forma lemma rango
arrampicò arrampicare 4302
Alice Alice 5643
curiosare curiosare 9461
taschino taschino 16046
destrezza destrezza 16438
ingranaggi ingranaggio 16506
tac tac 17437
merenda merenda 22151
impiastricciarsi impiastricciare 23781
affannosamente affannosamente 27070
bernoccolo bernoccolo 28485
galla galla 30054
Sperlonga Sperlonga 47102
Cascherina Cascherina 78193
eccola eccola inesistente

Bisogna sottolineare il fatto che il Vocabolario di base non contiene il verbo arrampicare (arrampicarsi), ma che purtroppo esso è rimasto escluso per un soffio anche dal Vocabolario minimo. Il sostantivo merenda, al contrario, è classificata come parola di alta disponibilità (AD) dal Vocabolario di base ma, sempre per un soffio, anch'essa è stata esclusa dal Vocabolario minimo, in base alle sue regole di costituzione.

Un po' di calcoli

Dodici parole neanche troppo rare, comunque, sembrano poche, anche per un testo breve come questo, sicché verrebbe voglia di dichiarare subito che la favola Alice Cascherina di Gianni Rodari è un testo semplice, forse semplicissimo, ma per poter affermarlo con cognizione di causa, e soprattutto con evidenza, occorre eseguire qualche calcolo.

L'idea di base è che un testo che presenta la massima semplicità possibile è costituito unicamente da parole contenute nel Vocabolario minimo. In questo caso il rapporto fra le parole riconosciute e le parole del testo vale 1. La formula per determinare questo rapporto R in forma percentuale è:

dove V rappresenta il numero di parole contenute nel Vocabolario minimo e P è il numero totale delle parole del testo.

Si può introdurre però una distinzione: le parole possono essere contate una per una, oppure una volta per tutte, nel caso, praticamente certo, che molte di esse si ripetano.
Faccio l'esempio di un aforisma - non proprio fulminante, bisogna ammetterlo - che impiega in modo esagerato la stessa parola, per chiarire gli effetti della distinzione:

Lo scontento rimugina. Rimugina... rimugina... e mentre rimugina dimentica che chi rimugina, spesso rimugina invano.

Applicando al testo la formula precedente si ottiene un rapporto R = 60%. Un rapporto così basso, ovvero così lontano dal 100%, che rappresenta la semplicità assoluta, significa che il testo non è affatto semplice. La ragione è chiara: la parola rimugina, che è l'unica a non appartenere al Vocabolario minimo, è presente ben sei volte in un testo di sole quindici parole.

Ma è sufficiente sostituire al verbo rimuginare il verbo brontolare, che invece appartiene al Vocabolario minimo, per ottenere R = 100%.

Lo scontento brontola. Brontola... brontola... e mentre brontola dimentica che chi brontola, spesso brontola invano.

Si tratta di una differenza esagerata, ma è chiaro che essa deriva dalla scelta di un esempio esagerato. Questa differenza, però, mette in rilievo un'altra differenza, più sottile, amplificata proprio dall'esempio.

Se si contano una volta soltanto le parole dell'esempio con il verbo rimuginare e si applica di nuovo la formula precedente, si ottiene un rapporto R = 90%. Questo valore sembra più equilibrato del precedente, perché c'è una sola parola sconosciuta al Vocabolario minimo in tutto il testo. Ma forse il nuovo valore è perfino troppo equilibrato, perché bisogna ammettere che chi non conosce quella parola non può comprendere il testo. Di nuovo, l'esempio esagerato amplifica la differenza. In casi estremi, dunque, il modo di contare le parole produce risultati molto discrepanti, mentre in casi più ragionevoli conduce a divergenze contenute, ma comunque significative.

Qual è, dunque, il metodo più affidabile per calcolare il rapporto? Quello che conduce al 60% (parole ripetute) o quello che conduce al 90% (parole distinte)?

Tutti e due, secondo me, e nessuno dei due. In ogni caso, è possibile ottenere entrambi, sia per l'uno che per l'altro esempio, e naturalmente per tutti gli altri testi presenti in SCRIPTA: sta poi a chi esegue l'interrogazione valutare le risposte. Io posso solo cercare di riassumere il discorso fatto fin qui, enumerando le interrogazioni che si possono rivolgere alla base di dati SCRIPTA riguardo alla semplicità dei testi che ospita.

Ottenere dati statistici con il «Vocabolario minimo»

Le parole dei testi presenti nella base di dati SCRIPTA possono essere confrontate con quelle del Vocabolario minimo. L'interrogazione produce in particolare tre risultati.

[1] la percentuale delle parole ripetute riconosciute dal Vocabolario minimo rispetto al numero totale delle parole contenute nel testo. In questo caso vengono contate tutte le occorrenze delle parole, comprese quelle ripetute.

Questo dato può dare un'idea di quanto un testo - in generale - si presenta semplice alla lettura; più alta è la percentuale, infatti, minore è il numero di parole rare o difficili variamente distribuite nel testo.

[2] la percentuale delle parole distinte riconosciute dal Vocabolario minimo rispetto al numero totale delle parole contenute nel testo. In questo caso ogni parola viene contata una sola volta, indipendentemente dal numero di ripetizioni che presenta.

Questo dato può suggerire il fatto che nel testo sono presenti parole rare o difficili, ma in maniera ripetuta, sicché la difficoltà generale del testo non è particolarmente alta, se la percentuale si attesta su un valore abbastanza elevato.

[3] il rapporto percentuale fra la percentuale calcolata con il metodo [2] e la percentuale calcolata con il metodo [1].

Questo dato costituisce un tentativo di comparare i risultati calcolati con le due precedenti percentuali; tenta infatti di mostrare se in un testo prevale l'uso di poche parole rare o difficili, molto ripetute (percentuale più alta), oppure l'uso di molte parole rare o difficile, poco ripetute (percentuale più bassa).