parolescritte
interroga:  scripta  ·  bsu  ·  civita

il corpus scripta


esplorazioni verbali


invenzioni verbali


Contare le parole dell'italiano

nota · ho spiegato nelle prime parole, che questo sito è un cantiere. il testo che segue, infatti, è concentrato sulla scrittura, ma ignora la fonologia, il che ha condotto a conclusioni in parte discutibili di cui sono consapevole.

Un'idea che viene da lontano

Uno dei primi programmi informatici che ho scritto generava anagrammi. A partire da una data sequenza di lettere, per esempio aoclrt, produceva tutte le permutazioni della sequenza e le stampava ordinatamente. Oggi la cosa appare piuttosto banale, ma all'inizio del 1986 non lo era poi tanto, almeno per due ragioni.

La prima ragione è che allora le macchine erano così lente che per affrontare compiti di calcolo combinatorio, come generare permutazioni, era quasi obbligatorio scrivere il codice direttamente in linguaggio macchina, una cosa piuttosto ardua negli anni Ottanta del secolo scorso. Si procedeva a vista, e la frustrazione era immensa quando il programma faceva a modo suo, peggio di un'oca distratta, senza che se ne capisse il perché.

La seconda ragione è che il programma, che avevo chiamato Mescola, non generava indistintamente tutte le permutazioni, ma solo quelle che si presentavano ben formate secondo le regole di composizione della lingua italiana, comprese quelle prive di significato. Avrebbe perciò scartato aoclrt, ma avrebbe riconosciuto trolca, che non significa nulla, questo è vero, però suona bene in italiano, e potrebbe essere il nome di quelle grosse ceste dove si raccoglie l'uva appena vendemmiata.

Il «Grande Vocabolario Fantastico delle Parole Possibili e Impossibili»

Siccome l'impresa non venne giudicata ignobile da una stimata rivista di informatica dell'epoca, che era «mc-microcomputer», Mescola fu pubblicato nei fascicoli di gennaio e febbraio del 1986, con un articolo di accompagnamento. Chi fosse interessato ai dettagli può trovarli dall'archivio in linea della rivista sui numeri 48 e 49. Qui voglio citare solo alcune righe dell'articolo.

Il ripiego è questo programma mescola, che è un generatore «assoluto» di anagrammi, in quanto esamina tutte le permutazioni delle lettere di una parola e stampa solo quelle che rispondono a certe regole di ortografia. Questo significa naturalmente che novantanove su cento di queste permutazioni sono sì leggibili, ma anche prive di significato, come se fossero state prelevate da quello sterminato volume che è il Grande Vocabolario Fantastico delle Parole Possibili e Impossibili.

Come si vede, io ritenevo il programma un ripiego, perché avrei preferito scriverne uno che generasse veri anagrammi di senso compiuto, ma non me ne sentivo capace. Detto di passaggio, l'impresa fu realizzata per la prima volta in Italia da Corrado Giustozzi, che nel 1996 mise in linea il suo Motore Anagrammatico del Gaunt, ancora in funzione.

Una domanda precisa

A distanza di tanti, però, anni il mio interesse per gli anagrammi veri e propri è un po' calato, mentre mi sono progressivamente incuriosito per tutti gli altri, vale a dire per quelli che, pur non avendo un senso compiuto, sono ben formati per la lingua italiana. Questa curiosità si è focalizzata in una precisa domanda: quante parole contiene il Grande Vocabolario Fantastico delle Parole Possibili e Impossibili?

In verità, quella denominazione oggi non mi soddisfa più. Adesso preferisco chiamarlo, in maniera più sobria, Elenco completo delle parole italiane ben formate. Anche la domanda, perciò, preferisco riformularla in maniera meno frivola:

Qual è il numero di parole che si possono definire italiane senza considerare il loro contenuto semantico?