parolescritte
interroga:  scripta  ·  bsu  ·  civita

il corpus scripta


esplorazioni verbali


invenzioni verbali


Tutti i gusti delle parole

Parole scialbe, parole vivide

Ho applicato sistematicamente la formula appena descritta a tutte le combinazioni possibili di lettere ‒ distinte o ripetute ‒ di una parola fino alla lunghezza di 21, ed ho ottenuto la seguente tabella.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
1 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
2 0,5 0,3 0,3 0,2 0,2 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,0
3 2,0 1,5 1,2 1,0 0,8 0,7 0,7 0,6 0,5 0,5 0,5 0,4 0,4 0,4 0,3 0,3 0,3 0,3 0,3
4 4,1 3,3 2,8 2,4 2,1 1,8 1,7 1,5 1,4 1,3 1,2 1,1 1,0 1,0 0,9 0,9 0,8 0,8
5 6,9 5,7 4,9 4,3 3,8 3,4 3,1 2,9 2,7 2,5 2,3 2,2 2,0 1,9 1,8 1,7 1,6
6 10,2 8,7 7,6 6,8 6,1 5,5 5,1 4,7 4,4 4,1 3,8 3,6 3,4 3,2 3,0 2,9
7 13,9 12,1 10,8 9,7 8,8 8,1 7,5 6,9 6,5 6,1 5,7 5,4 5,1 4,9 4,6
8 18,0 16,0 14,4 13,1 12,0 11,1 10,3 9,6 9,0 8,5 8,0 7,6 7,2 6,9
9 22,5 20,2 18,4 16,9 15,6 14,5 13,5 12,6 11,9 11,2 10,6 10,1 9,6
10 27,3 24,8 22,8 21,0 19,5 18,2 17,1 16,1 15,2 14,4 13,7 13,0
11 32,5 29,8 27,5 25,6 23,8 22,4 21,0 19,9 18,8 17,9 17,0
12 38,0 35,1 32,6 30,4 28,5 26,8 25,3 24,0 22,8 21,7
13 43,8 40,7 38,0 35,6 33,5 31,7 30,0 28,5 27,1
14 49,9 46,6 43,7 41,1 38,8 36,8 35,0 33,3
15 56,3 52,8 49,7 46,9 44,5 42,2 40,2
16 63,0 59,3 56,0 53,0 50,4 48,0
17 69,9 66,0 62,5 59,4 56,6
18 77,0 73,0 69,3 66,0
19 84,5 80,2 76,4
20 92,1 87,7
21 100,0

Bisogna subito dire che i valori dell'indice di varietà ‒ il sapore della parola ‒ sono approssimati alla prima cifra decimale per ragioni di ingombro della tabella, e quindi molti di essi appaiono uguali, ma in realtà non lo sono affatto: gli indici sono tutti diversi (alla quarta cifra decimale) ma in quantità finita, perché finito è il numero di possibilità consentito dalle varie combinazioni di lettere, distinte o ripetute.

Premesso questo si può esaminare nel dettaglio la tabella: i numeri nell'intestazione rappresentano la lunghezza della parola, mentre quelli della prima colonna rappresentano il possibile numero di lettere distinte. Questo spiega anzitutto il parziale popolamento: ogni parola non può avere evidentemente un numero di lettere distinte superiore al numero di lettere della parola.

Non dove stupire poi che la prima riga sia popolata interamente da zeri: una parola con tutte le lettere uguali ‒ che sia lunga una lettera soltanto, oppure ventuno ‒ non possiede alcun sapore. Ciò è conforme alla regola [A].

Consideriamo adesso la regola [B]. La parola alba possiede quattro lettere, di cui tre distinte; il suo indice, perciò, si colloca nell'intersezione fra la colonna 4 e la riga 3 e vale 1,5 (1,4677); osso, invece, si colloca nell'intersezione fra la colonna 4 e la riga 2 e vale 0,3 (0,2500). Nemmeno questa grande diversità fra gli indici deve stupire: in parole di sole quattro lettere, una lettera distinta in più o in meno comporta una notevole differenza.

Secondo la regola [C] lo stesso rapporto fra numero di lettere e numero di lettere distinte non è sufficiente a determinare l'indice di varietà: conta anche il valore assoluto del numero di lettere di cui è composta una parola. Vediamo: la parola sartoria possiede un rapporto pari a 0,75 (come alba) e mormorio possiede un rapporto pari a 0,5 (come osso). Tuttavia la prima ha un indice di 7,6 (7,6164), maggiore di 1,5, mentre la seconda ha un indice di 2,1 (2,0666), maggiore di 0,3. Si tratta di valori sensati, perché al crescere del numero di lettere di una parola cresce anche la difficoltà di trovarvi molte lettere distinte, e quindi un sapore più intenso, per attenersi alla metafora che sostiene tutto questo discorso.

Infine, il rispetto della regola [D] è di per sé evidente: una parola di ventuno lettere, che sarebbe tuttavia preferibile chiamare pangramma, non può che contenere ventuno lettere distinte, e questo ‒ almeno nella lingua italiana ‒ costituisce un limite invalicabile che merita dunque il valore dell'indice pari a 100.

Sapori comuni

Dopo tutte queste puntigliose spiegazioni forse a chi legge piacerebbe conoscere i sapori delle parole contenute nel corpus linguistico scripta. Il grafico tridimensionale orientabile che segue dovrebbe soddisfare qualitativamente questa curiosità.

Per realizzare il grafico mi sono regolato nel modo che segue: ad ogni valore contenuto nella tabella riportata sopra ho associato il numero di occorrenze delle parole con quel sapore, secondo quanto contenuto in scripta alla data del 24 settembre 2017. Per esempio, la parola sartoria, come detto, ha un sapore pari a 7,6 (7,6164), ma questo valore è condiviso da 30 796 parole, sicché ho potuto innalzare una colonna alta altrettante unità sulla cella della tabella che contiene il valore 7,6 (7,6164). E così per tutte le altre celle.

La cosa più sorprendente di questo grafico, secondo il mio parere, è la grande concentrazione di parole con alcuni indici di varietà in un'area molto limitata; per converso, la restante area di sapori, molto ampia, rimane praticamente piatta. Questa non significa una totale assenza di parole con quei sapori, ma comunque una enorme sproporzione rispetto a quelli più ricorrenti. Se il numero di parole come sartoria (6 lettere distinte su 8; S=7,6) è infatti pari a 30 796, quello di spregiudicatezza (12 lettere distinte su 16; S=28,5) precipita a 332.

Questa mi sembra una caratteristica molto interessante delle parole italiane, che io interpreto così: per quanto possa apparire ampia, o addirittura sterminata, la possibilità di escogitare parole nuove di questa lingua, una tale possibilità viene smentita dai dati oggettivi. In linea di principio, infatti, nulla impedisce che l'area piatta del grafico possa sollevarsi sensibilmente in futuro per una massiccia iniezione di neologismi nel lessico italiano; per gli evidenti fatti pregressi, tuttavia, la cosa appare molto improbabile: la gran parte di questi neologismi, infatti, andrebbe a depositarsi soprattutto nella minuscola area messa in rilievo nel grafico, lasciando ancora una volta semideserta la rimanente area.

Sapori esotici

Appurato l'interessante fatto messo in rilievo nel paragrafo precedente, può rimanere comunque la curiosità di conoscere parole dal sapore esotico ovvero, per uscire di metafora, parole che si depositano in numero esiguo, ma comunque non uguale a zero, nell'area piatta della grafico riportato sopra.

Per chi voglia lasciarsi pungere da tale curiosità ho preparato la maschera che segue, che limita tuttavia a 1000 il numero di parole ottenibili, nel caso si scelga una combinazione troppo affollata.

Cerca le parole con un numero di lettere pari a   ,  di cui distinte   ,

comprese fra la lettera     e la lettera   ,  fino a un massimo di 1000 parole.