parolescritte
interroga:  scripta  ·  bsu  ·  civita

il corpus scripta


esplorazioni verbali


invenzioni verbali


Una funzione distributiva

Analisi in due dimensioni

La percentuale delle parole che contengono lettere che si trovano anche in quelle adiacenti entro un ragionevole intorno, al massimo di dieci posizioni, può essere assunta, in mancanza di meglio, come un sensato indice di varietà della distribuzione delle lettere in un testo scritto. Ma un singolo valore, di per sé, non ha un grande significato, soprattutto se non viene confrontato con altri valori comparabili. Per proseguire nel discorso iniziato, perciò, ho provato a calcolarlo in sequenza, relativamente a una determinata dimensione del gruppo di lettere ripetuto in corrispondenza di crescenti distanze fra le parole, scegliendo un certo numero di testi contenuti nel corpus. Qui di seguito riporto i risultati per quanto concerne le tre stesure de I promessi sposi.

Ho preso in considerazione un gruppo di tre lettere e poi ho determinato la percentuale di parole contenenti lo stesso gruppo a una distanza misurata da due parole al massimo, fino a una distanza limite di dieci parole.

Il primo dato di un certo interesse che appare subito è la grandissima regolarità con cui variano le percentuali in funzione della distanza massima fra le parole; non è un dato così sorprendente, d’altra parte, se si pensa che i calcoli sono stati eseguiti su un grande numero di parole. Le tre stesure, in effetti, contengono, in ordine cronologico, rispettivamente 223.042, 224.006 e 223.765 parole ciascuna.

I risultati, che possiedono un andamento così regolare, che si potrebbe riassumere facilmente con una funzione polinomiale abbastanza semplice, sembrano perciò riflettere più una regolarità intrinseca della lingua italiana che non una caratteristica specifica dell’opera considerata. Ma proprio per questo, allora, appaiono significative le piccole differenze messe in luce dal grafico.

Se ne può ragionevolmente desumere che la varietà delle parole nella prosa del Fermo e Lucia è inferiore a quella che si registra delle successive stesure, mentre il risciacquo dei panni in Arno, per stare alla celebre espressione usata da Manzoni per designare la revisione lessicale operata sull’ultima stesura, ha prodotto risultati di sostanza ma non di forma, dal momento che le curve relative a queste due stesure sono praticamente sovrapposte.

Analisi in tre dimensioni

Ci si può spingere oltre, nella ricerca di una varietà di distribuzione delle lettere che compongono le parole di un testo, e ricavare una rappresentazione in tre dimensione della funzione distributiva.

Quello riportato si riferisce ancora al Fermo e Lucia. Per ogni lunghezza dei gruppi di lettere sono state calcolate le percentuali di parole con ripetizioni in corrispondenza di tutte le distanze fra le parole, omettendo però i gruppi di due e tre lettere che avrebbero dato luogo a percentuali troppo alte, appiattendo così nel grafico la rappresentazione di tutte le altre.

Di nuovo, salta all’occhio la straordinaria regolarità dell’andamento, che lascia pensare a una funzione tridimensionale astratta, disegnata analiticamente dal computer, piuttosto che una serie di dati di provenienza sperimentale.

Detto questo, però, va anche aggiunto che il grafico è suggestivo ma povero di significato, perché andrebbe confrontato con altri grafici analoghi, eseguendo magari differenze algebriche sull’altezza delle diverse colonne, per giungere a disegnare possibili superfici delle divergenze fra testi più o meno affini, dotate forse di un certo interesse.

Una provvisoria conclusione

Insomma, le lettere dell’alfabeto non sono note musicali, e dunque una applicazione alla lettera del principio di composizione dodecafonica è assurdo: un testo verbale deve significare qualcosa, mentre la musica non significa nulla, ovvero significa solo se stessa, e ciò impone alle lettere, che compongono le parole, dei vincoli ai quali le note possono evitare di sottomettersi, a meno che non vengano impegnate per discutibili scopi di musica a programma.

Però l’idea resta affascinante e può essere applicata con la dovuta cautela, sebbene costituisca una perenne sfida alla chiarezza del significato che è indifferente ma pur sempre esposto al tedio delle ripetizioni, per scrivere testi di ariosa e appagante varietà.