Che cosa si può trovare?
Se c'è premura...
Chi vuole avere subito una risposta alla domanda del titolo può saltare subito alla pagina delle interrogazioni, senza leggere quello che segue.
Chi invece preferisce avere qualche ragguaglio preliminare sulle ricerche che si possono condurre nel corpus linguistico scripta deve sapere che vi sono tre linee di ricerca: per autori, per testi e per parole o espressioni.
Ricerca per autori
Gli autori presenti nel corpus appartengono tutti alla letteratura italiana, intesa nel senso più ampio di questa espressione, che va dal xiii secolo fino ad oggi.
Il testi prodotti da questi autori, pertanto, sono in buona parte opere di natura creativa, ma non mancano quelli di carattere scientifico, tecnico, filosofico, storico, religioso, politico, economico e giornalistico.
La tabella che segue è un esempio di quanto appena detto: comprende le collezioni più numerose di testi prodotti da un singolo autore (almeno 25 elementi) raggruppati per genere.
| n | autore | genere | testi |
|---|---|---|---|
| 1 | Guia Soncini | articolo di costume | 1000 |
| 2 | Benito Mussolini | discorso | 985 |
| 3 | Ercole Patti | recensione | 898 |
| 4 | Eugenio Scalfari | articolo di fondo | 429 |
| 5 | Italo Calvino | lettera | 309 |
| 6 | Fulvio Abbate | articolo di costume | 281 |
| 7 | Giuseppe Pontiggia | parere di lettura | 187 |
| 8 | Carlo Emilio Gadda | lettera | 182 |
| 9 | Umberto Eco | bustina di Minerva | 148 |
| 10 | Alberto Moravia | novella o racconto | 124 |
| 11 | Vittorio Alfieri | epigramma | 123 |
| 12 | Carlo Goldoni | commedia | 116 |
| 13 | Filippo Pananti | epigramma | 116 |
| 14 | Sandro Pertini | lettera | 112 |
| 15 | Federico Caffè | articolo di fondo | 110 |
| 16 | Giovanni Papini | novella o racconto | 105 |
| 17 | Dino Buzzati | articolo culturale | 100 |
| 18 | Vanda di Marsciano | lettera | 97 |
| 19 | Eugenio Corti | lettera | 91 |
| 20 | Ugo Betti | novella o racconto | 86 |
| 21 | Vitaliano Brancati | novella o racconto | 86 |
| 22 | Giorgio Manganelli | lettera | 86 |
| 23 | Giacomo Matteotti | lettera | 84 |
| 24 | Emilio Salgari | romanzo | 84 |
| 25 | Giuliano Gramigna | recensione | 79 |
| 26 | Fernanda Pivano | articolo di costume | 76 |
| 27 | Guido Gozzano | lettera | 70 |
| 28 | Roberto Saviano | articolo di fondo | 66 |
| 29 | Pietro Metastasio | libretto d'opera | 61 |
| 30 | Pietro Nenni | lettera | 60 |
| 31 | Pietro Citati | articolo culturale | 57 |
| 32 | Renato Serra | lettera | 53 |
| 33 | Sebastiano Timpanaro | saggio divulgativo | 51 |
| 34 | Tommaso Landolfi | elzeviro | 50 |
| 35 | Anna Banti | novella o racconto | 46 |
| 36 | [autore collettivo] | costituzione | 45 |
| 37 | Eugenio Pacelli | enciclica | 41 |
| 38 | Amalia Guglielminetti | lettera | 40 |
| 39 | Giorgio Scerbanenco | novella o racconto | 40 |
| 40 | Cesare Pavese | novella o racconto | 36 |
| 41 | Luigi Pirandello | commedia | 35 |
| 42 | Andrea Vitali | romanzo | 35 |
| 43 | Vincenzo da Filicaja | lettera | 35 |
| 44 | Felice Andreasi | monologo | 33 |
| 45 | Grazia Deledda | romanzo | 32 |
| 46 | Mario Appelius | discorso | 31 |
| 47 | Achille Ratti | enciclica | 31 |
| 48 | Aldo Bizzarri | recensione | 30 |
| 49 | Pier Paolo Pasolini | articolo di costume | 30 |
| 50 | Gioacchino Pecci | enciclica | 30 |
| 51 | Alessandro Volta | lettera | 28 |
| 52 | Anton Giulio Barrili | romanzo | 27 |
| 53 | Vincenzo Spinoso | novella o racconto | 25 |
Ricerca per testi
Il numero dei testi contenuti in scripta cresce di continuo, grazie ai sistematici versamenti. Non è possibile, però, ottenerne un elenco completo perché risulterebbe troppo lungo. Ho preferito, perciò, raggrupparli per genere. È possibile, comunque, cercare un testo in base a un frammento del titolo.
Ogni testo può essere esaminato singolarmente, per ricavare:
1. la percentuale delle parole in funzione delle rispettive lunghezze;
2. la percentuale dei periodi in funzione delle rispettive lunghezze;
3. la lista delle 100 occorrenze più numerose (sia completa, sia filtrata);
4. la percentuale delle parole comuni contenute nel Vocabolario di base.
Ricerca per parole o espressioni
Le parole contenute attualmente in scripta sono 327 633 780, distribuite su base cronologica secondo il grafico che segue:
Può risultare interessante anche conoscere come sono distribuite le parole in base alla classificazione dei testi. Una prima distinzione di massima è rappresentata nel grafico che segue.
Per testi letterari bisogna intendere poemi, romanzi, lirica e, in generale, i testi di invenzione. Ovviamente, per testi non letterari bisogna intendere i rimanenti.
Ci si può fare un'idea più precisa di questa suddivisione in base alla tabella che segue, la quale esplicita, in maniera quantitativa, una tabella più dettagliata.
| n | tipo di testo | numero di parole | percentuale |
|---|---|---|---|
| 1 | testo inclassificabile | 532 840 | 0,2 |
| 2 | testo espressivo | 7 635 026 | 2,3 |
| 3 | testo riferitivo con patto finzionale | 186 552 922 | 56,9 |
| 4 | testo riferitivo senza patto finzionale | 63 689 036 | 19,4 |
| 5 | testo dichiarativo | 8 600 112 | 2,6 |
| 6 | testo argomentativo debole | 19 988 255 | 6,1 |
| 7 | testo argomentativo forte | 34 374 749 | 10,5 |
| 8 | testo normativo condizionato | 4 589 625 | 1,4 |
| 9 | testo normativo non condizionato | 1 671 215 | 0,5 |
Si può interrogare il corpus sottoponendo vocaboli interi o frammenti iniziali di essi purché, in entrambi i casi, siano lunghi almeno quattro lettere.
Ho introdotto questa limitazione per evitare ricerche troppo gravose per la macchina. Esistono tuttavia delle parole brevi e assai comuni, come vita, per esempio, che produrrebbero egualmente una massa esagerata e, tutto sommato, inutile di risultati. Per questa ragione va anche detto che si possono ottenere solo i primi mille risultati di una ricerca e, siccome essi vengono presentati cronologicamente, questo significa che, volendo cercare la parola vita senza condizioni, si può venire a sapere quante volte Dante la impiega nella Vita nuova ma non quante volte la impiega Aldo Busi nel suo romanzo Vita standard di un venditore provvisorio di collant che è stato pubblicato nel 1985. Ciò non vuol dire che è impossibile ottenere questo risultato; per averlo è sufficiente condizionare la ricerca a un autore, a un genere letterario, oppure ad entrambi.
Si possono eseguire le ricerche sulle parole sia in forma compatta, ottenendo solo il numero di occorrenze, per un determinato criterio di ricerca, sia in forma verbosa, ricavando le cosiddette concordanze in contesto, ovvero tutte le occorrenze del caso inserite in un breve frammento del testo (cinque parole prima e cinque dopo) che le contiene. Anche in questo caso la ricerca incondizionata è ristretta ai primi mille risultati, ma è sempre possibile restringere la ricerca a un autore, a un genere letterario, oppure ad entrambi.
Nei limiti di quaranta caratteri è anche possibile eseguire una ricerca per le espressioni. Va segnalato il fatto che la ricerca è tanto più veloce quanto meno le parole che compongono le espressioni sono comuni. Una ricerca per «io non vedo l'ora», perciò, potrebbe essere molto lunga, mentre la risposta per «arzigogoli stiracchiati» dovrebbe essere pressoché istantanea.
Infine, va tenuto presente che per le espressioni non è possibile ottenere le concordanze in contesto, bensì solo il numero di volte che esse compaiono in un determinato testo.