Contare le parole dell'italiano
Un'idea che viene da lontano
Uno dei primi programmi informatici che ho scritto si chiamava Mescola e generava anagrammi. A partire da una data sequenza di lettere ‒ per esempio aacefilr ‒ produceva tutte le permutazioni della sequenza che si presentano ben formate nella lingua italiana.
Il programma avrebbe perciò scartato aacefilr e avrebbe ammesso falciare, ma avrebbe accettato anche calafrie, che non significa nulla, questo è vero, però suona bene in italiano, e magari potrebbe essere il nome di un piatto di pesce.
Il «Grande Vocabolario Fantastico delle Parole Possibili e Impossibili»
Siccome l'impresa non venne giudicata ignobile da una stimata rivista di informatica dell'epoca, che era «mc-microcomputer», Mescola fu pubblicato nei fascicoli di gennaio e febbraio del 1986, con un articolo di accompagnamento. Chi fosse interessato ai dettagli può trovarli nell'archivio in linea della rivista ai numeri 48 e 49. Qui voglio citare solo alcune righe dell'articolo.
Il ripiego è questo programma mescola, che è un generatore «assoluto» di anagrammi, in quanto esamina tutte le permutazioni delle lettere di una parola e stampa solo quelle che rispondono a certe regole di ortografia. Questo significa naturalmente che novantanove su cento di queste permutazioni sono sì leggibili, ma anche prive di significato, come se fossero state prelevate da quello sterminato volume che è il Grande Vocabolario Fantastico delle Parole Possibili e Impossibili.
Come si vede, io giudicavo il programma un ripiego, perché avrei desiderato scriverne uno che generasse veri anagrammi di senso compiuto, ma non me ne sentivo capace.
Una domanda, anzi due
A distanza di tanti anni, però, oggi quel ripiego mi appare fecondo di sviluppi. Mi domando, infatti, non solo quali siano queste parole, ma prima di tutto a quanto ammonta il loro numero. In altri termini:
prima domanda: qual è il numero ‒ se esiste ‒ di tutte le parole italiane ben formate, a prescindere dal loro significato?
A questa domanda, però, occorre subito affiancarne un'altra, più delicata. Per formare tale numero, infatti, concorrono le parole falciare e calafrie, come ho detto sopra, ma anche sequenze come abacadafagalamanapara, bababababa, e chilafalaspetti, le quali, quantunque ben formate, non hanno alcuna probabilità di entrare un domani nel lessico italiano, perché sono troppo lunghe, sono troppo ripetitive, oppure perché sono frasi. Dunque la seconda domanda può essere così formulata:
seconda domanda: qual è il numero delle parole italiane ben formate, a prescindere dal loro significato, che appaiano anche accettabili a un parlante italiano?
Le pagine seguenti sono dedicate alla ricerca di una ragionevole risposta a queste due domande.