Analiza matematică a literaturii
IT la inbox
08 Decembrie 2010, 08:00
De lingvistică matematică – disciplina care analizează fenomenele lingvistice cu ajutorul modelelor matematice – a auzit mai toată lumea. Mai puţin cunoscută e analiza matematică a literaturii. Cu ajutorul tehnologiei moderne IT se pot identifica modelele de gândire care au marcat anumite perioade din literatură.
Doi cercetători de la Universitatea americană George Mason se folosesc de statistica matematică pentru a analiza gândirea din perioada victoriană, analizând modul în care concepţiile despre viaţă şi societate se reflectă în literatura epocii. Ei au ales aproape 30 de cuvinte şi măsoară frecvenţa cu care apar în titlurile cărţilor de limbă engleză publicate în aşa numitul secol al 19-lea extins - în total peste 1,67 de milioane de titluri apărute între anii 1789 şi 1914. Setul de cuvinte căutate cuprinde printre altele noţiuni precum "Dumnezeu", "industrial", "ştiinţă", "muncă" sau "dragoste". The New York Times, care a publicat un material pe acest subiect, a prezentat şi câteva dintre statisticile realizate de Dan Cohen şi Fred Gibbs. Cuvântul "creştin", de pildă, apare între 1830 şi 1850 într-o proporţie de aproape 2% dintre titlurile analizate, dar frecvenţa sa scade la sub 0,5% în următorii ani – semn pentru o criză a conştiinţei religioase. Iar noţiunea de "industrial" apare prima dată prin 1830 şi are apoi o apariţie modestă, dar constantă în următoarea perioadă, ceea ce coincide cu revoluţia industrială asociată cu perioada de sfârşit de secol al 19-lea.
Analiza titlurilor este doar prima fază – urmează acum munca sisifică de procesare a textelor integrale. Oricât de interesant ar părea acest proiect dezvoltat sub oblăduirea Google, el nu e lipsit de critici, pentru că există pericolul ca simpla analiza statistică să piardă din vedere aspecte calitative.