1,721,072 research outputs found

    What's in a Topic Model? Critica teorica di un metodo computazionale per l’analisi del testo

    No full text
    Questo articolo si propone di affrontare criticamente, i fondamenti teorici di una nozione e di un metodo che sono oggi molto diffusi negli studi letterari computazionali: quella di topic modeling, ovvero l'individuazione statistico/probabilistica dei cluster lessicali che caratterizzano un insieme di testi, e l'analisi delle loro distribuzioni. Quando parliamo di fondamenti teorici ci riferiamo al ruolo che tale nozione può giocare nel contesto di una teoria del testo e di una metodologia della critica letteraria, e non ai suoi aspetti puramente matematici, che sono ovviamente saldamente basati sulla statistica e sulla teoria della probabilità bayesiana. Dopo una descrizione dei fondamenti tecnici della nozione di topic modelling si procederà a confrontare tale nozione con alcuni suoi possibili correlati in ambito teorico letterario, evidenziando i limiti di ogni possibile identificazione

    Distant reading in literary studies: a methodology in quest of theory

    Full text link
    Since Franco Moretti coined the successful term distant reading, quantitative/computational text analysis methods have gained wide circulation in literary studies. The diffusion of distant reading approaches has raised a lively debate and has attracted various criticisms, both from “traditional literary scholars” and from self-critical adopters. One important reason underlying these critical positions is the fact that it lacks sound and coherent rationales from the point of view of the theory: distant reading is the first methodology in literary studies that does not come with a theory of literature embedded in it. Consequently, all distant reading studies derive their theoretical frameworks and terms from literary theories that mostly rely on the notion that literary texts can be explained only by the way of interpretation. On what grounds, then, can we construct a theory of literature amenable to distant reading methods? I think that the better theoretical frameworks are the cognitive and bio-evolutionistic approaches to literature and cultural evolution studies. These theoretical approaches require a change in the level of description of the literary domain and justify the move from "interpretation" to "explanation" as the real aim of the scholarly inquiry

    La rappresentazione digitale del testo: il paradigma del markup e i suoi sviluppi

    Full text link
    La codifica elettronica dei testi rappresenta uno dei temi fondamentali della riflessione e della sperimentazione nel dominio dell’Informatica umanistica. Come è noto la soluzione considerata teoricamente ottimale e ampiamente diffusa nella pratica dalla comunità scientifica consiste nell’adozione dei markup language descrittivi basati su XML . Lo sviluppo e la diffusione della Text Encoding Initiative ha sancito questa scelta. XML può essere considerato sia un formalismo sia un modello di dati espresso da quel formalismo, e tale (meta)modello è appunto un albero ordinato etichettato. In altri termini XML considerato come linguaggio di modellizzazione può esprimere solo modelli la cui struttura è un albero. Il modello gerarchico si presta naturalmente a descrivere la struttura di numerosi livelli testuali scientificamente rilevanti: i livelli editoriale, morfosintattico, metrico, tanto per fare alcuni esempi, sono in linea generale descrivibili come strutture gerarchiche ordinate. I problemi emergono si pensa di eleggere XML a formalismo generale per la rappresentazione complessa dei testi in ambito umanistico e letterario. Le manifestazioni di queste difficoltà sono state comunemente rubricate come il problema delle gerarchie sovrapposte (overlapping hierarchies). Negli ultimi venti anni, proprio in parallelo con la diffusione di XML nel mondo dell’elaborazione testuale e della TEI nella comunità umanistica si sono moltiplicati i tentativi di trovare delle soluzioni definitive al problema. Le soluzioni proposte si possono dividere in due classi: soluzioni interne e soluzioni esterne al paradigma XML. Questo lavoro propone una analisi approfondita di queste soluzioni innovative e ne valuta la praticabilità in confronto a XML

    Sul distant reading: una visione critica

    No full text
    corecore