AI-Linguistica
Not a member yet
24 research outputs found
Sort by
Generati e rigenerati.: Uno studio preliminare sul trattamento di testi scientifici fra ChatGPT e abilità di studio
L’interazione tra uomo e macchina è entrata in una nuova fase dallo sviluppo dei Large Language Models, dal 2020 con GPT-3 e poi, soprattutto, dalla fine del 2022 con il rilascio dell’interfaccia conversazionale ChatGPT. Questi modelli hanno progressivamente acquisito un ruolo sempre più pervasivo in numerosi campi. Nel campo educativo le possibilità offerte dall’utilizzo di questi strumenti sono numerose, sebbene non manchino potenziali criticità. Il contributo si propone di esaminare il comportamento di ChatGPT 4o mini nell’esecuzione di tre tipi di task, legati alle abilità di studio, su testi scritti: riassunto, individuazione di punti chiave e semplificazione. I testi generati vengono successivamente analizzati dal punto di vista lessicale e sintattico, anche attraverso gli indici di leggibilità READ-IT. Tre tipologie di attività didattiche vengono dunque suggerite allo scopo di integrare l’intelligenza artificiale generativa nello sviluppo e mantenimento delle abilità di studio in ambito universitario.
The interaction between humans and machines has entered a new phase since the emergence of Large Language Models, starting with GPT-3 in 2020 and, more notably, with the release of the conversational interface ChatGPT at the end of 2022. These models have progressively taken on an increasingly pervasive role across numerous fields. In the educational domain, the possibilities offered using such tools are substantial, although potential challenges are not absent. This study aims to examine the behavior of ChatGPT 4o mini in performing three types of tasks related to study skills on written texts: summarization, key point identification, and simplification. The texts generated are subsequently analyzed from lexical and syntactic perspectives, including through the application of the READ-IT readability indices. Finally, three types of educational activities are proposed to integrate generative artificial intelligence into the development and maintenance of study skills in the university context.L’interazione tra uomo e macchina è entrata in una nuova fase dallo sviluppo dei Large Language Models, dal 2020 con GPT-3 e poi, soprattutto, dalla fine del 2022 con il rilascio dell’interfaccia conversazionale ChatGPT. Questi modelli hanno progressivamente acquisito un ruolo sempre più pervasivo in numerosi campi. Nel campo educativo le possibilità offerte dall’utilizzo di questi strumenti sono numerose, sebbene non manchino potenziali criticità. Il contributo si propone di esaminare il comportamento di ChatGPT 4o mini nell’esecuzione di tre tipi di task, legati alle abilità di studio, su testi scritti: riassunto, individuazione di punti chiave e semplificazione. I testi generati vengono successivamente analizzati dal punto di vista lessicale e sintattico, anche attraverso gli indici di leggibilità READ-IT. Tre tipologie di attività didattiche vengono dunque suggerite allo scopo di integrare l’intelligenza artificiale generativa nello sviluppo e mantenimento delle abilità di studio in ambito universitario
Vocabolari d’autore e intelligenza artificiale: è possibile creare il vocabolario della lingua di Boccaccio con ChatGPT?
L’innovazione tecnologica ha profondamente influenzato la lessicografia, aprendo nuove prospettive per la redazione e la consultazione dei vocabolari. Questo contributo si propone di indagare il ruolo dell’intelligenza artificiale generativa, in particolare di ChatGPT, nella creazione di un vocabolario del lessico impiegato da Giovanni Boccaccio nel Decameron. Attraverso un’indagine sperimentale condotta su un corpus di vocaboli appartenenti all’area botanica e naturalistica, il lavoro esplora le capacità e i limiti di ChatGPT nella generazione di voci lessicografiche. Vengono esaminati aspetti come la struttura delle definizioni, l’accuratezza nell’individuazione dei diversi significati e l’adeguatezza degli esempi testuali tratti dalla principale opera del Certaldese. Il contributo intende fornire una base di riflessione sulle prospettive future dell’IA generativa nel supporto alla compilazione di un vocabolario in lingua italiana, delineando opportunità e sfide per una sua integrazione efficace nella pratica lessicografica.L’innovazione tecnologica ha profondamente influenzato la lessicografia, aprendo nuove prospettive per la redazione e la consultazione dei vocabolari. Questo contributo si propone di indagare il ruolo dell’intelligenza artificiale generativa, attraverso l’impiego di ChatGPT, nella creazione di un vocabolario del lessico impiegato da Giovanni Boccaccio nel Decameron. Attraverso un’indagine sperimentale condotta su un corpus di vocaboli appartenenti all’area botanica e naturalistica, il lavoro esplora le capacità e i limiti di ChatGPT nella generazione di voci lessicografiche. Vengono esaminati aspetti come la struttura delle definizioni, l’accuratezza nell’individuazione dei diversi significati e l’adeguatezza degli esempi testuali tratti dalla principale opera del Certaldese. Il contributo intende fornire una base di riflessione sulle prospettive future dell’IA generativa nel supporto alla compilazione di un vocabolario in lingua italiana, delineando opportunità e sfide per una sua integrazione efficace nella pratica lessicografica
Esercizi di stile. La narrativa per l’infanzia delle intelligenze artificiali
Il saggio analizza le caratteristiche linguistiche e stilistiche della narrativa per l’infanzia prodotta dai modelli linguistici di grandi dimensioni (LLM), uno dei primi generi per i quali è possibile esaminare dei volumi effettivamente pubblicati e distribuiti. In particolare, l’attenzione è stata posta sul confronto tra i due racconti che compongono Viaggio oltre l’ignoto (Il Castoro, 2024): Cuore d’onda, scritto da alcune IA generative, e Sette giorni, opera di un’autrice umana. Il testo generato si è distinto per la marcata impronta dell’inglese su alcune scelte lessicali e fraseologiche, per un repertorio espressivo limitato e fortemente stereotipato e per una diffusa difficoltà nel gestire in modo appropriato i registri e le sfumature dell’italiano, soprattutto negli scambi dialogici. Sebbene risultino in grado di riprodurre alcuni dei cliché tematici e stilistici tipici del genere, gli LLM dimostrano al momento dei limiti evidenti nella scrittura narrativa; il loro superamento è plausibile, ma dovrà essere accompagnato da una riflessione sulla qualità dei testi e il potenziale ruolo dell’IA nella diffusione degli usi linguistici.
This essay analyzes the linguistic and stylistic characteristics of children\u27s literature produced by large language models (LLMs), one of the first genres for which it is possible to examine published and distributed volumes. In particular, the focus has been on comparing the two stories that make up Viaggio oltre l’ignoto (Il Castoro, 2024): Cuore d’onda, written by generative AIs, and Sette giorni, by a human author. The generated text stands out for the strong influence of English on certain lexical and phraseological choices, a limited and highly stereotyped expressive range, and widespread difficulty in appropriately handling the registers and nuances of Italian – particularly in dialogue exchanges. Although they are ultimately able to reproduce some of the thematic and stylistic clichés typical of the genre, LLMs currently demonstrate obvious limitations in narrative writing; overcoming them is plausible but will have to be accompanied by reflection on the quality of the texts and the potential role of AI in shaping linguistic usage.Il saggio analizza le caratteristiche linguistiche e stilistiche della narrativa per l’infanzia prodotta dai modelli linguistici di grandi dimensioni (LLM), uno dei primi generi per i quali è possibile esaminare dei volumi effettivamente pubblicati e distribuiti. In particolare, l’attenzione è stata posta sul confronto tra i due racconti che compongono Viaggio oltre l’ignoto (Il Castoro, 2024): Cuore d’onda, scritto da alcune IA generative, e Sette giorni, opera di un’autrice umana. Il testo generato si è distinto per la marcata impronta dell’inglese su alcune scelte lessicali e fraseologiche, per un repertorio espressivo limitato e fortemente stereotipato e per una diffusa difficoltà nel gestire in modo appropriato i registri e le sfumature dell’italiano, soprattutto negli scambi dialogici. Sebbene risultino in grado di riprodurre alcuni dei cliché tematici e stilistici tipici del genere, gli LLM dimostrano al momento dei limiti evidenti nella scrittura narrativa; il loro superamento è plausibile, ma dovrà essere accompagnato da una riflessione sulla qualità dei testi e il potenziale ruolo dell’IA nella diffusione degli usi linguistici
“It’s a further exercise in futility”: implicit content detection and classification in Italian political discourse. A pilot study.
Implicit content, such as implicatures and presuppositions, is a key feature of political discourse, allowing speakers to convey meaning indirectly and influence audience interpretation. While Large Language Models (LLMs) have demonstrated impressive capabilities in natural language understanding, their ability to process implicit meaning in real-world contexts remains an open question. This study investigates whether state-of-the-art LLMs can detect and classify implicit content in Italian political speech. Using a subset of the IMPAQTS corpus we assess nine multilingual models, both open-weight and proprietary. The study comprises two tasks: a binary detection task, where models determine whether a given sentence contains implicit content, and a binary classification task, in which models identify whether the implicit content is conveyed through implicature or presupposition. To enhance model performance, we employ six different prompting techniques. Results reveal that while some proprietary models exhibit moderate success in detecting implicit content, none surpass chance-level performance in classification. Open-weight models consistently underperform, with accuracy scores hovering near random guessing. Among prompting strategies, more structured techniques achieve marginal improvements in detection but fail to enhance classification accuracy. These findings highlight the persistent challenges LLMs face in pragmatic reasoning, defining implicit content detection and classification as unresolved tasks in NLP
Exploiting ChatGPT to simplify Italian bureaucratic and professional texts
This paper investigates the use of ChatGPT, a large language model, for simplifying long sentences and nominal clusters in professional texts belonging to administrative and legal domains. We apply three prompt engineering techniques — zero-shot learning, few-shot learning, and Chain-of-Thought reasoning — to generate alternative sentences from a corpus of Italian texts. We evaluate the generated sentences using a survey with expert and non-expert readers of bureaucratic and legal Italian, focusing on ease of understanding, coherence, and preferences in rephrasing. Our results show that ChatGPT can effectively address the linguistic challenges outlined by UNI 11482:2013 Standard, and that complex prompting techniques yield better outcomes than simpler ones. We also discuss the implications of our findings for the optimization of text understanding and simplification using large language models
Grammatica generata
La diffusione delle intelligenze artificiali generative si è rapidamente accompagnata a un esame dei tratti caratterizzanti delle loro produzioni linguistiche. Questo esame, per quanto ancora ben lontano dall’essere considerabile definitivo e condiviso, mostra che tali sistemi, nonostante possiedano una notevolissima capacità di imitare la scrittura umana, a volte se ne allontanano in tratti che sembrano riconducibili a differenze strutturali nella gestione delle informazioni linguistiche. In particolare, le divergenze tra il comportamento umano e quello delle intelligenze artificiali generative risultano evidenti nei casi in cui sintassi e semantica sono intrecciate in modo più stretto. In continuità con questa impostazione, il contributo prende in esame alcuni esempi relativi all’italiano. In particolare, viene approfondito il caso dei nessi correlativi delle strutture coordinate, in cui le divergenze rispetto allo standard sono piuttosto frequenti. In questi ambiti, il comportamento delle intelligenze artificiali generative e quello degli apprendenti umani mostrano sia differenze sia punti di contatto.
La diffusione delle intelligenze artificiali generative si è rapidamente accompagnata a un esame dei tratti caratterizzanti delle loro produzioni linguistiche. Questo esame, per quanto ancora ben lontano dall’essere considerabile definitivo e condiviso, mostra che tali sistemi, nonostante possiedano una notevolissima capacità di imitare la scrittura umana, a volte se ne allontanano in tratti che sembrano riconducibili a differenze strutturali nella gestione delle informazioni linguistiche. In particolare, le divergenze tra il comportamento umano e quello delle intelligenze artificiali generative risultano evidenti nei casi in cui sintassi e semantica sono intrecciate in modo più stretto. In continuità con questa impostazione, il contributo prende in esame alcuni esempi relativi all’italiano. In particolare, viene approfondito il caso dei nessi correlativi delle strutture coordinate, in cui le divergenze rispetto allo standard sono piuttosto frequenti. In questi ambiti, il comportamento delle intelligenze artificiali generative e quello degli esseri umani mostrano sia differenze sia punti di contatto
From terminological inconsistencies to major mistranslations: A qualitative analysis of NMT errors in public health communication
This article presents a qualitative analysis of frequent NMT errors in public health communication. Its primary aim is to sensitise users and decision-makers to common issues and raise public awareness for potential pitfalls and limits of current state-of-the-art NMT systems. In this context, the article also addresses the usability of raw NMT output in emergency situations. The investigation itself focuses on pandemic-related WHO texts and consists of a fine-grained manual error analysis encompassing three languages (English, French, and Spanish) and two NMT systems (DeepL and Google Translate). The five most frequent error types observed in this investigation included mistranslations, inconsistent use of terminology, unidiomatic or awkward style, untranslated text, and other internal inconsistencies. These error types are illustrated with examples and analysed in terms of their severity, their underlying causes, and their potential consequences. The findings show that raw NMT output is useful only to a very limited extent and that the risks and benefits associated with its use should be assessed extremely carefully
Politicians vs ChatGPT: A study of presuppositions in French and Italian political communication
This paper aims to provide a comparison between texts produced by French and Italian politicians on polarizing issues, such as immigration and the European Union, and their chatbot counterparts created with ChatGPT 3.5. In this study, we focus on implicit communication, in particular on presuppositions and their functions in discourse, which have been considered in the literature as a potential linguistic feature of manipulation. This study also aims to contribute to the emerging literature on the pragmatic competences of Large Language Models. Our results show that, on average, ChatGPT-generated texts contain more questionable presuppositions than the politicians’ texts. Furthermore, most presuppositions in the former texts show a different distribution and different discourse functions compared to the latter. This may be due to several factors inherent in the ChatGPT architecture, such as a tendency to be verbose and repetitive in longer texts, as exemplified by the occurrence of political slogans mainly formed by change-of-state verbs as presupposition triggers (e.g., dobbiamo costruire il nostro futuro, ‘we must build our future’)
How do DeepL and ChatGPT process information structure and pragmatics? An exploratory case study on topicalized infinitives in Spanish (and Portuguese)
This case study focuses on a specific construction that exists in both Spanish and Portuguese, but not in English: topicalized infinitives (=TI), e.g., Sp. comer no come ‘as for eating s/he does not eat’. We present three pilot experiments: the first one is a translation task which consists of translating sentences with TI from Spanish to Portuguese and vice versa. DeepL failed in most cases due to contamination by English as a pivot language. The second task is a continuation task: ChatGPT-3.5 was asked to complete sentences that start with a TI. In most cases, natural and adequate continuations starting with pero ‘but’ were generated. Since this task is based on predicting the most likely continuation, this result is not surprising, as this is exactly how the model works. Contrarily, ChatGPT-3.5 demonstrated a clear inability to perform well on the third task, which consisted of drawing pragmatic inferences from exactly the same examples containing a TI that encodes an adversative implicature
Hallucinations in automated texts – A critical view on the emerging terminology
The term hallucination is used in AI discourse to describe AI-generated outputs that are unfounded and lack backing in input data, a phenomenon which occurs frequently enough for the academic community to shun widespread collaboration with AI writing tools, particularly in certain disciplines. The issue of hallucinatory outputs will diminish as AI advances, but the appropriateness of using the terms hallucinate and hallucination in this context remains under debate. Originating from Latin, terms related to hallucination were once exclusively used within specialized medical terminology. Over time, and across languages, its metaphorical meaning has evolved, becoming part of colloquial language through the semantic innovation characteristic of youth language. We also show how this trend coincides with the use of metaphors such as anthrophomorphisms in scientific discourse. The newest addition to hallucination’s list of meanings – an established metaphor for a new phenomenon – is contentious. On the one hand, there is a similarity in that both AI-induced and medically induced hallucinations are elusive and difficult to identify. On the other hand, it suggests a trivialization of medical conditions that remain significantly stigmatized in contemporary societies