Cadernos de Linguística
Not a member yet
343 research outputs found
Sort by
Os desafios para disponibilização e compartilhamento de dados linguísticos da Amostra Base VARSUL
This article aims to present the challenges of making available and sharing linguistic data from the VARSUL Base Sample. The VARSUL project was set up in the 1980s to study the Portuguese spoken in the southern region of Brazil, including data from the capital cities and the most historically and socio-culturally important urban centres. It currently brings together linguists from four universities in the southern region: the Federal University of Rio Grande do Sul (UFRGS), the Pontifical Catholic University of Rio Grande do Sul (PUCRS), the Federal University of Santa Catarina (UFSC) and the Federal Technological University of Paraná (UTFPR). To make up the Basic Sample of the VARSUL database, 288 personal experience interviews were carried out between 1989 and 1996 - 96 per state and 24 in each of the 12 cities selected – taking into account the ethnic groups that make up the regions. In addition to ethnicity, the sample was stratified by gender (male and female), two age groups (25 to 49; over 50) and three levels of schooling (4 to 5 years; 8 to 9 years and 10 to 11 years). All 288 interviews were transcribed and stored at the VARSUL project branch offices and have served as rich material for describing and analysing the varieties of Southern Brazilian Portuguese. The database has complementary samples to expand the Base Sample, as well as samples from urban and non-urban neighbourhoods in Florianópolis-SC. In order to make the linguistic data of the Base Sample publicly accessible, in accordance with the guidelines of Open Science, we are currently in the process of de-identifying and anonymizing the audio recordins and transcripts of the interviews, in order to guarantee the confidentiality of the participants, in accordance with ethical and legal requirements. Also on the current agenda of the VARSUL project is the implementation of the project ‘Study of Linguistic Change in Real Time: expansion of the VARSUL project speech database’, whose main goal is to expand the base sample through panel studies and trend studies, with the aim of studying change in real time.O objetivo deste artigo é apresentar os desafios para disponibilização e compartilhamento de dados linguísticos da Amostra Base Varsul. O projeto Varsul foi constituído desde a década de 1980 para o estudo do português falado na Região Sul do Brasil, incluindo dados das capitais e dos centros urbanos histórica e sócio culturalmente mais importantes. Atualmente é constituído por pesquisadores de quatro universidades da Região Sul do Brasil: Universidade Federal do Rio Grande do Sul (UFRGS), Pontifícia Universidade Católica do Rio Grande do Sul (PUC-RS), Universidade Federal de Santa Catarina (UFSC) e Universidade Tecnológica Federal do Paraná (UFPR). Para compor a Amostra Base do banco de dados Varsul foram realizadas, entre 1989 e 1996, 288 entrevistas de experiência pessoal, nos moldes labovianos, sendo 96 por estado e 24 em cada uma das 12 cidades selecionadas, levando em conta as etnias formadoras das regiões. Além da etnia, a amostra foi estratificada em sexo (masculino e feminino), duas faixas de idade (de 25 a 49 anos; acima de 50 anos) e três escolaridades (4 a 5 anos, 8 a 9 anos e 10 a 11 anos). Todas as 288 entrevistas foram transcritas e armazenadas nas agências do projeto Varsul e têm servido, desde então, como rico material para a descrição e a análise das variedades do português do sul do Brasil. O projeto conta também com amostras complementares de ampliação da Amostra Base, bem como com amostras diversas de bairros urbanos e não urbanos de Florianópolis. Para que possamos disponibilizar ao acesso público os dados linguísticos da Amostra Base, em conformidade com as diretrizes da ciência aberta, estamos, neste momento, em fase de desidentificação e anonimização dos áudios e transcrições das entrevistas, a fim de garantir o anonimato dos participantes em atendimento aos preceitos éticos e legais. Faz parte ainda da agenda atual do projeto Varsul a implementação do projeto ‘Estudo da Mudança Linguística em Tempo Real: ampliação do Banco de Dados de Fala do Projeto VARSUL’ cujo objetivo principal é a ampliação da Amostra Base, através de estudos de painel e estudos de tendência, com o intuito de investigar a mudança em tempo real
Ampliando o campo da semântica: da língua aos conflitos sociais
The aim of this article is to present, for the first time in Portuguese, the central ideas of the theory developed in the book Prolégomènes à une sémantique des conflits sociaux¸ published in 2023. The aim of the book is to propose a theoretical framework for understanding and analysing the semantic dimension of social conflicts. The project, which is multidisciplinary in nature, draws on concepts from discourse analysis, political philosophy and sociology, among other disciplines. The theoretical apparatus, however, gives shape to an essentially semantic project (even if, in order to do so, it requires expanding the limits of what is usually considered ‘semantic’).O objetivo deste artigo é apresentar, pela primeira vez em português, as ideias centrais da teoria desenvolvida no livro Prolégomènes à une sémantique des conflits sociaux¸ publicado em 2023. O intuito do livro é propor um arcabouço teórico que permita compreender e analisar a dimensão semântica dos conflitos sociais. O projeto, de natureza multidisciplinar, convoca conceitos da análise do discurso, da filosofia política, da sociologia, entre outras disciplinas. O aparato teórico, porém, dá corpo a um projeto essencialmente semântico (ainda que, para isso, ele mesmo exija ampliar os limites do que habitualmente é considerado “semântico”).
 
Negativas: um protótipo para a busca e classificação de negação sentencial em dados de fala
Negation is a universal feature of natural languages. In Brazilian Portuguese, the most commonly used negation particle is não, which can take scope over nouns or verbs. When it takes scope over a verb, “não”can occur in three positions: pre-verbal (NEG1), double negation (NEG2), or post-verbal (NEG3), e.g., “não gosto”, “não gosto não”, “gosto não”(“I do not like it”). From a variationist perspective, these structures are different forms of expressing negation. Pragmatically, they serve distinct communicative functions, such as politeness and modal evaluation. Despite their grammatical acceptability, these forms differ in frequency. NEG1 dominates across Brazilian regions, while NEG2 and NEG3 appear more rarely, suggesting its use is contextually restricted. The low frequency of these structures challenges research, often resulting in subjective, non-generalizable interpretations of verbal negation with não. To address this, we developed negativas, a tool for automatically identifying NEG1, NEG2, and NEG3 in transcribed data. The tool’s development involved four stages: i) analyzing a dataset of 22 interviews from the Falares Sergipanos database, annotated by three linguists, ii) developing the code using the Python language and Natural Language Processing (NLP) techniques, iii) running the tool, iv) evaluating accuracy. Inter-annotator agreement, measured using Fleiss’ Kappa, was moderate (0.57). The tool identified 3,338 instances of não, classifying 2,085 as NEG1, NEG2, or NEG3, achieving a 93% success rate. However, negativas has limitations. NEG1 accounted for 91.5% of identified structures, while NEG2 and NEG3 represented 7.2% and 1.2%, respectively. The tool struggled with NEG2, misclassifying instances as overlapping structures (NEG1/NEG2/NEG3). These challenges stem from the dataset’s lack of punctuation, which in written texts, marks sentence boundaries. In spoken data, prosodic cues serve this purpose, recognized by speakers but not by the tool. This highlights the need for advancements in NLP to better handle the unique features of spoken language data.A negação é uma característica universal das línguas naturais. No português brasileiro, a partícula de negação mais comum é o não, que pode incidir sobre nomes ou verbos. Quando incide sobre um verbo, o não pode ocorrer em três posições: pré-verbal (NEG1), dupla negação (NEG2) ou pós-verbal (NEG3), como em não gosto, não gosto não e gosto não. Sob uma perspectiva variacionista, essas estruturas são formas diferentes de expressar a negação. Pragmaticamente, elas desempenham funções comunicativas distintas, como polidez e avaliação modal. Apesar de sua aceitabilidade gramatical, essas formas apresentam frequência distinta. A NEG1 predomina em todas as regiões do Brasil, enquanto a NEG2 e a NEG3 ocorrem mais raramente, o que sugere que seu uso é contextualmente restrito. Essa baixa frequência impõe desafios à pesquisa, resultando, muitas vezes, em interpretações subjetivas e não generalizáveis sobre a negação verbal com não. Para lidar com essa questão, desenvolvemos o negativas, uma ferramenta para identificação automática de NEG1, NEG2 e NEG3 em dados de fala transcritos. O desenvolvimento da ferramenta ocorreu em quatro etapas: i) análise de um corpus de 22 entrevistas do banco de dados Falares Sergipanos, anotadas por três linguistas; ii) desenvolvimento do código utilizando a linguagem Python e técnicas de Processamento de Linguagem Natural (PLN); iii) execução da ferramenta; e iv) avaliação da acurácia. A concordância entre os anotadores, medida pelo Kappa de Fleiss, foi moderada (0,57). A ferramenta identificou 3.338 ocorrências de não, classificando 2.085 como NEG1, NEG2 ou NEG3 e alcançando uma taxa de acerto de 93%. Contudo, o negativas apresenta limitações. A NEG1 correspondeu a 91,5% das estruturas identificadas, enquanto a NEG2 e a NEG3 representaram 7,2% e 1,2%, respectivamente. A ferramenta apresentou dificuldades com a NEG2, classificando erroneamente, em alguns casos, ocorrências como estruturas sobrepostas (NEG1/NEG2/NEG3). Esses desafios decorrem da ausência de pontuação no corpus, elemento que, no texto escrito, delimita as fronteiras sentenciais. Na fala, esse papel é desempenhado por pistas prosódicas, que são reconhecidas pelos falantes, mas não pela ferramenta. Isso evidencia a necessidade de avanços em PLN para que se possa lidar de modo mais eficaz com as particularidades dos dados de fala
O estado enquanto um aspecto derivado: uma análise sintático- semântica
In this paper, we present the research project titled “States as derived aspect: a Syntactic-Semantic approach”, coordinated by Professor Letícia Lucinda Meirelles, at Instituto de Letras e Linguística, of Universidade Federal de Uberlândia. The project\u27s goal is to analyze sentences that denote the state aspect in a derived manner, influenced by the interaction between the lexical aspect, inherent to the verb, alternations in the verb\u27s argument structure, the grammatical aspect, and other phrases present in the sentences. Examples include: a garagem lá de casa abrigou um cachorro perdido (durante a madrugada) ‘the garage at our house sheltered a lost dog (during the night)’; a mãe se preocupa com o mau comportamento do filho ‘the mother is concerned about her son\u27s bad behavior’; pote de azeitona não (se) abre fácil ‘a jar of olives doesn’t open easily’; Belo Horizonte chove muito nessa época do ano ‘Belo Horizonte gets a lot of rain at this time of year’. Our main hypothesis is that, despite the different types of verbs and sentences involved in this phenomenon, there must be a common semantic property that allows for the stative interpretation of these sentences, even when the verbs themselves denote events. Based on the premise that the realization of arguments in syntax is a projection of the lexical properties of verbs, which are semantic in nature, this project is part of the research line “Theory, Description, and Linguistic Analysis”, specifically within the area of Lexical Syntax-Semantics Interface.Neste texto, registramos o projeto de pesquisa intitulado “O estado enquanto um aspecto derivado: uma análise sintático-semântica”, desenvolvido sob a coordenação da professora Letícia Lucinda Meirelles, no Instituto de Letras e Linguística, da Universidade Federal de Uberlândia. Nosso objetivo é analisar sentenças que denotam o aspecto de estado de forma derivada, devido a uma interpretação gerada pela interação entre o aspecto lexical, inerente ao item verbal, a mudança da estrutura argumental dos verbos, o aspecto gramatical e outros sintagmas presentes nas sentenças, como mostram os exemplos: a garagem lá de casa abrigou um cachorro perdido (durante a madrugada); a mãe se preocupa com o mau comportamento do filho; pote de azeitona não (se) abre fácil; Belo Horizonte chove muito nessa época do ano. Nossa principal hipótese é de que, embora haja diferentes tipos de verbos, em diferentes tipos de sentenças, que participam desse fenômeno, deve haver alguma propriedade semântica comum a todos eles que permita a ocorrência dessa interpretação estativa das sentenças, mesmo que os verbos que as nucleiam denotem eventos. O presente projeto se insere na linha de pesquisa “Teoria, descrição e análise linguística”, mais especificamente na área de estudos da Interface Sintaxe-Semântica Lexical, por partir do pressuposto de que a realização dos argumentos na sintaxe é uma projeção das propriedades lexicais dos verbos, que são de natureza semântica
Broadening the Base of Historical Sociolinguistics
This brief introduction to the special issue on historical sociolinguistics tells the story of how this project came about. Our major goals have been to highlight work in this still new subfield of linguistics, especially with an eye to increasing the range of languages and areas covered and increasing the time depth of research into historical sociolinguistics. We sketch how we see each contribution helping us reach those goals.Esta breve introdução ao número especial sobre Sociolinguística Histórica narra a história de como este projeto surgiu. Nossos principais objetivos têm sido dar destaque às pesquisas nesse subcampo ainda recente da Linguística, especialmente com vistas a ampliar a variedade de línguas e de áreas contempladas, bem como a aumentar a profundidade temporal das investigações em Sociolinguística Histórica. Apresentamos, de forma sucinta, como entendemos que cada contribuição auxilia no alcance desses objetivos
Individual Contributions to the Documentation and Expansion of the Colonial Linguistic Landscape of 19th Century North and West Africa
This paper details the spread of two pidgins in North and West Africa in the 19th century. It highlights the contributions of two individuals, the US State Department envoy, William Brown Hodgson and the French colonialist, Louis Faidherbe. Although the two men never overlapped in Africa, both played a role in shaping the linguistic landscape through their documentation and diffusion of the pidgins and indigenous languages. The paper further suggests the link between the two pidgins, a connection that stems directly from the linguistic engagement and output of the two individuals. It suggests a circularity of language evolution and record across the Mediterranean
Análise de neologismos em corpus escrito de aprendizes de português LE
This article presents a study on lexical deviations due to borrowings and neologisms committed by 15 proficient learners of Portuguese whose mother tongue (L1) is Italian, based on the analysis of ninety written productions. The main objectives were twofold: (i) to identify the lexical deviations with the highest number of occurrences and (ii) to verify whether the language most frequently used in these deviations was the L1 or a previously acquired foreign language (FL). The data analysis identified 28 lexical deviations, primarily neologisms, and the use of the L1 as the main source language. These findings differ from Kellerman\u27s (1977) psychotypological hypothesis of languages, which suggests that the language typologically closest to L1 is the most used in lexical deviations rather than the L1 itself. This will be examined through the works of Garcia-Lecumberri (2003) and Llach (2010).Este artigo apresenta um estudo sobre desvios lexicais devido a empréstimos e neologismos cometidos por 15 aprendizes proficientes em português cuja língua materna (L1) é o italiano, a partir da análise de noventa produções escritas. Os objetivos principais foram dois: identificar os desvios lexicais com maior número de ocorrências e (ii) verificar se a língua empregada com mais frequência nesses desvios era a L1 ou uma língua estrangeira (LE) previamente adquirida. A análise dos dados resultou na identificação de 28 desvios lexicais, a maior parte deles sendo neologismos, como também no emprego da L1 como a língua-fonte preferencial. Os achados da pesquisa contrapõem-se à hipótese psicotipológica das línguas de Kellerman (1977) – que sustenta ser a língua tipologicamente mais próxima à L1, e não a própria L1, a mais empregada nos desvios lexicais –, e serão explicados com base em Garcia-Lecumberri (2003) e Llach (2010)
Contribuições da Linguística Cognitiva para o projeto de ensino "Escola Sem Fake" (PROLICEN/UFPB)
The 21st century has been marked by the harmful effects of the proliferation of disinformation texts, driven uncontrollably on and by social media (Bentes; Souza-Santos, 2023). In combating this epidemic, schools play a fundamental role: encouraging students to adopt a critical attitude towards the content and the multiplicity of discourses that circulate in digital media (Brasil, 2018). To this end, it is necessary to propose actions that develop in students the ability to investigate the veracity of information and to produce texts that deconstruct false information (Kleiman; Santos-Marques, 2020). It is in this context that the project for the UFPB Undergraduate Support Program (PROLICEN/UFPB) entitled “School without fake: reading workshops, textual production and linguistic analysis in the fight against disinformation” was born. The overall objective of the project is to train students from public schools in the city of João Pessoa to identify and deconstruct misinformation texts, popularly called fake news, through reading, text production and linguistic analysis workshops. In this article, we present the contributions of the theoretical framework of Cognitive Linguistics - CL. We believe that CL is aligned with the enunciative-discursive perspective of language, which assumes the centrality of the text as a unit of analysis, along the lines of the BNCC (Brasil, 2018) proposal for the teaching of Portuguese Language - PL, contributing to the debate on misinformation in its contexts of production. Such practice implies the formation of literate student-subjects, capable of analyzing texts in linguistic-enunciative, situational, interactional, cultural, intertextual and discursive dimensions, along the lines of what Critical Pedagogy also proposes. With this project, we expect the following results and impacts: 1) publication of the data generated in articles, book chapters, podcasts and other media; 2) production of teaching material that applies CL concepts in the analysis of disinformation and that offers methodological guidelines for work in LC classes in basic education; and 3) contributions to the strengthening of public education policies to combat disinformation.O século XXI tem sido marcado pelos efeitos deletérios da proliferação de textos de desinformação, impulsionados descontroladamente nas e pelas redes sociais (Bentes; Souza-Santos, 2023). No combate a essa epidemia, a escola tem papel fundamental: estimular no estudante a atitude crítica em relação ao conteúdo e à multiplicidade de discursos que circulam nos meios digitais (Brasil, 2018). Para tanto, é preciso que se proponham ações que desenvolvam nos estudantes a capacidade de investigar a veracidade das informações e de produzir textos que desconstruam informações falsas (Kleiman; Santos-Marques, 2020). É neste contexto que nasceu o projeto para o Programa de Apoio às Licenciaturas da UFPB (PROLICEN/UFPB) intitulado “Escola sem fake: oficinas de leitura, produção textual e análise linguística no combate à desinformação”. O objetivo geral do projeto é capacitar estudantes de escolas públicas do município de João Pessoa a identificar e desconstruir textos de desinformação, popularmente chamado de fake news, por meio de oficinas de leitura, produção de textos e análise linguística. Neste artigo, apresentamos as contribuições do arcabouço teórico da Linguística Cognitiva – LC para o projeto. Acreditamos que a LC se alinha à perspectiva enunciativo-discursiva de linguagem, que assume a centralidade do texto como unidade de análise, aos moldes da proposta da BNCC (Brasil, 2018) para o ensino de Língua Portuguesa – LP, contribuindo para o debate sobre desinformação em seus contextos de produção. Tal prática implica a formação de estudantes-sujeitos letrados, capazes de analisar textos em dimensões linguístico-enunciativas, situacionais, interacionais, culturais, intertextuais e discursivas, aos moldes do que também propõe a Pedagogia Crítica. Com este projeto, esperamos os seguintes resultados e impactos: 1) publicação dos dados gerados em artigos, capítulos de livro, podcasts e outras mídias; 2) produção de material didático que aplique conceitos da LC na análise da desinformação e que ofereça encaminhamentos metodológicos para o trabalho nas aulas de LP na educação básica; e 3) contribuições para o fortalecimento de políticas públicas de ensino para o combate à desinformação
The Entangled Nature of First Language Learning, Education, and Literacy
The entangled relationship between first language acquisition, education, and literacy challenges conventional linguistic paradigms. This paper explores recent findings revealing the intricate interplay of these factors, particularly emphasizing the impact of education and literacy on grammatical knowledge. Drawing on studies conducted in diverse linguistic contexts, this paper argues against the universal applicability of conventional metrics such as the High Academic Attainment/Low Academic Attainment (HAA/LAA) cut-off to investigate the role of reading, advocating for a more nuanced understanding of linguistic development that considers local educational dynamics. Additionally, the paper discusses methodological challenges in studying illiterate populations and proposes alternative measures to capture the cumulative effects of language experience. Ultimately, the paper underscores the importance of interdisciplinary collaboration in developing inclusive research methodologies and educational interventions that address the diverse needs of learners worldwide. By embracing the complexities of language learning, education, and literacy, linguists can advance our understanding of human language capabilities and promote more equitable opportunities for linguistic development
A ressemantização não é um espantalho
In the context of a debate or political meeting, it\u27s very common to see a situation in which a participant attacks an opposing position without taking into account the actual position previously presented, but rather presenting a distorted and discredited version. This type of phenomenon is addressed through the strawman strategy. This article will try to show that certain discursive-semantic mechanisms of disqualification in political assemblies come close to the strawman strategy without, however, falling into this category. The aim is to describe some of the semantic particularities of these cases, which will be grouped together under the name of square resemanticisation. In this way, we will try to focus attention on the mechanisms that have an effect on the process of strengthening and weakening that takes place in the semantic dimension of political interactions.Em um contexto de debate ou de reuniões políticas, é muito comum assistir a uma situação em que um participante ataca uma posição oposta sem levar em conta a posição realmente apresentada previamente, mas sim apresentando uma versão distorcida e já desacreditada. Esse tipo de fenômeno é abordado por meio da estratégia do espantalho, ou strawman. Este artigo tentará mostrar que certos mecanismos discursivo-semantico de desqualificação em assembleias políticas se aproximam da estratégia do espantalho sem, no entanto, se enquadrar nessa categoria. Trata-se, por nosso lado, de descrever algumas das particularidades semânticas desses casos, que serão reunidos sob a denominação de ressemantização quadrada. Assim, tentaremos concentrar a atenção sobre os mecanismos que têm efeitos sobre o processo de fortalecimento e enfraquecimento que ocorrem na dimensão semântica das interações politicas