33 research outputs found

    CLUB Working Papers in Linguistics Volume 8

    Full text link
    L'ottavo volume della collana "CLUB Working Papers in Linguistics" raccoglie una selezione dei contributi presentati nel corso delle iniziative organizzate dal Circolo Linguistico dell'Università di Bologna (CLUB) durante l’anno accademico 2022/2023. Tra di loro si trovano alcuni dei risultati dell'evento CLUB Day su "Il metodo nella ricerca linguistica: Sfide e soluzioni" e l'articolo della vincitrice del premio "CLUB - Una tesi in linguistica" 2023. Gli undici contributi, scritti da diciannove autrici e autori, offrono una panoramica delle ricerche recenti in ambiti della linguistica che vanno dalla fonetica sperimentale e l'apprendimento di seconde lingue all'uso dei metodi linguistici per studiare problemi anche sociali. In ordine alfabetico, i saggi sono a firma di: Giorgia Albertin, Triscia Biagiotti, Arianna Bienati, Chiara Celata, Anna Cencherle (premio tesi), Cristiana Cervini, Vittoria Colla, Melissa Donati, Jennifer-Carmen Frey, Monica Masperi, Nicola Nasi, Luisa Revelli, Giulia Telari, Elena Tombesi, Paola Vernillo, Chiara Vettori, Lorenzo Zanasi, Chiara Zanchi e Eleonora Zucchini. I contributi sono stati sottoposti a un processo di revisione anonima e sono disponibili in formato open access

    Izrada i analiza anotiranog korpusa persijskog jezika kao stranog

    No full text
    Lingvistički korpusi predstavljaju značajan izvor i sredstvo analize empirijskih jezičkih podataka. Njihova upotreba vrlo je raširena, između ostalog, u oblasti istraživanja usvajanja drugog/stranog jezika i nastavi jezika, gde posebno treba naglasiti značaj učeničkih korpusa. U ovoj disertaciji opisuje se izrada jednog takvog korpusa – učeničkog korpusa persijskog jezika, pod nazivom Salam Farsi Learner Corpus (SFLC). Ovaj korpus je izrađen na osnovu tekstova koje su tokom pohađanja kurseva persijskog jezika pisali učenici čiji maternji jezik je srpski. Pored toga što su tekstovi prebačeni u digitalni format, u korpusu su označene greške koje su učenici pravili prilikom pisanja. Tri glavne faze u izradi korpusa bile su njegovo koncipiranje i digitalizovanje, predlaganje sistema anotacije grešaka i razvijanje alata za izradu i pretragu korpusa. Sve tri faze detaljno su opisane u disertaciji. Konkretno, pažnja je posvećena opisu praktičnih koraka poput prikupljanja podataka i metapodataka, kao i konceptualnih zadataka kakvi su definisanje kriterijuma za izradu korpusa, sastavljanje oznaka za greške i idejno osmišljavanje korpusnog interfejsa, softvera i alata. SFLC se softverski oslanja na četiri glavna alata koji omogućuju unos podataka i metapodataka u korpusnu bazu, označavanje grešaka, preuzimanje i pretragu dokumenata (prema površinskim oblicima reči ili prema greškama) i generisanje statističkih izveštaja o greškama. Na osnovu statističkih izveštaja koje SFLC daje, u disertaciji se sprovodi i analiza grešaka – proučavaju se učestalost i raspodela grešaka u korpusu kao celini i na različitim pojedinačnim nivoima znanja persijskog jezika. Rezultati ove korpusno zasnovane analize pokazuju da učenici kojima je maternji jezik srpski na nižim nivoima znanja persijskog jezika najčešće prave greške u domenu ortografije, dok se kasnije greške češće nalaze u domenima leksike i sintakse. Greške vezane za red reči označene su kao ukupno gledano najčešći tip greške u čitavom korpusu. Ukupni broj grešaka smanjuje se kako se učenici kreću od nivoa A2 ka nivou C1. Međutim, kada je reč o sintaksi, broj grešaka raste, usled korišćenja složenijih sintaksičkih struktura na višim nivoima. ix SFLC ne samo da obezbeđuje autentične podatke prikupljene od učenika na različitim nivoima znanja, već pruža i statističke podatke o označenim greškama i drugim korpusnim parametrima. Stoga se zaključuje da korpus može biti od velike koristi za istraživanje i nastavu persijskog jezika kao drugog/stranog.Linguistic corpora constitute reliable sources and empirical means for analyzing linguistic data. They are also widely used in the fields of Second/Foreign Language Acquisition and Foreign Language Teaching research, where the most commonly used type are Learner Corpora. The present thesis, based on a methodological approach for building a learner corpus, is generally in line with the domain of error analysis and the field of Learner Corpus Research. The thesis describes the process of constructing and developing an errortagged Persian learner corpus, called the Salam Farsi Learner Corpus (SFLC), as well as an analysis of linguistic errors based on a collection of written texts produced by Serbian learners of the Persian language. Three major stages, namely, constructing the corpus, proposing a system of error annotation and developing tools and software, were followed, and the practical phases such as the systematic collection of data and metadata, defining the corpus design criteria, creating the error tagsets and developing the corpus interface, software and specific tools are described. The SFLC software is equipped with four main tools in order to function as an error-tagged learner corpus and provide the statistical reports. These tools include a tool for submitting data and metadata into the corpus database, a computer-aided error editor to facilitate error tagging, filters and search, and data statistics tools which show various statistical data related to the corpus. Based on the SFLC statistical reports, the frequency and error distribution in the whole corpus and the comparison of error distributions across different proficiency levels are discussed. The corpus statistics show that the most frequent errors made by the Serbian learners of the Persian language are initially to be found in the domain of orthography, while later on the most frequent errors lie in the domains of lexis and syntax. Word Order is marked as the most frequent error type in the corpus as a whole. As for the distribution of errors across specific proficiency levels, the results show that the total number of errors drops from level A2 to level C1, while errors in syntax increase, due to the use of more vii complex syntactic structures at higher proficiency levels. The SFLC not only provides authentic data gathered from learners at different proficiency levels, but also statistics regarding error tags and metadata. Research into Persian as a second/foreign language thus can clearly benefit from the SFLC as a resource

    Izrada i analiza anotiranog korpusa persijskog jezika kao stranog ; Формирование и анализ аннотированного корпуса персидскогo языка

    No full text
    Linguistic corpora constitute reliable sources and empirical means for analyzing linguistic data. They are also widely used in the fields of Second/Foreign Language Acquisition and Foreign Language Teaching research, where the most commonly used type are Learner Corpora. The present thesis, based on a methodological approach for building a learner corpus, is generally in line with the domain of error analysis and the field of Learner Corpus Research. The thesis describes the process of constructing and developing an errortagged Persian learner corpus, called the Salam Farsi Learner Corpus (SFLC), as well as an analysis of linguistic errors based on a collection of written texts produced by Serbian learners of the Persian language. Three major stages, namely, constructing the corpus, proposing a system of error annotation and developing tools and software, were followed, and the practical phases such as the systematic collection of data and metadata, defining the corpus design criteria, creating the error tagsets and developing the corpus interface, software and specific tools are described. The SFLC software is equipped with four main tools in order to function as an error-tagged learner corpus and provide the statistical reports. These tools include a tool for submitting data and metadata into the corpus database, a computer-aided error editor to facilitate error tagging, filters and search, and data statistics tools which show various statistical data related to the corpus. Based on the SFLC statistical reports, the frequency and error distribution in the whole corpus and the comparison of error distributions across different proficiency levels are discussed. The corpus statistics show that the most frequent errors made by the Serbian learners of the Persian language are initially to be found in the domain of orthography, while later on the most frequent errors lie in the domains of lexis and syntax. Word Order is marked as the most frequent error type in the corpus as a whole. As for the distribution of errors across specific proficiency levels, the results show that the total number of errors drops from level A2 to level C1, while errors in syntax increase, due to the use of more vii complex syntactic structures at higher proficiency levels. The SFLC not only provides authentic data gathered from learners at different proficiency levels, but also statistics regarding error tags and metadata. Research into Persian as a second/foreign language thus can clearly benefit from the SFLC as a resource.Lingvistički korpusi predstavljaju značajan izvor i sredstvo analize empirijskih jezičkih podataka. Njihova upotreba vrlo je raširena, između ostalog, u oblasti istraživanja usvajanja drugog/stranog jezika i nastavi jezika, gde posebno treba naglasiti značaj učeničkih korpusa. U ovoj disertaciji opisuje se izrada jednog takvog korpusa – učeničkog korpusa persijskog jezika, pod nazivom Salam Farsi Learner Corpus (SFLC). Ovaj korpus je izrađen na osnovu tekstova koje su tokom pohađanja kurseva persijskog jezika pisali učenici čiji maternji jezik je srpski. Pored toga što su tekstovi prebačeni u digitalni format, u korpusu su označene greške koje su učenici pravili prilikom pisanja. Tri glavne faze u izradi korpusa bile su njegovo koncipiranje i digitalizovanje, predlaganje sistema anotacije grešaka i razvijanje alata za izradu i pretragu korpusa. Sve tri faze detaljno su opisane u disertaciji. Konkretno, pažnja je posvećena opisu praktičnih koraka poput prikupljanja podataka i metapodataka, kao i konceptualnih zadataka kakvi su definisanje kriterijuma za izradu korpusa, sastavljanje oznaka za greške i idejno osmišljavanje korpusnog interfejsa, softvera i alata. SFLC se softverski oslanja na četiri glavna alata koji omogućuju unos podataka i metapodataka u korpusnu bazu, označavanje grešaka, preuzimanje i pretragu dokumenata (prema površinskim oblicima reči ili prema greškama) i generisanje statističkih izveštaja o greškama. Na osnovu statističkih izveštaja koje SFLC daje, u disertaciji se sprovodi i analiza grešaka – proučavaju se učestalost i raspodela grešaka u korpusu kao celini i na različitim pojedinačnim nivoima znanja persijskog jezika. Rezultati ove korpusno zasnovane analize pokazuju da učenici kojima je maternji jezik srpski na nižim nivoima znanja persijskog jezika najčešće prave greške u domenu ortografije, dok se kasnije greške češće nalaze u domenima leksike i sintakse. Greške vezane za red reči označene su kao ukupno gledano najčešći tip greške u čitavom korpusu. Ukupni broj grešaka smanjuje se kako se učenici kreću od nivoa A2 ka nivou C1. Međutim, kada je reč o sintaksi, broj grešaka raste, usled korišćenja složenijih sintaksičkih struktura na višim nivoima. ix SFLC ne samo da obezbeđuje autentične podatke prikupljene od učenika na različitim nivoima znanja, već pruža i statističke podatke o označenim greškama i drugim korpusnim parametrima. Stoga se zaključuje da korpus može biti od velike koristi za istraživanje i nastavu persijskog jezika kao drugog/stranog

    Izrada i analiza anotiranog korpusa persijskog jezika kao stranog ; Формирование и анализ аннотированного корпуса персидскогo языка

    Full text link
    Linguistic corpora constitute reliable sources and empirical means for analyzing linguistic data. They are also widely used in the fields of Second/Foreign Language Acquisition and Foreign Language Teaching research, where the most commonly used type are Learner Corpora. The present thesis, based on a methodological approach for building a learner corpus, is generally in line with the domain of error analysis and the field of Learner Corpus Research. The thesis describes the process of constructing and developing an errortagged Persian learner corpus, called the Salam Farsi Learner Corpus (SFLC), as well as an analysis of linguistic errors based on a collection of written texts produced by Serbian learners of the Persian language. Three major stages, namely, constructing the corpus, proposing a system of error annotation and developing tools and software, were followed, and the practical phases such as the systematic collection of data and metadata, defining the corpus design criteria, creating the error tagsets and developing the corpus interface, software and specific tools are described. The SFLC software is equipped with four main tools in order to function as an error-tagged learner corpus and provide the statistical reports. These tools include a tool for submitting data and metadata into the corpus database, a computer-aided error editor to facilitate error tagging, filters and search, and data statistics tools which show various statistical data related to the corpus. Based on the SFLC statistical reports, the frequency and error distribution in the whole corpus and the comparison of error distributions across different proficiency levels are discussed. The corpus statistics show that the most frequent errors made by the Serbian learners of the Persian language are initially to be found in the domain of orthography, while later on the most frequent errors lie in the domains of lexis and syntax. Word Order is marked as the most frequent error type in the corpus as a whole. As for the distribution of errors across specific proficiency levels, the results show that the total number of errors drops from level A2 to level C1, while errors in syntax increase, due to the use of more vii complex syntactic structures at higher proficiency levels. The SFLC not only provides authentic data gathered from learners at different proficiency levels, but also statistics regarding error tags and metadata. Research into Persian as a second/foreign language thus can clearly benefit from the SFLC as a resource.Lingvistički korpusi predstavljaju značajan izvor i sredstvo analize empirijskih jezičkih podataka. Njihova upotreba vrlo je raširena, između ostalog, u oblasti istraživanja usvajanja drugog/stranog jezika i nastavi jezika, gde posebno treba naglasiti značaj učeničkih korpusa. U ovoj disertaciji opisuje se izrada jednog takvog korpusa – učeničkog korpusa persijskog jezika, pod nazivom Salam Farsi Learner Corpus (SFLC). Ovaj korpus je izrađen na osnovu tekstova koje su tokom pohađanja kurseva persijskog jezika pisali učenici čiji maternji jezik je srpski. Pored toga što su tekstovi prebačeni u digitalni format, u korpusu su označene greške koje su učenici pravili prilikom pisanja. Tri glavne faze u izradi korpusa bile su njegovo koncipiranje i digitalizovanje, predlaganje sistema anotacije grešaka i razvijanje alata za izradu i pretragu korpusa. Sve tri faze detaljno su opisane u disertaciji. Konkretno, pažnja je posvećena opisu praktičnih koraka poput prikupljanja podataka i metapodataka, kao i konceptualnih zadataka kakvi su definisanje kriterijuma za izradu korpusa, sastavljanje oznaka za greške i idejno osmišljavanje korpusnog interfejsa, softvera i alata. SFLC se softverski oslanja na četiri glavna alata koji omogućuju unos podataka i metapodataka u korpusnu bazu, označavanje grešaka, preuzimanje i pretragu dokumenata (prema površinskim oblicima reči ili prema greškama) i generisanje statističkih izveštaja o greškama. Na osnovu statističkih izveštaja koje SFLC daje, u disertaciji se sprovodi i analiza grešaka – proučavaju se učestalost i raspodela grešaka u korpusu kao celini i na različitim pojedinačnim nivoima znanja persijskog jezika. Rezultati ove korpusno zasnovane analize pokazuju da učenici kojima je maternji jezik srpski na nižim nivoima znanja persijskog jezika najčešće prave greške u domenu ortografije, dok se kasnije greške češće nalaze u domenima leksike i sintakse. Greške vezane za red reči označene su kao ukupno gledano najčešći tip greške u čitavom korpusu. Ukupni broj grešaka smanjuje se kako se učenici kreću od nivoa A2 ka nivou C1. Međutim, kada je reč o sintaksi, broj grešaka raste, usled korišćenja složenijih sintaksičkih struktura na višim nivoima. ix SFLC ne samo da obezbeđuje autentične podatke prikupljene od učenika na različitim nivoima znanja, već pruža i statističke podatke o označenim greškama i drugim korpusnim parametrima. Stoga se zaključuje da korpus može biti od velike koristi za istraživanje i nastavu persijskog jezika kao drugog/stranog

    Statistička analiza podataka u eksperimentalnim istraživanjima usvajanja drugoga jezika

    No full text
    Ova knjiga pruža uvid u osnove eksperimentalne metodologije u području lingvistički orijentiranih istraživanja usvajanja drugoga jezika, pri čemu se lingvistički orijentiranima smatraju istraživanja koja kao osnovni cilj imaju rasvjetljavanje čimbenika važnih u usvajanju određenih gramatičkih, prije svega morfosintaktičkih pojava, a pod pojmom „drugi“ podrazumijeva se svaki jezik usvojen poslije materinskoga. Knjiga je napisana iz teorijski neutralne perspektive te su stoga metode i postupci opisani u njoj najvećim dijelom podjednako relevantni za istraživanja u generativnome, kognitivnom i drugim teorijskim okvirima. Naglasak je s jedne strane na općim načelima osmišljavanja i provedbe eksperimenata, a s druge na konkretnim problemima vezanim uz usvajanje drugoga jezika i konkretnim metodama koje se koriste u tome području. Na više se mjesta u knjizi čitateljima daju uputnice i poveznice na izvore vezane uz teme koje u knjizi nisu detaljno obrađene, naprimjer psiholingvističke metode i statistička analiza te slični praktično korisni sadržaji. Knjiga nije posvećena nijednome određenom jeziku te stoga može biti korisna svim istraživačima usvajanja drugoga jezika bilo kao udžbenik u okviru predmeta posvećenih drugome jeziku i njegovu usvajanju bilo kao priručnik u provedbi eksperimentalnih istraživanja. U prvome se poglavlju definiraju osnovni pojmovi i termini vezani uz proučavanje procesa usvajanja drugoga jezika, opisuju se lingvistički pristupi proučavanju toga procesa te iznose osnovna obilježja eksperimentalnih istraživanja koja se provode u tome području. Drugo je poglavlje posvećeno pripremi istraživanja te su njime obuhvaćene osnovne komponente eksperimentalnih istraživanja, uključujući formuliranje istraživačkih pitanja i hipoteza, definiranje varijabla, opise osnovnih nacrta istraživanja, izbor uzorka ispitanika te izbor podražaja i postupka, a daje se i osvrt na načine kontrole kvalitete istraživanja. Treće se poglavlje detaljnije bavi ispitanicima – metodama određivanja razine njihova općeg znanja drugoga jezika, vrstama biografskih podataka koje je od njih potrebno prikupiti, etičkim pitanjima vezanim uz njihovo uključivanje u istraživanje te praktičnim pitanjima vezanim uz njihovu dostupnost, regrutaciju i testiranje. Četvrto poglavlje sadrži pregled odabranih često korištenih eksperimentalnih metoda u lingvistički orijentiranim istraživanjima usvajanja drugoga jezika, grupiranih s obzirom na različite oblike jezične realizacije koji se njima ispituju. Opisani su tako zadaci proizvodnje i oponašanja, zadaci razumijevanja i interpretacije te zadatak prosudbe prihvatljivosti rečenica. Konačno, peto poglavlje sadrži praktične napomene vezane uz vremenska, prostorna i financijska ograničenja unutar kojih se istraživanja usvajanja drugoga jezika osmišljavaju i provode, a uz njih se objašnjavaju važnost i prednosti pojačane metodološke obuke u području usvajanja drugoga jezika kako istraživača tako i nastavnika drugoga jezika

    Overview of learning materials aimed to educate students of languages and linguistics for the 21st century job market

    No full text
    The core of the UPSKILLS project is constituted by the creation of learning content dedicated to topics deemed to be of particular importance for twenty-first century students of languages and linguistics. This learning content should help students acquire the knowledge and skills needed for the contemporary job market, which offers numerous new opportunities both within and beyond traditional language-oriented professions, but which also requires skills not typically included, or at least insufficiently present in university curricula. However, UPSKILLS is not alone in wishing to bring the knowledge and skills of language and linguistics students more up-to-date with the job market, and some resources relevant for the topics it aims to address have already been created in other projects, within university curricula or in other related contexts. In order to avoid duplicating materials that have already been made available by others, the first step in the creation of UPSKILLS learning content is the present overview of existing materials

    The breadth and structure of vocabulary for the second cycle of mandatory education

    No full text
    Предмет истраживања ове докторске дисертације јесте обим и структура вокабулара уџбеника историје, биологије и географије за други циклус обавезног образовања, односно уџбеника који су намењени ученицима на узрасту од петог до осмог разреда основне школе. Основне теоријске ослонце ове дисертације представљају резулати истраживања у области каснијег лексичког развоја, са једне, и теорија о уџбенику као културно-потпорном систему, са друге стране...The subject and research of this doctoral dissertation is the breadth and structure of vocabulary in biology, history, and geography textbooks in the second cycle of mandatory education, meaning textbooks intended for students between fifth and eighth grade levels. The primary theoretical bases of this dissertation are grounded in the intersection of research concerning later lexical development and Vygotskian theory of textbook

    The breadth and structure of vocabulary for the second cycle of mandatory education ; Объем и структура лексики учебников на второй цикл обязательного образования

    Full text link
    Предмет истраживања ове докторске дисертације јесте обим и структура вокабулара уџбеника историје, биологије и географије за други циклус обавезног образовања, односно уџбеника који су намењени ученицима на узрасту од петог до осмог разреда основне школе. Основне теоријске ослонце ове дисертације представљају резулати истраживања у области каснијег лексичког развоја, са једне, и теорија о уџбенику као културно-потпорном систему, са друге стране...The subject and research of this doctoral dissertation is the breadth and structure of vocabulary in biology, history, and geography textbooks in the second cycle of mandatory education, meaning textbooks intended for students between fifth and eighth grade levels. The primary theoretical bases of this dissertation are grounded in the intersection of research concerning later lexical development and Vygotskian theory of textbook

    The breadth and structure of vocabulary for the second cycle of mandatory education ; Объем и структура лексики учебников на второй цикл обязательного образования

    No full text
    Предмет истраживања ове докторске дисертације јесте обим и структура вокабулара уџбеника историје, биологије и географије за други циклус обавезног образовања, односно уџбеника који су намењени ученицима на узрасту од петог до осмог разреда основне школе. Основне теоријске ослонце ове дисертације представљају резулати истраживања у области каснијег лексичког развоја, са једне, и теорија о уџбенику као културно-потпорном систему, са друге стране...The subject and research of this doctoral dissertation is the breadth and structure of vocabulary in biology, history, and geography textbooks in the second cycle of mandatory education, meaning textbooks intended for students between fifth and eighth grade levels. The primary theoretical bases of this dissertation are grounded in the intersection of research concerning later lexical development and Vygotskian theory of textbook

    Jezična akomodacija na Twitteru: Primjer Srbije

    Full text link
    U ovom radu istražujemo fenomen jezične akomodacije kod srpskih korisnika Twittera analizirajući geokodirane poruke objavljene u razdoblju između 2013. i 2016. godine na području Bosne i Hercegovine, Crne Gore, Hrvatske i Srbije. Jezičnu produkciju korisnika Twittera opi- sujemo s pomoću 16 varijabli za koje je poznato da variraju među govornicima policentričnog makrojezika BCHS. Uspoređujemo jezičnu produkciju mobilnih srpskih korisnika Twittera s produkcijom nemobilnih srpskih korisnika, kao i produkciju mobilnih korisnika u Srbiji i izvan nje. Dok prva analiza djelomično podržava teoriju akomodacije, druga analiza ne daje nikakve naznake tog fenomena
    corecore