108495 research outputs found
Sort by
Mind the Gap: Diverse NMT Models for Resource-Constrained Environments
We present fast Neural Machine Translation models for 17 diverse languages, developed using Sequence-level Knowledge Distillation. Our selected languages span multiple language families and scripts, including low-resource languages. The distilled models achieve comparable performance while being 10x times faster than transformer-base and 35x times faster than transformer-big architectures. Our experiments reveal that teacher model quality and capacity strongly influence the distillation success, as well as the language script. We also explore the effectiveness of multilingual students. We release publicly our code and models in our Github repository: anonymised
Juhan Ulfsaki lavastuse "Teoreem" võrdlus Pier Paolo Pasolini samanimelise jutustusega
https://www.ester.ee/record=b5732383*es
Managing reverberant acoustics in singing by extending the plosive closures in vowel-plosive-vowel sequences
Poor intelligibility of sung text often occurs in reverberant rooms due to masking by the reverberation tail of the singer’s voice. This study investigates whether elongating the plosive closure phase can improve the recognition of voiceless plosives in vowel–plosive–vowel sequences sung in reverberant rooms. We hypothesize that a longer plosive closure allows the reverberation tail from the preceding vowel to decay before the plosive burst, thus reducing masking and enhancing plosive recognition. In Experiment I, 34 listeners heard stimuli (sung single-pitch vowel–plosive–vowel sequences) via headphones, with artificial reverberation and/or Brown Noise added to simulate different acoustics. Experiment II involved 33 listeners in a concert hall, where stimuli were played from a loudspeaker on the stage, and Brown Noise was played from a separate sound system. The plosive closure phase in the stimuli was edited using PRAAT software to durations 60 ms, 150 ms, or 260 ms. Recognition of plosives improved by up to 25 percentage points with longer closure phases, depending on the acoustic condition, burst intensity, and vowel pitch. Older listeners, and listeners seated in the back rows of the concert hall, showed poorer recognition. Extending the plosive closure phase generally did not improve plosive recognition in non-reverberant acoustics
Andmete turvaline jagamine Sõidukite Internetis plokiahela-põhise hajutatud õppimisega
The Internet of Vehicles enables connected vehicles to share data and collaboratively learn to enhance road safety and traffic efficiency. Federated learning has emerged as a promising approach for enabling privacy-preserving collaborative learning among vehicles, allowing them to jointly train machine learning models without sharing raw sensitive data. However, the centralized architecture commonly used in federated learning introduces significant security vulnerabilities that can compromise system integrity and reliability. While extensive research exists on federated learning security in general, there is insufficient analysis of how these security challenges manifest in specific application contexts, particularly in dynamic environments like IoV. Here we show that integrating Hyperledger Fabric’s permissioned blockchain with zero-knowledge proofs creates a comprehensive security framework that effectively protects federated learning systems against both model tampering, aggregation protocol violation, and unauthorized access while maintaining privacy. Our systematic analysis and implementation reveals that blockchain technology can address core vulnerabilities in centralized federated learning architectures while preserving their privacy benefits, demonstrating advantages over previous approaches that relied solely on cryptographic protocols or trusted third parties. By validating our framework through a concrete IoV data sharing implementation, we establish a practical foundation for securing federated learning in distributed environments. The implications of this research extend beyond vehicular networks to any domain requiring secure collaborative learning among distributed participants. As autonomous systems become increasingly interconnected, this work demonstrates how combining blockchain with federated learning can enable trustworthy data sharing while preserving both privacy and security.Sõidukite Internet (Internet of Vehicles, IoV) võimaldab ühendatud sõidukitel jagada andmeid ja koostööl põhinevalt õppida, et parandada liikluse ohutust ja tõhusust. Hajutatud õppimine (federated learning) on kerkinud perspektiivikaks lähenemiseks privaatsust säilitava koostöö õppe võimaldamiseks sõidukite vahel, võimaldades neil ühiselt treenida masinõppe mudeleid ilma tundlike algandmete jagamiseta. Siiski toob hajutatud õppimise levinud tsentraliseeritud arhitektuur kaasa märkimisväärsed turvariskid, mis võivad ohustada süsteemi terviklikkust ja usaldusväärsust. Kuigi eksisteerib ulatuslik teaduskirjandus hajutatud õppimise turvalisuse kohta üldiselt, pole piisavalt analüüsitud, kuidas need turbeprobleemid avalduvad spetsiifilistes rakendusvaldkondades, eriti dünaamilistes keskkondades nagu sõidukite internet. Käesolevas uurimuses näitame, et Hyperledger Fabric’i lubatud plokiahela integreerimine nullteadmiste tõenditega loob tervikliku turbemudeli, mis tõhusalt kaitseb hajutatud õppimise süsteeme mudeli manipuleerimise, agregeerimisprotokollide rikkumise ja volitamata juurdepääsu eest, säilitades seejuures privaatsuse. Meie süstemaatiline analüüs ja rakendus näitab, et plokiahela tehnoloogia suudab kõrvaldada tsentraliseeritud hajutatud õppimise arhitektuuride põhilised haavatavused, säilitades samal ajal nende privaatsuse eelised. See demonstreerib eeliseid varasemate lähenemiste ees, mis tuginesid ainult krüptograafilistele protokollidele või usaldusväärsetele kolmandatele osapooltele. Meie raamistiku valideerimine konkreetse sõidukite andmejagamise rakenduse kaudu loob praktilise aluse hajutatud keskkondades hajutatud õppimise turvamiseks. Käesoleva uurimuse mõjud ulatuvad sõiduki võrkudest kaugemale, hõlmates kõiki valdkondi, kus on vaja turvalist koostöö õpet hajutatud osalejate vahel. Kuivõrd autonoomsed süsteemid muutuvad järjest ühendatumateks, näitab käesolev lõputöö, kuidas plokiahela ja hajutatud õppimise kombineerimine võimaldab usaldusväärset andmejagamist, säilitades nii privaatsuse kui ka turvalisuse
Pešitta psalmide poeetilised tunnusjooned: Heebrea ja süüria psalmide võrdlev analüüs
Võttes arvesse varasemaid uurimusi Pešitta tõlketehnika kohta, on käesoleva doktoritöö eesmärk uurida, kuidas heebrea poeetilised struktuurid kajastuvad Pešitta süüriakeelsete psalmide tõlkes, et jõuda uue lähenemiseni süüria psalmide uurimises. Käesoleva uurimuse aluseks on Psalmid 8, 19, 29, 86, 96, 120, 124, 146 ja võrdluseks mittekanooniline Psalm 155. Väitekirjas tegeletakse Pešitta psalmidega vormikriitilisest vaatenurgast, tuvastades ja analüüsides stroofistruktuure ja erinevaid poeetilisi vahendeid, nagu stroofimarkerid, sõnakordus, kõlakujundid (eriti algriim), parallelism ja värsimõõt, mis arvestab nii sõnade, silpide kui ka konsonantide arvuga. Võrdleva raamistiku eesmärk on analüüsida süüria psalmide struktuuri- ja stiilielemente, kasutades heebrea psalmide ja luule uurimiseks välja töötatud analüüsimeetodeid. Heebrea tekstide rikkalik poeetilise analüüsi traditsioon on loonud väärtusliku läätse, mille abil vaadelda ja tõlgendada süüria kirjanduslikke kompositsioone, saavutades uusi teadmisi nende vormilistest omadustest ja väljendusviisidest. Süüria tõlkija eriline stiil võimaldab anda tõhusalt edasi spetsiifilisi poeetilisi vahendeid, eelkõige parallelismi, mis peegeldab hästi heebrea tekstis sisalduvat. Ehhkki teised poeetilised vahendid, nagu algriim ja sõnakordus on Pešitta psalmides olemas, kasutatakse neid siiski viisil, mis erineb eeldatavast heebrea alliktekstist. See viitab sellele, et ehkki süüria tõlkija oli teiste stiilielementide kohandamisel ja muutmisel kunstiliselt vaba ning sobitas neid süüria keele ja kirjandustraditsiooni ainulaadse keelelise ja esteetilise tundlikkusega, oli ta truu Vorlage poeetilisele struktuurile (eeldades, et Vorlage oli sarnane masoreetsele tekstile). Stroofid on süüria psalmide põhiline tunnus, mis sisaldavad erinevaid muid poeetilisi võtteid. Stroofide sees võib täheldada sõnakordust, algriimi, korduvaid süntaktilisi struktuure, parallelismi, inclusio’t, sulgemist, kiasmi ning silpide või sõnade tasakaalus arvu.Considering the previous studies in several books on the translation technique of the Peshitta, this study aims to investigate how Hebrew poetical structures are reflected in the Syriac Peshitta psalm translation in order to create a new approach to the Syriac psalms. The scope of the current study will be Psalms 8, 19, 29, 86, 96, 120, 124, 146, and, for a comparison, the non-canonical Ps 155. This study investigates Peshitta psalms from a form-critical perspective, identifying and analysing strophic structures and various poetic devices such as strophic markers, word repetition, sound figures (especially alliteration), parallelism, and metre in terms of the number of words, syllables, and consonants. The comparative framework seeks to illuminate the structural and stylistic elements of Syriac poetry by utilising analytical methods developed for studying Hebrew psalms and poetry. The rich tradition of poetic analysis of the Hebrew texts provides a valuable lens through which to view and interpret Syriac literary compositions, revealing new insights into their formal characteristics and expressive techniques. The Syriac translator’s distinct style allows for the effective transmission of specific poetic devices, notably parallelism, which closely mirrors the characteristics of the Hebrew text. However, other poetic devices, such as alliteration and word repetition, although present in the Peshitta psalms, are employed in ways that diverge from the supposed Hebrew source. This suggests that while maintaining fidelity to the core poetic structure of the Vorlage (supposing it is similar to the Masoretic text), the Syriac translator exercised artistic license in adapting and modifying other stylistic elements to suit the unique linguistic and aesthetic sensibilities of the Syriac language and literary tradition. Strophes are a fundamental feature of Syriac psalms, showcasing diverse poetic techniques. Within these strophes, one can observe word repetition, alliteration, repeated syntactic structures, parallelism, inclusion, closure, chiasmus, and a balanced number of either syllables or words.https://www.ester.ee/record=b573997
Small Languages, Big Models: A Study of Continual Training on Languages of Norway
Training large language models requires vast amounts of data, posing a challenge for less widely spoken languages like Norwegian and even more so for truly low-resource languages like Northern Sámi. To address this issue, we present a novel three-stage continual training approach that substantially improves the downstream performance together with the inference efficiency for the target languages. Based on our findings, we train, evaluate, and openly release a new generative language model for Norwegian Bokmål, Nynorsk, and Northern Sámi with 11.4 billion parameters: NorMistral-11B
Mental health and work
Uurimistöö eesmärk oli välja selgitada juhtide soo ja vanuse seos vaimset tervist toetavate meetmete rakendamisega Eesti ettevõtetes ajal, mil vaimse tervise probleemid on muutunud aktuaalseks ka töökeskkonnas. Tuginedes 2024. aasta sügisel läbi viidud küsitlusele, uurisin 194 juhi demograafiliste andmete seost ettevõttes rakendatavate vaimset tervist toetavate meetmete arvuga. Statistilise analüüsi viisin läbi Mann-Whitney ja ANOVA testidega. Tulemused näitasid, et nii noorte juhtidega kui ka naisjuhtidega ettevõtetes rakendatakse statistiliselt oluliselt rohkem vaimset tervist toetavaid meetmeid kui vanemate juhtidega ja meesjuhtidega ettevõtetes. Juhtide vanusel ei leitud olulist püsivat seost meetmete rakendamisega. Soo ja vanuse koosmõjul ei leitud statistiliselt olulist seost meetmete arvuga. Juhtide sugu osutus kõige suurema mõjuga teguriks. Tulemused kinnitavad, et juhtide demograafilistel näitajatel on oluline seos organisatsioonide vaimset tervist edendavate algatustega ning sool on suurem seos rakendatavate meetmete arvuga kui vanusel
Orgaanilised-anorgaanilised interaktsioonid eksperimentaalses ja arheoloogilises keraamikas
Väitekirja elektrooniline versioon ei sisalda publikatsiooneArheoloogiline savinõud on head orgaaniliste jääkide reservuaarid, mida saab kasutada algsete orgaaniliste komponentide tuvastamiseks. Selle keemilise teabe põhjal saab teavet mineviku kogukondade toitumise, tehnoloogiate, kaubandusvõrgustike ja elatusviiside kohta. Sedatüüpi analüüse nimetatakse orgaaniliste jääkide analüüsiks, mis kasutab savimaterjalis sisalduvate orgaaniliste jääkide tuvastamiseks ja kvantifitseerimiseks erinevaid analüütilise keemia meetodeid.
Vaatamata märkimisväärsetele edusammudele orgaaniliste jääkide analüüsil arheoloogilisest materjalist , on nende molekulide savimaatriksis säilimise aluseks olevad füüsikaliskeemilised mehhanismid endiselt halvasti uuritud. Teadaolevalt mõjutavad orgaaniliste molekulide säilimist kaks peamist tegurit: orgaaniliste ühendite adsorptsioon savi pooridesse, mis kaitseb neid tõhusalt keskkonnatingimuste eest , ning mineraalsete komponentide roll orgaaniliste molekulide säilimiseks savikeraamikas.
Käesolev doktoritöö annab aluse mõistmaks, kuidas savide mineraalne koostis mõjutab mikro- ja mesopooride teket. Nende interaktsioonide tuvastamiseks kasutati eksperimentaalselt loodud savibrikette, mis koosnevad erinevate savitüüpide segudest, savilisanditest ja on põletatud erinevatel temperatuuridel. Valikut neist kasutati jätkuanalüüsis, analüüsimaks, kuivõrd sõltub konkreetsete rasvhapete (C16:0 ja C18:1) tuvastamise savimaatrikis koostisest ja füüsikalistest omadustest. Gaasikromatograaf-massispektromeetria (GC-MS) kvantitatiivsed analüüsid näitasid, et savi põletustemperatuur ja rasvhapete lagunemine kuumutamisel mõjutavad oluliselt rasvhapete säilimist ja ekstraheerimistõhusust savimaatriksist. Lisaks kasutati savi mineraalsete komponentide kvantifitseerimiseksnõrgendatud täielik sisepeegeldusega Fourier' teisenduse infrapuna (ATR-FT-IR).
Neid analüüsimeetodeid kasutati Kukruse (Essti) 12.–13. sajandi matmispaiga arheoloogilise keraamika analüüsiks. Tuvastati, et eksperimentaalse materjali põhjal tuvastatud tendentsid olid kooskõlas savinõudest saadud tulemustega, mis tõestab, et mineraloogiline koostis mõjutab oluliselt lipiidide säilivist ja tuvastamist (arheoloogilisest) savimaterjalist.Archaeological pottery is a good reservoir of organic residues, that can be used to trace the original parent molecules from which these residues originated. Based on this chemical information, key archaeological questions about the diets of past communities, their technological practices, trade networks, and survival strategies can be answered. Chemical information can be obtained from pottery through a method called organic residue analysis, which employs various analytical chemistry techniques to identify and quantify organic residues in the material.
Despite significant progress in identifying organic residues in archaeological pottery over the years, the mechanism underlying the retention of these molecules within the clay matrix remains poorly understood. Two primary factors are known to influence this retention: the adsorption of organic compounds within the pores of clay, which effectively shields them from the harsh environmental conditions during burial, thus preserving them, and the role of the minerals in the clay pottery itself.
The contribution of this doctoral thesis provides baseline quantitative data on how mineral composition of clays influences the formation of micro- and mesopores. This was achieved through the use of experimental replicate clay briquettes made from mixtures of different clay types, temper, and fired at different temperatures. Some of these briquettes were tested for the recovery of simple fatty acids (C16:0 and C18:1). Quantitative analysis with gas chromatography-mass spectrometry (GC-MS) proved that the temper and degradation by heating significantly affect its recovery. Furthermore, an alternative method for quantifying mineral components in clays using attenuated total reflection Fourier transform infrared (ATR-FT-IR) was also employed.
These findings were applied to archeological pottery from a 12th to 13th century AD burial site at Kukruse, Estonia, and found to be consistent with the results of the clay briquettes, proving that the mineralogical composition greatly affects the recovery of lipids.https://www.ester.ee/record=b572961
An Icelandic Linguistic Benchmark for Large Language Models
This paper introduces a linguistic benchmark for Icelandic-language LLMs, the first of its kind manually constructed by native speakers. We report on the scores obtained by current state-of-the-art models, which indicate room for improvement, and discuss the theoretical problems involved in creating such a benchmark and scoring a model's performance