Abstract

In the paper the method is presented how to update traditional digitalised dictionaries based on comparison of the dictionary lemmas and a big corpus. Hunspell platform is used for generation of all the word forms from the dictionary lemmas. 6th edition of The Dictionary of Modern Lithuanian was chosen for its comparison with the lexical data from The Joint Corpus of Lithuanian. The outcome of the comparison was two lists of non-overlapping lexis: the list of the dictionary lemmas unused in the present-day Lithuanian and the list of the dictionary gaps, i.e., frequently used words and word forms ignored by the dictionary. The latter is discussed in greater detail to give lexicographers a clue for updates.

Highlights

  • update traditional digitalised dictionaries based on comparison of the dictionary lemmas

  • Hunspell platform is used for generation of all the word forms

  • 6th edition of The Dictionary of Modern Lithuanian was chosen for its comparison with the lexical data

Read more

Summary

Įvadas

Tekstynai kaip pagrindinis duomenų šaltinis pradėti taikyti leksikografijai ne nuo savo atsiradimo, bet šiek tiek vėliau, apie 1980 metus. Bet drauge ir populiariausias tekstynų naudojimas yra jų, kaip autentiškų, leksikografų nesugalvotų, tačiau realią komunikacijos situaciją atspindinčių pavyzdžių šaltinio. Bet net ir tokiu atveju tekstynai dar nėra panaudojami tiek, kiek būtų galima. Geriausiai tekstynai panaudojami leksikografijai tuomet, kai žodynai nuo pat pradžių imami sudaryti tekstynų pagrindu. Būtent apie tai ir yra pristatomas žodyno ir tekstyno palyginimo metodas, leidžiantis nustatyti žodyne pateikiamą, bet šiuolaikinėje kalboje nevartojamą leksiką, taip pat žodyno antraštinių žodžių spragas, t. Kitas svarbus išteklius – atvirojo kodo Hunspell platformos pagrindu formalizuota lietuvių kalbos morfologija ir visa DLKŽ6 leksinė informacija, kuri buvo pritaikyta palyginti šio žodyno ir JT leksiką Kad visas analizės procesas pristatytas tik kaip galimas metodas žodynų ir tekstynų lyginamajai analizei, bet ne anksčiau rengtų žodynų kritikai. Suprantama, kad žodynų naujinimas neužkerta kelio rengti žodynus tekstynų pagrindu nuo pat pradžių. Pristatoma metodika yra nuo kalbos nepriklausoma, taigi ją galima taikyti ir kitų kalbų tradiciniams žodynams atnaujinti

Žodyno ir Tekstyno lyginimo būdai
Žodyno ir Tekstyno leksikos palyginimo rezultat
Apibendrinamosios išvados
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.