
In the paper the method is presented how to update traditional digitalised dictionaries based on comparison of the dictionary lemmas and a big corpus. Hunspell platform is used for generation of all the word forms from the dictionary lemmas. 6th edition of The Dictionary of Modern Lithuanian was chosen for its comparison with the lexical data from The Joint Corpus of Lithuanian. The outcome of the comparison was two lists of non-overlapping lexis: the list of the dictionary lemmas unused in the present-day Lithuanian and the list of the dictionary gaps, i.e., frequently used words and word forms ignored by the dictionary. The latter is discussed in greater detail to give lexicographers a clue for updates.


Tekstynai kaip pagrindinis duomenų šaltinis pradėti taikyti leksikografijai ne nuo savo atsiradimo, bet šiek tiek vėliau, apie 1980 metus. Bet drauge ir populiariausias tekstynų naudojimas yra jų, kaip autentiškų, leksikografų nesugalvotų, tačiau realią komunikacijos situaciją atspindinčių pavyzdžių šaltinio. Bet net ir tokiu atveju tekstynai dar nėra panaudojami tiek, kiek būtų galima. Geriausiai tekstynai panaudojami leksikografijai tuomet, kai žodynai nuo pat pradžių imami sudaryti tekstynų pagrindu. Būtent apie tai ir yra pristatomas žodyno ir tekstyno palyginimo metodas, leidžiantis nustatyti žodyne pateikiamą, bet šiuolaikinėje kalboje nevartojamą leksiką, taip pat žodyno antraštinių žodžių spragas, t. Kitas svarbus išteklius – atvirojo kodo Hunspell platformos pagrindu formalizuota lietuvių kalbos morfologija ir visa DLKŽ6 leksinė informacija, kuri buvo pritaikyta palyginti šio žodyno ir JT leksiką Kad visas analizės procesas pristatytas tik kaip galimas metodas žodynų ir tekstynų lyginamajai analizei, bet ne anksčiau rengtų žodynų kritikai. Suprantama, kad žodynų naujinimas neužkerta kelio rengti žodynus tekstynų pagrindu nuo pat pradžių. Pristatoma metodika yra nuo kalbos nepriklausoma, taigi ją galima taikyti ir kitų kalbų tradiciniams žodynams atnaujinti

Žodyno ir Tekstyno lyginimo būdai
Žodyno ir Tekstyno leksikos palyginimo rezultat
Apibendrinamosios išvados
