Abstract

Lithuanian language is quite complex and flexible, and its significantly complicates the development of efficient algorithms for the automatic processing of Lithuanian texts. For studying text-styles features were selected the universal quantitative characteristics that are unrelated to the text content and can be calculated for any text. This article shows how mathematical Statistics can help to distinguish and interpret the Lithuanian language styles. Studies of the log-linear models show theconnection between the letters and sounds structure and the scientific and fiction.

Highlights

  • Trimatės dažnių lentelės logtiesiniai modeliaiKadangi šis darbas yra taikomasis, o nuoseklus logtiesinių modelių matematiniu pagrindu išdėstymas yra gana ilgas, tai apsiribosime tik trimačio kategorinio požymio logtiesinių modelių ir jų interpretacijos trumpu aprašymu

  • Lithuanian language is quite complex and flexible, and its significantly complicates the development of efficient algorithms for the automatic processing of Lithuanian texts

  • For studying text-styles features were selected the universal quantitative characteristics that are unrelated to the text content and can be calculated for any text

Read more

Summary

Trimatės dažnių lentelės logtiesiniai modeliai

Kadangi šis darbas yra taikomasis, o nuoseklus logtiesinių modelių matematiniu pagrindu išdėstymas yra gana ilgas, tai apsiribosime tik trimačio kategorinio požymio logtiesinių modelių ir jų interpretacijos trumpu aprašymu. Kad turime trijų kategorinių (vardinių) požymių, A ∈ {1, . N}, dažnių lentelę, sudarytą iš tiriamuose duomenyse stebėtų tų požymių dažnumų. Kad μijs > 0 su visais (i, j, s). 0 modelis: požymiai A, B ir C yra tarpusavyje nepriklausomi. 1 modelis: požymis A nepriklauso nuo požymių poros (B, C), bet požymiai B ir C yra priklausomi. 4 modelis: A ir C bei B ir C yra priklausomi. Šis modelis nusako požymių A ir B sąlyginį nepriklausomumą, kai žinomos C reikšmės, t.y., A ir B tarpusavio priklausomumas pasireiškia tik per C. Kad logtiesinio modelio lygtis (1) ir jos daliniai atvejai, aprašyti 1 lentelėje, nusako tik stebėtų dažnių vidurkio pavidalą. Kategorinių požymių analizėje paprastai laikoma, kad stebėtų dažnių skirstinys yra polinominis arba polinominių skirstinių sandauga, arba stebėti dažniai yra tarpusavyje nepriklausomi Puasono atsitiktiniai dydžiai. Vieno iš šių skirstinių pasirinkimas paprastai gana silpnai įtakoja statistines išvadas

Logtiesiniai raidžių ir garsų modeliai
SUMMARY
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.