Abstract

В корпус собраны поэтические тексты, опубликованные в печатных изданиях с 1840 по 1850 гг. и представляющие рефлексию поэтов этого времени над жанром литературной баллады. Тексты объединены в zip-архиве ballad40.zip, где каждое стихотворение представлено в виде отдельного .txt файла (кодировка UTF-8); имя файла содержит индивидуальный номер текста в корпусе (id), год публикации и фамилию автора/акроним/псевдоним (в формате id_год_автор.txt). Метаданные к текстам – полные библиографические описания, расшифровки подписей авторов, метрические характеристики стихотворений, а также такие признаки, как наличие прямой речи и тип повествователя, – находятся в таблице ballads40_metadata.tsv. Тексты в корпусе соотносятся с таблицей метаданных согласно id-номерам. Принципы выборки текстов в корпус и расшифровка сокращений в таблице метаданных приведены в файле Readme_RUS.txt. The repository contains a corpus of Russian literary ballads published between 1840 and 1850. Each poem is presented as a separate plain text file (in UTF-8 encoding) and named with a unique id (a filename is presented as id_year-of-publication_author.txt); all the texts are gathered in the zip-archive ballad40.zip. The metadata, such as authors' names, publication date(s) and source(s), metrical features, type of narrator and presence of direct speech are stored in the ballads40_metadata.tsv table. The texts can be connected with the metadata table by id-s. More information on corpus and metadata structure can be found in the Readme_ENG.txt file.

Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.