Abstract

In this paper, we take a close look at a web platform that provides the tools necessary for working with folklore materials and conducting scientific research based on them. Folklore studies consist of working with audio and video materials, which contain the reproduction of elements of folk art in national languages, creating specific text recordings with translation and comments, written in a public language, and building a picture of the worlds based on available resources. To structure and present this content, we use an ontology-based approach, which allows linguists to describe not only the resources, but also subject knowledge in the Semantic Web style, i.e. using hierarchies of classes, objects and relationships between them. The main feature of folklore research is the need for synchronization of translations, which is achieved by creating a parallel corpora of texts, and the ability to label texts with entities of the subject area, which is called semantic markup. Moreover, each corpus is connected with a certain nationality and has both its own national language and unique system of concepts of the world around it. Such representation imposes many non-standard requirements for the platform, such as working with arbitrary languages, supporting many ontologies, ensuring the creation and editing of national subject ontologies, semantic text markup, presentation, navigation, and search across heterogeneous resources. The developed platform provides all the necessary tools for research, including tools for the development of ontologies in specific national subject areas and manual annotation of texts in real time by several specialists. Resources of the web-platform are located in the resource ontology, which includes such concepts as corpus, video resource, audio resource, graphic image, person, geographical location, genre of text, etc. Ontologies of subject areas are presented in the form of a hierarchy, where the ontology of universals, common to all folklore studies, is located at the top level. At the same time, inherited ontologies are specialized for each represented national corpus. The web application is built with Python Django framework and the TypeScript React library. Data storage is implemented using the Postgres database.

Highlights

  • Вместо того чтобы аутентифицироваться с именем пользователя и паролем для каждого защищенного ресурса, пользователь аутентифицирует этот путь один раз (в течение ограниченного сеанса), получает ограниченный по времени токен и использует его для дальнейшей аутентификации во время сеанса

  • Данный тип реализации позволяет использовать индивидуальные онтологии для каждого типа корпусов

  • Онтологии предметных областей представлены в виде иерархии, где на верхнем уровне размещается онтология универсалий, общая для всех фольклорных исследований, а наследуемые онтологии специализируются для каждого представленного национального корпуса

Read more

Summary

Особенности исследования фольклора

В общем случае, заключается в выделении и приписывании фрагментам текста определенных тегов. При разметке или просмотре текста пользователь должен иметь возможность сразу видеть перевод для каждого значимого фрагмента, а при добавлении такого ресурса – осуществлять параллельную разметку. На основе размеченных данных пользователь имеет возможность проведения онтологического поиска и подтверждения результатов данного поиска фрагментами текста. Разметка отношений опирается на связующие слова и осуществляется между уже размеченными сущностями онтологии. Параллельно разметке текста пользователь имеет возможность пополнить текущую онтологию ПрО сущностями, встречающимися в рассматриваемой предметной области. П. При пополнении онтологии необходимо соблюдение строгого формализма, который в то же время обеспечивает гибкие средства описания предметной области, а также установления между ними семантических связей. В этом случае каждый участник процесса может создать свою версию разметки параллельного текста, не прерывая процесс работы другого участника. Экземплярами онтологии ресурсов, прикрепленными к тексту, могут быть лица, проводившие предварительную обработку отображаемого материала, места записи текста, а также информация, касающаяся первоисточника материала. Он направлен на предоставление семантических определений и пояснений, необходимых для преобразования разрозненных или локализованных источников информации в согласованный глобальный ресурс

Встроенный шаблонизатор Гибкое формирование route
Характеристика Yii Yii properties
Недостатки Конфигурации в xml Сложность реализации Низкая производительность
Защита от ошибок безопасности Быстрота развертки проекта
Инфраструктура как услуга
Модули нет да нет да Местоположение
Список литературы
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call