Abstract

This article presents the analysis of approaches to data warehouse construction based on relational and NoSQL solutions and lists the limitations of the relational approach to data mining. The contradiction between data presentation in the real subject domain and the model of data presentation in the relational and NoSQL approaches is revealed. The revealed contradiction is related to the temporality of the values of individual data attributes, the variability of the composition of these attributes, and structure of connections between them. A new logical model of the data warehouse with dynamic structure is proposed. The model is based on the concept of the object as a container for properties storage. Each property of the object includes the property name and two property values without reference and with reference, that are relevant at a given time. The reference property value points to an object whose name is interpreted as the value of the property at a given time. A formal description of the model with allocation of the necessary functionality to manipulate objects and their properties (selectors, predicates, constructors) is given and the necessary control structures are introduced. Substantiation of the proposed model, called an OP-model is given on the basis of compliance with the logical ER data model. It is proved that any ER data model can be implemented in the OP-model. At the same time, the advantages of the OP-model are indicated, they are associated with the possibility of changing connections between entities due to changes in the reference value at a particular time. The potential for scalability of data warehouse due to the unique identification of each object is noted.

Highlights

  • Однако введение ограничений на создание новых объектов определенного типа, добавления и изменения свойств объектов позволяют реализовать все расcмотренные виды связей ER модели данных

  • N., "Building a Data Store with the Dynamic Structure", Modeling and Analysis of Information Systems, 23:2 (2016), 93–118

Read more

Summary

Постановка проблемы

В настоящее время разработаны и используются самые разнообразные подходы к построению хранилищ данных [1,2,3,4]. Что для NoSQL решений также можно увидеть несогласованность модели представления данных в предметной области (где данные вступают во всевозможные отношения) с упрощениями модели ключ-значение, колонка и т.д., которые, однако, отчасти могут компенсироваться гибкостью и динамичностью создаваемой структуры. Для реляционной базы данных такой подход означает изменение инфологической структуры, что невозможно без существенных затрат времени на переработку как со стороны базы данных, так и со стороны обслуживающих ее программных приложений. И хотя изменение структуры данных не становится в этом случае столь критичным для хранилища и программных приложений по работе с ним, как в реляционном подходе, все же требуется соответствующая настройка. Все это приводит авторов [14] к идее использования для моделирования нового объектно-ориентированного подхода при построении баз данных, учитывающего темпоральную природу как объектов, так и связей между ними. На текущий момент времени сохраняется актуальность решения следующей проблемы: необходимо построить хранилище данных с динамической расширяемой структурой, которая позволяла бы проводить свое масштабирование

Концептуальное описание модели
Функция получения уникального идентификатора объекта
Функция получения типа объекта
Функция получения множества кортежей имен объекта
Функция получения множества уникальных идентификаторов свойств объекта
Функция получения имени свойства по уникальному идентификатору свойства
16. Функция получения бессылочного значения свойства на заданный момент времени
17. Функция получения ссылочного значения свойства на заданный момент времени
Функция создания нового объекта Qk
Обоснование некоторых свойств модели
Направления расширения базового функционала

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.