Abstract

One of the important aspects in management and acceleration of processes, operations in databases and data warehouses is ETL processes, the process of extracting, transforming and loading data. These processes without optimizing, a realization data warehouse project is costly, complex, and time-consuming. This paper provides an overview and research of methods for optimizing the performance of ETL processes; that the most important indicator of ETL system's operation is the time and speed of data processing is shown. The issues of the generalized structure of ETL process flows are considered, the architecture of ETL process optimization is proposed, and the main methods of parallel data processing in ETL systems are presented, those methods can improve its performance. The most relevant today of the problem is performance of ETL processes for data warehouses is considered in detail.

Highlights

  • Берилиштер базаларындагы жана берилиштер кампаларындагы процесстерди, операцияларды башкаруунун жана тездетүүнүн маанилүү суроолорунун бири - бул ETL процесстер, маалыматтарды алуу, трансформациялоо жана жүктөө процесси

  • Берилиштер кампасынын долбоорлорун ишке ашыруусу кымбат, татаал жана көп убакытты талап кылат

  • This paper provides an overview and research of methods for optimizing the performance of ETL processes; that the most important indicator of ETL system's operation is the time and speed of data processing is shown

Read more

Summary

OVERVIEW OF OPTIMIZATION METHODS FOR PRODUCTIVITY OF THE ETL PROCESS

Берилиштер базаларындагы жана берилиштер кампаларындагы процесстерди, операцияларды башкаруунун жана тездетүүнүн маанилүү суроолорунун бири - бул ETL процесстер, маалыматтарды алуу, трансформациялоо жана жүктөө процесси. Без оптимизации этих процессов реализация проектов в области хранилищ данных является дорогостоящей, сложной и трудоемкой задачей. Подробно рассмотрена проблема производительности процессов ETL для хранилищ данных, как наиболее актуальная на сегодняшний день. One of the important aspects in management and acceleration of processes, operations in databases and data warehouses is ETL processes, the process of extracting, transforming and loading data. These processes without optimizing, a realization data warehouse project is costly, complex, and time-consuming. Билл Инмон является одним из авторов концепции хранилищ данных (Data Warehouse). Без оптимизации процессов ETL разработка хранилищ данных является дорогостоящей, сложной и трудоемкой

Хранилище данных Данные
Количество записей
Рекомендуемый метод Инструмент Kettle
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call