Abstract

This paper presents an overview of some technologies that are used in modern backup systems. We consider their advantages and disadvantages. Next, we consider an example of the realisation of the backup system with files store in the database. We propose to divide the copied files into blocks of fixed length. Each block is a sequence of bytes. The block length may be adaptive, i.e. it can vary depending on the type or file size. We can store the file content in one table, and information of them such as names, attributes, and relationships between them, store in another table. The information of retained files and folders can be stored also on the client side in a hierarchical structure. It is a set of records and a model of the copied directory. The presence of such a model allows to find changes of the copied directory without additional queries to the database. If a file is modified, it is copied only the changed blocks. The model is also updated on the client side. Thus, the load on the data channel reduces. This paper presents the algorithms of saving and restoring data, and describes the factors that affect to the speed of their work. It demonstrates the dependence of the rate of saving and recovery of the fineness of the partition files, as well as the structure of the copied directory.

Highlights

  • Реализующая технологию CDP, должна иметь возможность восстановить любую версию каждого хранимого файла на любой момент времени

  • Дедубликация данных может быть выполнена до того, как данные будут записаны в целевое хранилище, или уже после записи

  • M., "Backup with Storage in a Database", Modeling and Analysis of Information Systems, 23:4 (2016), 479–491

Read more

Summary

Непрерывная защита данных

Реализующая технологию CDP, должна иметь возможность восстановить любую версию каждого хранимого файла на любой момент времени. Существуют системы, которые в отличие от традиционных производят операции копирования очень часто и позиционируются разработчиками как CDP-решения. В связи с этим системы стали делить на настоящие CDP True CDP), и на почти непрерывные CDP решения Технология True CDP отличается от традиционного резервного копирования и nearContinuous CDP прежде всего тем, что операции копирования проходят сразу при изменении данных, а не по заданному расписанию. Измененные блоки файла, предназначенные для записи на диск, некоторое время хранятся в кэше, и лишь в свободное от других операций время сохраняются физически. По этой причине система резервного копирования, реализующая технологию True CDP, не может видеть все изменения в файлах, пока операционная система не сбросит их на диск из кэша. Одним из недостатков также является негативное влияние на производительность сети при обработке файлов большого размера, например видеозаписей или файлов систем проектирования

Исключение дублирования данных
Сервисы удаленного резервного копирования
Резервное копирование с хранением информации в базе данных
Для каждого файла из текущей директории
Оценка трудоемкости алгоритма
Для каждой записи из этого набора
Поиск изменившихся данных
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call