Резервное копирование (архивирование) данных
Светлана Тимотина, заместитель генерального директора по организационному развитию ООО «Мастерхост»
https://masterhost.ru/
Резервное копирование (архивирование) - это процедура создания копии данных с целью их последующего восстановления при потере или порче оригинала. Наличие резервных копий необходимо для оперативного восстановления после аварий и катастроф.
Для хранения резервных копий используют системы хранения данных (СХД), которые различают по способу подключения:
– подключаемые локально (direct-attached storage, DAS);
– подключаемые по сети (network-attached storage, NAS);
– сети хранения данных (Storage Area Network, SAN), видимые в системе как локальные накопители, подключенные через шину SCSI, а на самом деле находящиеся удаленно и инкапсулирующие (передающие) SCSI в низкоуровневые сетевые протоколы.
Для создания долгосрочной стратегии резервного копирования необходимо ответить на следующие вопросы:
– Какой объем данных подлежит копированию?
– Как долго необходимо хранить резервную копию?
– Как часто необходимо делать резервные копии?
От этого зависит минимально необходимый объем СХД. Его можно значительно уменьшить, воспользовавшись инкрементальной или дифференциальной схемами резервного копирования.
Инкрементальная схема резервного копирования подразумевает, что каждая последующая копия содержит только те данные, которые изменились с момента создания предыдущей копии.
Дифференциальная схема резервного копирования предполагает, что копия содержит все данные, как подвергавшиеся изменениям, так и те, которые не менялись с момента создания первой копии.
Также для уменьшения объема копий используют сжатие информации, однако следует отметить, что некоторые типы данных (в основном, мультимедиа) плохо или совсем не поддаются сжатию.
– Как часто необходимо извлекать данные из резервных копий?
Не рекомендуется использовать в качестве СХД ленточные накопители, если необходимость восстанавливать данные возникает ежедневно, поскольку чтение с ленточных накопителей - достаточно медленная процедура. Для частого и оперативного восстановления данных предпочтительнее использовать дисковые накопители.
– Насколько важна сохранность резервных копий?
Если сохранность и доступность резервных копий критически важна - резервные копии должны храниться на отказоустойчивых RAID-массивах (redundant array of independent disks — избыточный (резервный) массив независимых дисков). Все данные будут дублироваться минимум на два жестких диска, что, в случае выхода одного из них из строя, сохранит резервную копию на другом. Это повышает стоимость хранения, но увеличивает производительность, сокращает время перестроения массива после замены диска и снижает влияние перестроения массива на скорость работы. Для обеспечения максимальной надежности резервного копирования предпочтительнее использовать RAID10. Если доступность копий не так важна, можно обойтись RAID6, RAID5.
– Сколько времени допустимо потратить на создание резервной копии и извлечение из нее данных?
– Допустимо ли снижение производительности дисковой подсистемы сервера, на котором снимается резервная копия?
Ответ на эти вопросы накладывает требования на скорость и загруженность дисковой подсистемы сервера, с которого копируются данные, канала передачи данных до СХД и дисковой подсистемы самой СХД (резервная копия не может быть создана или развернута быстрее, чем прочитаны, переданы и записаны данные для копирования или восстановления).
– Необходимо ли соблюдать консистентность (согласованность и внутреннюю непротиворечивость) данных в резервной копии?
– Необходимо ли сохранить доступность сервиса на время создания резервной копии?
Самый простой способ снять консистентную резервную копию - это приостановить на время создания копии работу сервиса. Если остановка сервиса нежелательна - задачу можно решить при помощи снимка файловой системы. Это механизм, реализованный в ряде файловых систем (ZFS, NTFS) и менеджере логических разделов Linux (LVM), позволяющий заморозить состояние файловой системы на определенный момент времени. Далее резервную копию можно снять со снимка файловой системы или сохранить на СХД сам снимок файловой системы.
|