Схемы резервирования инженерных систем ЦОД
Что такое схема с N элементами в системе резервирования и как разобраться с, казалось бы, сложной таблицей Менделеева дата-центра?
Прежде всего, необходимо сказать, что обозначение N происходит от английского слова «need», что в переводе обозначает «необходимость». А для ЦОД необходима его бесперебойная работа, то есть системы резервирования прежде всего отвечают за отказоустойчивость источников бесперебойного питания и систем охлаждения.
Для системы резервирования этот символ N является обозначением необходимой нагрузки для эффективной работы оборудования. В одной системе, как правило, используются несколько N элементов. Их принцип работы зависит от схем, по которым они были воспроизведены. Существует несколько основных видов резервирования: N, N+1, 2N, 2N+1, 2(N+1), 3/2N.
В зависимости от установленной схемы резервирования можно говорить об отказоустойчивости системы: чем система сложнее, тем она дороже и, соответственно, более устойчива к отказам и ошибкам.
N. Отличительная черта такой схемы резервирования в том, что как такового резервирования в ней нет, а надежность зависит от каждого отдельного элемента N. При сбое в работе одного из них незамедлительно будет прекращена вся работа системы. Причина в том, что, когда один из элементов выходит из строя, его нагрузку перераспределить будет некуда. В результате такого сбоя данные могут быть безвозвратно утеряны, и это повлечет за собой, соответственно, материальные убытки. Эта схема уже давно не эксплуатируется как раз по причине того, что цена простоя всего ЦОД в случае неполадок слишком высока. По сути, при данной схеме зачастую отсутствует сам ИБП или генератор, а если даже они и есть, то представлены одномодульными системами.
N+1 – схема с одним резервным элементом N. В системе N+1 резервный элемент остается незадействованным в работе до тех пор, пока в системе не произойдет сбой одного из основных элементов. В случае возникновения такого сбоя, резервный элемент примет на себя всю его нагрузку. Таким образом, система продолжит работать, но необходимость отключать всю систему для проведения ремонтных работ все еще возникнет.
Для этого предусмотрены вариации: N+2, N+3 и т.д., в зависимости от требований уровня надежности и безопасности. Но стоит учитывать, что в этом варианте усложнение схемы может привести к большему простою.
2N – это две полные параллельные системы для каждого элемента N. То есть каждый элемент N в такой схеме дублируется, а нагрузка одинакова на двух элементах. При этом ни один из них никогда не нагружается полностью, и системы делят нагрузку 50/50, но эффективность работы при этом значительно снижается. Однако, при такой системе резервирования сбой одного или нескольких элементов N или выход из строя одной из систем не повлияют на работу всей системы в целом.
2N+1 - это параллельная система резервирования, схожая с системой 2N, но с одним дополнительным резервным элементом.
Таким образом, если ЦОД выйдет из строя или потребуется техническое обслуживание, то всю нагрузку можно перенести на параллельный блок, в то время как сам дата-центр продолжит работу без остановок.
Схема 2(N+1) – это параллельная система резервирования с дополнительным элементом N, в которой резервный элемент дублируется, то есть это две полные системы по схеме N+1. При возникновении сбоя или необходимости технического обслуживания резервные элементы N остаются в любом случае, резервируются и ИБП, и системы охлаждения, ДГУ ждет своего часа на отдельной площадке. Эта система считается самой отказоустойчивой.
Схема 3/2N включает в себя все преимущества системы 2N, но такая система загружена на 2/3, а не на 50/50 как в системе 2N, соответственно и производительность у 3/2N будет намного выше, а счета за электричество – значительно меньше. При отказе одного из элементов минимальна вероятность потери нагрузки. Даже если выйдет из строя один из ИБП, то его нагрузку подхватит соседняя система. Как и в любой другой схеме, здесь возможны вариации: к примеру, если добавить четвертую группу ИБП, то схема уже будет называться 4/3 N. Как ни странно, данная схема пришла их сетей передачи данных и большой популярности у дата-центров не пользуется.
N
|
Схемы резервирования
|
N
|
N+1
|
2N
|
2(N+1)
|
Вероятность отказа
|
Длительность простоя
|
Вероятность отказа
|
Длительность простоя
|
Вероятность отказа
|
Длительность простоя
|
Вероятность отказа
|
Длительность простоя
|
1
|
0.23%
|
20ч
|
0.0005%
|
0.046ч
|
0.0005%
|
0.046ч=164сек
|
2.7·10-9%
|
0.0009сек
|
2
|
0.46%
|
39.9ч
|
0.0016%
|
0.137ч
|
4.7·10-6%
|
1.5сек
|
2.4·10-5%
|
0.008сек
|
3
|
0.68%
|
59.7ч
|
0.0031%
|
0.273ч
|
4.0·10-8%
|
0.013сек
|
9.7·10-5%
|
0.03сек
|
4
|
0.90%
|
79.5ч
|
0.0052%
|
0.454ч
|
3.5·10-10%
|
0.0001сек
|
2.7·10-7%
|
0.08сек
|
5
|
1.13%
|
99.1ч
|
0.0077%
|
0.679ч
|
2.9·10-12%
|
0.000001сек
|
6.0·10-7%
|
0.20сек
|
6
|
1.35%
|
118.6ч
|
0.0108%
|
0.948ч
|
2.5·10-14%
|
0.8·10-8сек
|
1.2·10-6%
|
0.37сек
|
7
|
1.58%
|
138.1ч
|
0.0144%
|
1.261ч
|
2.1·10-16%
|
0.7·10-10сек
|
2.1·10-6%
|
0.65сек
|
8
|
1.80%
|
157.5ч
|
0.0185%
|
1.618ч
|
1.9·10-18%
|
0.6·10-12сек
|
3.4·10-6%
|
1.08сек
|
9
|
2.02%
|
176.7ч
|
0.0230%
|
2.018ч
|
1.7·10-20%
|
0.5·10-14сек
|
5.3·10-6%
|
1.67сек
|
10
|
2.24%
|
195.9ч
|
0.0281%
|
2.460ч
|
1.4·10-22%
|
0.5·10-16сек
|
7.9·10-6%
|
2.49сек
|
|