ПОСТРОЕНИЕ ОТКАЗОУСТОЙЧИВЫХ СИСТЕМ - ДиРайт

ПОСТРОЕНИЕ ОТКАЗОУСТОЙЧИВЫХ СИСТЕМ

Создаем отказоустойчивые системы


Системы с повышенным значением надежности

Отказоустойчивые системы (англ. fault-tolerant system ) – системы с повышенной надежности. Подобные решения повышают доступность системы – вероятность работоспособности системы в момент времени «t».

В современном бизнесе, все больше компаний, на первое место выдвигают требование максимальной надежности информационных систем.

Особенно актуален вопрос отказоустойчивости систем для бизнеса, где ошибка в работе системы или временной ее простой (составляющий порой минуты) оборачиваются внушительными финансовыми потерями. Когда час неработоспособного простоя, порой может исчисляться миллионами убытка.

Конечно системы гарантирующей отказоустойчивость на 100%, еще не существует. Существуют методы, позволяющие добиться максимальной отказоустойчивости, а именно высокой безотказности, бесперебойности работы системы при наличии отказов и более продолжительный жизненный цикл эксплуатации. Отказоустойчивые системы, помимо преимуществ, имеют и ряд специфических характеристик, таких как: сложность дизайна, повышение энергопотребления, усложнение системы и высокая стоимость развертывания.


Сокращение производственных потерь


Более продолжительный жизненный цикл эксплуатации

Построение отказоустойчивой системы (fault-tolerant system), основывается на выявлении наиболее критических мест, при простое которых компания несет наибольшие потери, а также на знании и понимании природы тех видов отказов, вероятность которых, при данных условиях эксплуатации устройства, имеют максимально большую вероятность возникновения.

Вопрос построения отказоустойчивой системы и непрерывности сервисов необходимо рассматривать используя комплексный подход, охватывающий необходимые разделы ИТ структуры:

  • Приложения и сервисы.
  • Серверы и системы хранения данных.
  • Сетевая инфраструктура и сервисы, включая локальные и глобальные сети.
  • Инженерная инфраструктура.

Достичь требуемого уровня отказоустойчивости ИТ-инфраструктуры можно лишь решая вопрос комплексно, по всем разделам. Подобный подход, позволяет обеспечить однозначную поддержку всех бизнес-приложений и услуг, которыми пользуются сотрудники компании, а также он дает возможность оценить и запроектировать ИТ-инфраструктуру с требуемыми показателями надежности и доступности.

Для оценки отказоустойчивости новой системы и ее надежности, важен регулярный анализ статистической информации, т.к. отказы могут возникать внезапно (без предварительного ухудшения выходных характеристик), либо заранее прогнозироваться постепенным изменением выходных характеристик.

Целью использования систем автоматизации с высоким коэффициентом готовности является сокращение производственных потерь. При этом не имеет значения, вызваны ли эти потери неисправностью или являются результатом работ по обслуживанию. Чем выше расходы, связанные с остановкой производства, тем более целесообразно использование отказоустойчивой системы. Более высокие, как правило, капитальные затраты на отказоустойчивые системы быстро компенсируются за счет устранения производственных потерь. Т.к. потери от нескольких часов простоя, а в некоторых компаниях даже минутой бездействия по вине отказа, могут легко соизмеряться стоимости построения и внедрения отказоустойчивой системы.