ДиРайт – Правильные ИТ решения

Дирайт

Построение отказоустойчивых систем

Отказоустойчивые системы (fault-tolerant system) – это системы с повышенным значением надежности. Подобные решения повышают вероятность того, что система в момент времени «t» будет находиться в работоспособном состоянии. Такая вероятность называется доступностью системы.

На сегодняшний день, все больше и больше компаний, выдвигают на первое место, требование максимальной надежности информационных систем. Данный вопрос особенно актуален для бизнеса, где ошибка в работе системы или временной ее простой (составляющий порой секунды) оборачиваются более чем внушительными финансовыми потерями. Когда час неработоспособного простоя, порой может исчисляться несколькими миллионами убытка.

Конечно системы гарантирующей 100% отказоустойчивость, еще не существует. Однако, существуют методы позволяющие добиться максимальной отказоустойчивости, а именно высокой безотказности, бесперебойности работы системы при наличии отказов и более продолжительный жизненный цикл эксплуатации. Отказоустойчивые системы, помимо преимуществ, имеют и ряд специфических характеристик, таких как: сложность дизайна, повышение энергопотребления, усложнение системы и высокая стоимость развертывания.

Вопрос построения отказоустойчивой инфраструктуры и непрерывности сервисов необходимо рассматривать используя комплексный подход, охватывающий необходимые разделы ИТ структуры:

  • Приложения и сервисы.
  • Серверы и системы хранения данных.
  • Сетевая инфраструктура и сервисы, включая локальные и глобальные сети.
  • Инженерная инфраструктура.

Достичь требуемого уровня отказоустойчивости ИТ-инфраструктуры можно лишь решая вопрос комплексно, по всем разделам. Подобный подход, позволяет обеспечить однозначную поддержку всех бизнес-приложений и услуг, которыми пользуются сотрудники компании, а также он дает возможность оценить и запроектировать ИТ-инфраструктуру с требуемыми показателями надежности и доступности.

Разработка отказоустойчивой системы (fault-tolerant system), основывается на выявлении наиболее критических мест, при простое которых компания несет наибольшие потери, а также на знании и понимании природы тех видов отказов, вероятность которых, при данных условиях эксплуатации устройства, имеют максимально большую вероятность возникновения.

Для оценки отказоустойчивости новой системы и ее надежности, важен регулярный анализ статистической информации, т.к. отказы могут возникать внезапно (без предварительного ухудшения выходных характеристик), либо заранее прогнозироваться постепенным изменением выходных характеристик.

Целью использования систем автоматизации с высоким коэффициентом готовности является сокращение производственных потерь. При этом не имеет значения, вызваны ли эти потери неисправностью или являются результатом работ по обслуживанию. Чем выше расходы, связанные с остановкой производства, тем более целесообразно использование отказоустойчивой системы. Более высокие, как правило, капитальные затраты на отказоустойчивые системы быстро компенсируются за счет устранения производственных потерь. Т.к. потери от нескольких часов простоя, а в некоторых компаниях даже минутой бездействия по вине отказа, могут легко соизмеряться стоимости построения и внедрения отказоустойчивой системы.

Поддержка

  • Телефон Дирайт 8 (495) 580-98-17
  • ICQ Дирайт 610886471
  • Skype Дирайт diright.diright
  • Почта Дирайт Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Визитная QR-та

DiRight QR