понедельник, 14 апреля 2008 г.

Кластер RedHat: некоторые аспекты и тонкости реализации и использования(ч.2)



Часть 1

Результаты тестирования кластера:

1. Штатное выключение активной ноды.
Останов ноды производился командой shutdown -h now.
Сервисы смигрировали. Время миграции сервисов - десятки секунд (менее минуты) и, в основном, определяются временем остановки и старта собственно запускаемых программ.

2. Штатное выключение пассивной ноды.
Отработало нормально. Но есть особенность. В некоторых случаях (зависимость от чего-либо не определена) после запуска компьютера нормально не стартует rgmanager. Признаки: на одной ноде clustat выдает нормальный статус обеих нод, на второй - не показывает состояние кластерных сервисов.

Лечится отстрелом из кластера некорректно работающей ноды (второй) командой

# cman_tool kill -n

После которой данная нода перезагрузится и нормально запустится.

3. Аварийное выключение активной ноды по питанию
4. Аварийное выключение пассивной ноды по питанию
Оценочное время реакции кластера на отключение ноды - от 5 до 20 сек. Сервисы мигрируют, время миграции зависит от скорости запуска сервисов и сравнительно небольшое.

Но столкнулся с определенными достаточно серьезными проблемами.
Суть в следующем. Отключить сервер возможно двумя способами. Первый - через iLO карту. В этом случае проходит все, как положено: определяется, что нода недоступна, нода отсекается (дергается iLO карта командой reboot, подается питание), сервисы мигрируют.

Однако, если отключить питание ноды посредством KVM (грубо говоря, выдергивается шнур из БП), питание на iLO карту подаваться не будет. Следовательно, fenced не отрабатывает отсечку ноды через iLO, переключается на режим ручной отсечки (fenced_manual) и благополучно ждет сигнала администратора, пока тот подтвердит отсечку ноды (fenced_ask_manual). Миграция сервисов не производится до отсечки, после нее - идет в штатном режиме.

При отключении режима ручной отсечки (убирается из конфига) нода пытается произвести fence через iLO карту. Но достучаться до нее не может по понятным причинам (карта физически отключена). Попытки продолжаются бесконечно, сервисы автоматически не мигрируют. После подачи питания на iLO, отсечка происходит и сервисы нормально переносятся.

Продолжение следует

Комментариев нет:

Отправить комментарий