Практика
Встретился с такой ситуацией: материнская плата Supermicro X8SIL-F на сервере и ОС Linux Debian. Как во время установки этой ОС, так и после (особенно - после) ощутил странное поведение сервера - он уходит в ребут (самопроизвольно перезагружается) без видимых причин примерно через 5 минут работы. Грех на глючные железки, но тут мелькнула мысль - раньше на этом сервере стояла Windows Server, после чего я переконфигурировал его и решил ставить Xen. Для этого пришлось полазить по BIOS, дабы убедиться, что для гипервизора все нужные опции включены.
Снова залез в BIOS и, пройдя по всему, нашел интересную опцию:
Судя по описанию, опция эта перезагружает сервер, если его активность пропадает на 5 минут - как раз такое поведение мы и видим.
Очевидно, что некоторые, а может и большинство материнских плат Supermicro (в моем случае - это бюджетная X8SIL-F) не совместимы с Linux по части Watchdog, который не видит активности операционной системы. Может быть эта фишка работает только на мелкомягких ОС - не знаю, но с Debian материнская плата уверенно считает, что все зависло и принудительно перезагружает сервер, причем нифига не аккуратно.
Выключение опции Watchdog решило проблему.
Сторожевой таймер (иногда называемый компьютер работает должным образом или КС таймером, или просто сторожевой ) представляет собой электронный или программное обеспечение , таймер , который используется для обнаружения и восстановления от компьютерных сбоев. Сторожевые таймеры широко используются в компьютерах для облегчения автоматического исправления временных сбоев оборудования и предотвращения нарушения работы системы ошибочным или злонамеренным программным обеспечением.
Во время нормальной работы компьютер регулярно перезапускает сторожевой таймер, чтобы предотвратить его истечение или «тайм-аут». Если из-за аппаратного сбоя или программной ошибки компьютеру не удается перезапустить сторожевой таймер, таймер истечет и сгенерирует сигнал тайм-аута. Сигнал тайм-аута используется для запуска корректирующих действий. Корректирующие действия обычно включают в себя перевод компьютера и связанного с ним оборудования в безопасное состояние и выполнение перезагрузки компьютера.
Микроконтроллеры часто имеют встроенный сторожевой таймер. В других компьютерах сторожевой таймер может находиться в соседнем чипе, который подключается непосредственно к ЦП , или он может располагаться на внешней карте расширения в корпусе компьютера.
Комментарии
Оставить комментарий
Операционные системы и системное программировние
Термины: Операционные системы и системное программировние