Методика гарантированной загрузки

Приветствую!

Подскажите пожалуйста, есть ли какая-нибудь методика или комплекс мер, который бы позволил повысить шанс успешной загрузки системы до маскимума?

Поясню мысль: сервера часто стоят в закрытом помещении, зачастую удаленном на большое расстояние, без доступа к терминалу.
При этом для linux вообще и gentoo в частности свойственно такое поведение, как прервать процесс загрузки системы и задать какой-нибудь вопрос в консоль. Типа, обнаружена ошибка при проверке диска после неправильного выключения, не удалось смонтировать диск (если это например сетевая шара, которая сейчас недоступна или просто диск с данными вылетел) и т.п.

Проблема зачастую решается тривиальными действиями, типа написать "fsck /y", подтвердить, "что я действительно хочу исправить эту ошибку на диске" или убрать строку со сбойным диском в fstab.

Мне же хочется принять некоторый шаблонный комплекс мер и забыть о подобных "сюрпризах", как отправленный в ребут сервер и там оставшийся...
Не верю, что подобной методики нет, поскольку вещь востребованная, а значит, кто-то ее должен был реализовать в виде готового решения.

Подскажите, есть что-то такое и как называется?

Да, на __серверах__ есть.

Да, на __серверах__ есть. Гуглить по словам KVM, BMC, IPMI.
Судя по вопросу - у вас вместо серверов десктопы.

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

slepnoga написал(а): Да, на

slepnoga написал(а):
Да, на __серверах__ есть. Гуглить по словам KVM, BMC, IPMI.
Судя по вопросу - у вас вместо серверов десктопы.

Да, кое-где и десктопы выполняют роль серверов.
Про аппаратные средства в курсе, там где они есть - использую.

Странно просто - есть вот например аппаратные linux-based системы, типа роутеров, iscsi и т.п - они в случае любого (почти) сбоя все равно загрузятся до веб-морды и уже в ней напишут все ошибки. Скорее всего продолжат работать без какой-либо помощи админа.
А если сбой питания ночью, админ спит, ему надо проснуться, зайти в консоль, набрать fsck, а хардварное решение стартанет само?

Почему же подобное отсутствует как класс для универсальных систем? Казалось бы, небольшая переделка rc-скриптов и ядра, добавление нового runlevel или там profile - элементарно. Не может быть, чтобы это не было уже кем-то придумано и реализовано. Неужели нет?

Цитата: есть вот например

Цитата:
есть вот например аппаратные linux-based системы, типа роутеров, iscsi и т.п - они в случае любого (почти) сбоя все равно загрузятся до веб-морды и уже в ней напишут все ошибки

В таких устройствах система находится во Flash памяти, которая монтируется только на чтение, а изменяемые данные, необходимые для работы хранятся в оперативной памяти, некоторые части Flash памяти могут быть доступны на запись. Вот и получается, что вся система в основном доступна только на чтение.

А если сбой питания ночью,

А если сбой питания ночью, админ спит, ему надо проснуться, зайти в консоль, набрать fsck, а хардварное решение стартанет само?

1. На настоящих серверах ( 2 Б/П ) сбоя питания не бывает ( практически)- гуглить UPS.
2. На нормальных системах массив глушится штатно, если пропало питание - гуглить BBU.
3. на серверах используются нормальные ОС с политикой дать ссш как только возможно.

Еще раз - если "мальчик" работает за 15 тыров, то IPMI дороже, и мониторинг отсустствует как класс .......

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

kostik87 написал(а): В таких

kostik87 написал(а):
В таких устройствах система находится во Flash памяти, которая монтируется только на чтение, а изменяемые данные, необходимые для работы хранятся в оперативной памяти, некоторые части Flash памяти могут быть доступны на запись. Вот и получается, что вся система в основном доступна только на чтение.

А что мешает монтировать только для чтения rootfs на обычном ПК? С опциональным remount -rw по окончании загрузки?
Да или хотя бы в initramfs загрузку сети+ssh засунуть? Так что не убедили.

slepnoga написал(а):
1. На настоящих серверах ( 2 Б/П ) сбоя питания не бывает ( практически)- гуглить UPS.

В датацентре - безусловно. А если такой "сервер" надо поставить в удаленном офисе а-ля подвал, с пропаданиями питания на пару часов? УПС столько не проживет, да и не надо.

slepnoga написал(а):
2. На нормальных системах массив глушится штатно, если пропало питание - гуглить BBU.

Если речь о СХД в датацентре - безусловно.
А если это роутер в подвале? На котором никаких данных и нет, ну кроме кэша сквида к примеру, который даже если и порушится, можно пережить. А главная функция роутера - стартовать с нужными конфигами и выполнять свою работу, а не висеть, ожидая действий админа в консоли.
Ведь согласитесь, что моя область применения linux-based ОС тоже имеет право на существование?

slepnoga написал(а):
3. на серверах используются нормальные ОС с политикой дать ссш как только возможно.

Еще раз - если "мальчик" работает за 15 тыров, то IPMI дороже, и мониторинг отсустствует как класс .......

А вот про это как раз и был мой вопрос - можно поподробнее?
Что за такие ОС, на базе чего работают и каким софтом дается ссш? Мне казалось, что gentoo - ОС "нормальнее" некуда, разве нет?

Про "мальчика за 15 тыров" я не говорил, и про отсутствие мониторинга тоже, с этим как раз все в порядке.

Погуглил ssh в single mode и в iniramfs - нашел только колхоз rc-скриптов от таких "мальчнков за 15 тыр" и удивлен, почему нет взрослых решений, например пакета с альтернативными rc-скриптами в стиле "newtwork-only", которые стартуют сеть, ssh, а потом пытаются все остальное, при ошибках спокойно их логируя, а не падая в single mode по каждой мелочи.

Погуглил ssh в single mode и

Погуглил ssh в single mode и в iniramfs - нашел только колхоз rc-скриптов от таких "мальчнков за 15 тыр" и удивлен, почему нет взрослых решений, например пакета с альтернативными rc-скриптами в стиле "newtwork-only", которые стартуют сеть, ssh, а потом пытаются все остальное, при ошибках спокойно их логируя, а не падая в single mode по каждой мелочи.

Ну так это элементарно - взрослых решений нет потому, что взрослые дяди выросли из сервера в подвале и такой херней страдать не хотят за любые деньги, которые может предложить контора с сервером в подвале. Это классическая ситуация, когда Верхи не хотят, а низы не могут. Техническо-финансового решения задача не имеет, исключительно административные.
Т.е или у вас вместо "серверов в подвале" стоит парочка железяк от ведоров ( всякие там UMG на асе, и прочие ) , или стоит нонаме за 1000 рублей с гентой и админ-фсчк к нему в придачу.
Вобщем "Каждому свое".

P.S К сожалению, этому не учат в Вузах, и понимание подобных вещей приходитсейчас к 30-тнику ;(

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

Цитата:А если это роутер в

Цитата:
А если это роутер в подвале? На котором никаких данных и нет, ну кроме кэша сквида к примеру, который даже если и порушится, можно пережить. А главная функция роутера - стартовать с нужными конфигами и выполнять свою работу, а не висеть, ожидая действий админа в консоли.
Ведь согласитесь, что моя область применения linux-based ОС тоже имеет право на существование?

:) Имеет. Если уж UPS лень поставить (хотя бы для корректного отключения при отсутствии питания), то Live-dvd из готовой настроенной системы в качестве загрузочного носителя должен подойти даже при использовании обычного ПК.

Цитата:А что мешает

Цитата:
А что мешает монтировать только для чтения rootfs на обычном ПК? С опциональным remount -rw по окончании загрузки?
Да или хотя бы в initramfs загрузку сети+ssh засунуть? Так что не убедили.

Ну монтируй, кто тебе запрещает, а заодно в таком случае закрывай эту тему, раз сам видишь решение в этом. А потом создашь ещё несколько тем, что у тебя что-то не работает, после такого монтирования.

Да, если ты не в курсе, то rootfs и так монтируется в режиме чтения на этапе загрузки, а уже затем стартовый сценарий перемонтирует её на запись. Так-то.

Нужен грамотный подход к

Нужен грамотный подход к сборке системы, собственно Gentoo это конструктор, как настроишь так и будет.

Обслуживал зоопарк Gentoo в условиях от серверной до засраного голубями чердака.

Отключайте проверку системного диска при старте на системах которые при старте по определению не имеют ни клавиатуры ни монитора (смотреть циферки в fstab), по возможности не пишите ничего в разделы с системой. Это системный раздел, fs там портиться не от чего.
Переместите инициализацию сети и ssh перёд старта всяческих сервисов, шар, и прочего что должно происходить после старта системы.
Настройте автоматический ребут системы после кернелпаника!
Полезный и своевременный мониторинг решает большинство проблем. Снимайте по snmp smart с дисков и состояние mdraid(если есть), ну пямять, процессор, сеть, и все что представляет для вас интерес.

Ваши рекомендации для

Ваши рекомендации для специалистов банальны, а для скрипт-кидди, к которым похоже относится ТС, слишком общи...
Но, возможно, я не прав, и ТС построит, наконец, систему своей мечты. :)

SysA написал(а): Ваши

SysA написал(а):
Ваши рекомендации для специалистов банальны, а для скрипт-кидди, к которым похоже относится ТС, слишком общи...

Кидди - не кидди, а подсказать-то человеку можно/нужно.

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".