Отказоустойчивый серверный комплекс.

joper 15 Августа, 2008 - 13:01

Системное администрирование

Появилась задача сделать максимально отказоустойчивый серверный комлекс.
На данный момент есть н-ое кол-во серверов, на них крутятся нужные сервисы и т.п., делается бэкап бакулой, восстановить на голое железо- дело пары часов, но теперь это стало неприемлимо.
Задача: сделать так чтобы при сбое 1-й или нескольких машин сервисы продолжали быть доступны юзерам.
Первое что пришло на ум - это сделать кластер на openmosix, поставить на него XEN и все текущие сервера сделать виртуальными машинами.
Но возникает вопрос: как с распараллеливанием у XEN?
Про ксен читал, что у него есть возможность живой миграции на новую физическую машину, но проблема в том, что это делается вроде как только по специальной команде...
Вообщем помогайте, может, кто решал такие проблемы...

Для комментирования войдите или зарегистрируйтесь

1 юзанье

Автор alexxy, дата создания 15 Августа, 2008 - 13:43.

1 юзанье мозикса и ксен здесь не адекватно
2 тут те нужен актив актив ha класетер => курим про drbd heartbeat и прочие вещи не забывая про кластерные параллельные фс
___________________________________________
Gentoo GNU/Linux 2.6.26 GCC 4.3.1
Working on Gentoo for iPAQ hx4700 :-)
Если у вас компьютер с Windows, есть два выхода: выбросить компьютер в форточку или выбросить форточки с компьютера

Для комментирования войдите или зарегистрируйтесь

Спасибо, пока

Автор joper, дата создания 15 Августа, 2008 - 14:08.

Первичную инфу покурил... Понял, что мне нужна обоюдная поглощающая конфигурация, где все узлы выполняют (перемещаемую) работу повышенной готовности. Возник вопрос, от недостатка информации, наверное, при отказе 1 узла, процессы будут перемещены с сохранением айпишеков? Просто у меня и ДМЗ есть и сервисы чисто внутренние...

Для комментирования войдите или зарегистрируйтесь

эм...ну это как

Автор alexxy, дата создания 15 Августа, 2008 - 14:45.

эм...ну это как настроишь есть такая штука называется cluster ip
курить ее =)
___________________________________________
Gentoo GNU/Linux 2.6.26 GCC 4.3.1
Working on Gentoo for iPAQ hx4700 :-)
Если у вас компьютер с Windows, есть два выхода: выбросить компьютер в форточку или выбросить форточки с компьютера

Для комментирования войдите или зарегистрируйтесь

Кстати, почему

Автор joper, дата создания 15 Августа, 2008 - 15:25.

Кстати, почему юзанье мосикса неадекватно?

Для комментирования войдите или зарегистрируйтесь

openmosix уже давно

Автор alexxy, дата создания 15 Августа, 2008 - 16:58.

openmosix уже давно мертв
mosix не для этого =)
___________________________________________
Gentoo GNU/Linux 2.6.26 GCC 4.3.1
Working on Gentoo for iPAQ hx4700 :-)
Если у вас компьютер с Windows, есть два выхода: выбросить компьютер в форточку или выбросить форточки с компьютера

Для комментирования войдите или зарегистрируйтесь

Пнятненько... А

Автор joper, дата создания 15 Августа, 2008 - 17:08.

Пнятненько...
А почему XEN не покатит, т.е. чтобы heartbeat перезапускал не сервис на резервной тачке, а XEN-домен?

Для комментирования войдите или зарегистрируйтесь

ну =) а чем это

Автор alexxy, дата создания 15 Августа, 2008 - 17:10.

ну =) а чем это тогда от обычного HA отличаться будет =)
вобщем то ничем. xen мона за уши притянуть но не нужно. мона еще openvz

___________________________________________
Gentoo GNU/Linux 2.6.26 GCC 4.3.1
Working on Gentoo for iPAQ hx4700 :-)
Если у вас компьютер с Windows, есть два выхода: выбросить компьютер в форточку или выбросить форточки с компьютера

Для комментирования войдите или зарегистрируйтесь

Возможно,

Автор joper, дата создания 15 Августа, 2008 - 17:24.

Возможно, просто не очень понятно... Объясни если нетрудно. Смотри у мя 7 серваков, на каждом свои сервисы, часть серверов в дмз, часть в локалке. Возможно ли при использовании heartbeat обойтись без резервных машин, чтобы при падении 1-го или нескольких(в идеале всех кроме последнего) серверов, вся функциональность системы сохранялась?

Для комментирования войдите или зарегистрируйтесь

Спасибо

Автор joper, дата создания 15 Августа, 2008 - 15:24.

Спасибо alexxy.
Может у кого есть иные соображения?

Для комментирования войдите или зарегистрируйтесь

А что за

Автор KiberGus, дата создания 15 Августа, 2008 - 20:55.

А что за сервисы? Хочется совсем универсальное решение или все-таки решения для каких-то конкретных сервисов? На мой взгляд, если есть возможность использовать зашитые в протокол средства повышения устойчивости, то нужно использовать их.

Для комментирования войдите или зарегистрируйтесь

1

Автор joper, дата создания 18 Августа, 2008 - 10:36.

KiberGus написал(а):

А что за сервисы? Хочется совсем универсальное решение или все-таки решения для каких-то конкретных сервисов? На мой взгляд, если есть возможность использовать зашитые в протокол средства повышения устойчивости, то нужно использовать их.

Сервисы- апач, почтарь(постфигс+довекот), бд, лдап, SVN, и т.п....
Хочется конечно универсальное решение....

Для комментирования войдите или зарегистрируйтесь

Ну ldap и вообще

Автор KiberGus, дата создания 19 Августа, 2008 - 23:45.

Ну ldap и вообще любые СУБД замечательно разливаются на несколько хостов с помощью встроенных средств репликакции и никак иначе. Что бы тут не говорили, никакая СУБД не сможет жить на сетевой файловой системе. Вернее жить будет, но не две СУБД работающие с одним и тем же файлом базы данных, они же на него блокировки делают, жестко рассчитывают, что никто ег менять не будет. Так что исключительно несколько серверов баз данных с репликацией, а клиентской ПО должно само уметь опредеять, что сервер ёкнулся и переключаться на другой. В ldap По это повсюду применяется, а вот с SQL хуже, ленятся программисты. Исключение - примитивные СУБД типа SQLite, но они моментально задохнутся порд нагрузкой.

А про остальное я скажу только одно, сделать действительно нормальную безотказную систему насного труднее и очень дорого. У всех вариантов, которые здесь приводились есть точка отказа, которая порушит все, как правило это либо свич, либо роутер, либо перераспределяющий нагрузку прокси. Насколько я понял, система будет висеть в интернете, а тогда для надежности надо иметь как минимум два аплинка, причем зарегистрироваться как автономная система, чтобы трафик при падении одного канала шел через другой. МГУ, например, себе автономную систему выбить не смог.

И нормального универсального решения не найдется. Тут все описывают, как ФС синхронизовать, а ведь еще и содержимое оперативки надо.

Для комментирования войдите или зарегистрируйтесь

:. как обычно

Автор Dmitri, дата создания 16 Августа, 2008 - 02:40.

Курим http://ru.gentoo-wiki.com/Создание_кластера_для_биллинговой_системы

__
:. Поделись опытом на ru.gentoo-wiki.com или на www.gentoo-wiki.com

Для комментирования войдите или зарегистрируйтесь

Курил.... Немного

Автор joper, дата создания 18 Августа, 2008 - 10:38.

Курил....
Немного не то, что мне нужно мне надо бы "mutual takeover configuration", а не cold standby.

Для комментирования войдите или зарегистрируйтесь

Нашёл

Автор joper, дата создания 18 Августа, 2008 - 13:48.

Нашёл интересную статью(может кому будет интересно) в конце:
http://linuxforum.ru/index.php?act=Print&client=printer&f=11&t=18331
Однозначно поможет, но к сожалению опять конфигурация cold standby.
А вот как сделать mutual takeover пока не нашёл...

Для комментирования войдите или зарегистрируйтесь

Для начала

Автор wi, дата создания 18 Августа, 2008 - 14:16.

Для начала нужна рабочая кластерная распределенная система. Так чтоб при отвале узла, что ее частично держит, файлы были доступны. Ну к примеру gfs от редхата. Затем не нее заливаем данные "кластеризуемых" сервисов. После этого бекап бакулой при аппаратном сбое теряет свою значимость прямо пропорционально количеству узлов кластера. Ессно бекапить по-любому надо, но уже не от аппаратуры , а от дураков.

Затем на каждом узле поднимаем аналогичные сервисы, соответсвенно при падении одного из узлов количество сервисов вроде как не меняется. Суть в том что конфиги и данные у этих сервисов одинаковы, и лежат на любимой кластерной фс.

Далее нужно следилко-управлялку. Это либо hertbeat либо что нить от редхата.

Решения существуют на базе дебиан, редхат, асп (лайфкеепер).

Это ссцылко на английский кластер хавту от редхата.
http://www.redhat.com/docs/manuals/enterprise/RHEL-5-manual/Cluster_Administration/

ИМХО ксен этож виртуализация. Оно по любому медленнее чем на живой машинке.

Для комментирования войдите или зарегистрируйтесь

ИМХО Я хочу

Автор joper, дата создания 18 Августа, 2008 - 14:40.

ИМХО Я хочу сделать через ксен ибо это будет удобнее для меня, т.е. вместо сервисов будут ксеновские домены(мне кажется что так проще будет, чем перетаскивать туеву хучу сервисов да ещё на каждый узел, + виртульно все серваки сохранятся), текущую систему перенести так будет быстрее, да и нагрузка не слишком большая, поэтому с ксен проблем нету...

Спасибо за пояснение, буду пробовать вообщем, а там посмотрим....

Для комментирования войдите или зарегистрируйтесь

Посмотри в

Автор POMAH007 (не зарегистрирован), дата создания 18 Августа, 2008 - 19:32.

Посмотри в сторону OpenVZ вместо XEN.
+: Если все сервера на Линуксе, то затраты на паразитную виртуальность - единицы %% от производительности сервера. Почитай на wiki.openvz.org (на память точно не помню) про Heartbeat+DRBD.

Для комментирования войдите или зарегистрируйтесь

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".

Вход в аккаунт

Меню

Навигация

Обсуждаемые темы

Новые записи в блогах

Сейчас на сайте

Сбор новостей