Привет, красноглазые! Есть сервер, раздающий WebDAV на дебиан squeeze. Есть его рабочая копия, которая должна подниматься автоматом, если первый ляжет. Подскажите пож-та набросок решения: настройки сети, спец. сетевое оборудование и т.д. Наверняка это задача стандартная.

Упростится ли задача, если сервер и его копия будут запущены внутри kvm но на разных физ. узлах, конечно)?

8 Responses to Горячее резервирование хоста

  1. 0tsMega:

    keepalived, как вариант

  2. VonMilk:

    HaProxy можно раком прикрутить. А так только кипалайв, как оратор выше говорит

  3. OreRain:

    ок, а как его реализовать?
    может, сделать программный роутер на резервном узле? слать трафик через него, и если основной не отвечает на сигналы keepalive (как их формировать?), переводить запросы целиком на резервный.

    какие ещё варианты возможны?

  4. 0tsMega:

    keepalived умеет VRRP и IPVS. VRRP спасает, когда теряется сервер (кернелпаник, например), но не спасает, когда теряется сервис (Web-сервер «ушел в себя» или скорился). По IPVS keepalived умеет балансировать нагрузку и проверять, что бэкенды еще живы. Можно соорудить схему VRRP + IPVS, если правильно приготовить, то получается весьма живучая система.

  5. Nezmo:

    Точно не знаю какие есть бесплатные кластерные решения для линукса, но думаю есть.
    Настраиваешь кластер, там по какому либо принципу проверяешь что работает твоя программа, или по сети отвечает при установлении tcp соединения или хост пингуется или процесс сушествует и если он замечает, что на одном узле программа не работает, то запускает её на другом. Обычный кластер 🙂
    На солярке был, когда она была бесплатная Sun Cluster.

  6. OreRain:

    если я правильно понял, то что ты предлагаешь работает на уровне ОС и дёргает процессы на разных узлах. мне же нужно решение чисто сетевое, но программное. например: демон проверяет отзывчивость узла (пингами или запросами keepalive) если тот молчит — перекраивает сеть (маршруты и пр.)

  7. Nezmo:

    Это не уровень ОС. Висит процес, переодически проверяет работу твоей программы по некоторым кретериям (icmp echo, tcp syn, ps -ef |grep и т.д.), такой процесс на каждом узле и у них есть кворум. Как только на одном узле он понял что твоя программа не работает, он стартует её на другом.
    Первая же ссылка в гугле:
    http://www.linux-ha.org

    Можешь другие искать по словам high availability cluster linux

  8. NomRain:

    CARP + Watchdog
    Первое сработает когда сервер или сеть отвалилась, второе если сам сервис рухнет.

Добавить комментарий