[Admin] srv02 als backup von srv01

moin,

auf srv01 haben wir wichtige Services für:

Webserver mit NginX und php5-fpm
+Wordpress und (dev.nordwest.freifunk.net, firmware.nordwest.freifunk.net)
+Munin Monitoring
+osTicket

MoinMoin - Wiki
Mailserver inkl. postfixAdmin
XMPP Server
PowerDNS inkl. poweradmin
Odoo
Yourls - Kurz-URL Service
EtherPad-light
EtherCalc

Die genannten Services dienen entweder der öffentlichen kommunikation mit den Freifunkern
durch den Webserver, unsere Mailingliste und unsere Primäre Komunikation sowie unser Ticket system,
DNS, XMPP Server und des Server Monitoring aller Server des Netzwerks.
Und noch einige Services die wir ständig nutzen Odoo, EtherPad-light, EtherCalc...

bjo hatte unseren DNS als Master(srv01) und slave(srv02) ausfall sicherer konfiguriert.
Was meines wissens noch nicht umgesetzt wurde ist ein MariaDB(MySQL) Slave.
sollte unsere DB nicht erreichbar sein sind Services wie Wordpress, XMPP, yourls, ether-pat/-calc nicht nutzbar.

Aber damit reicht es nicht. Wir hatten vor geraumer zeit ernste probleme mit srv01 und
es hat gezeigt wenn dieser nicht 100% läuft stehen wir ganz schön im regen.

Redundanz: Ich hatte an Hochverfügbarkeits-Cluster (HA Cluster) gedacht.

srv01 mit srv02 auf HA konfigurieren,
ob dies sinnvoll oder so einfach machbar ist, das weiss ich nicht,
weil ich es noch nie eingerichtet habe.

http://www.linux-magazin.de/Ausgaben/2004/07/Reservespieler
https://wiki.debianforum.de/HA_Cluster_erstellen

Hi,

ich habe mich über das Thema gestern mit bjo schon unterhalten.
Es würde schwierig werden, da alle Mailboxen etc auf srv02 gespiegelt
werden müssten. Dazu müsste srv01 und srv02 die gleiche Ausstattung haben.

Für unseren Einsatzzweck wird ein HA vollkommen oversized sein - da der
srv01 derzeit Mail und Webkram erledigt, und netcup ein guter Hoster
ist, sollten wir uns hier nicht all zu viele Gedanken machen.

Ein möglicher Ansatz wäre einmal die Dienst-Start-Problematik auf dem 01
sich anzuschauen. Sofern nach einem Reboot die Dienste wieder hochkommen
würden, bräuchten wir uns zu dieser Thematik keinerlei Gedanken zu machen.

Stefan

Dazu müsste srv01 und srv02 die gleiche Ausstattung haben.

nein. https://de.wikipedia.org/wiki/DRBD

Für unseren Einsatzzweck wird ein HA vollkommen oversized sein - da
der srv01 derzeit Mail und Webkram erledigt, und netcup ein guter
Hoster ist, sollten wir uns hier nicht all zu viele Gedanken
machen.

siehe letzte probleme, da standen wir im regen.

HA-Cluster war eine idee von mir. Es gibt bestimmt andere möglichkeiten.

Meine email sollte nicht dazu dienen zu überlegen ob ein HA
überdimensioniert ist, sonder WAS machen wir wenn srv01 NICHT KANN.
Bleiben wir im regen stehen oder haben wir eine alternative?

- --
- --
Gruß
pic

Xmpp: picard@ffnw.de & picard@fr32k.de
@ME https://wiki.nordwest.freifunk.net/picard

Hi,

ich persönlich halte Hochverfügbarkeit grundsätzlich für eine gute Idee und
hatte dieses Problem auf der Arbeit auch schon einmal auf dem Tisch. Aber:
Hochverfügbarkeit ist richtig teuer bzw. alles andere als trivial, wenn man es
selber machen möchte und darum würde ich das für uns ehrlich gesagt nicht in
Erwägung ziehen.

Wer sich damit noch nicht allgemein beschäftigt hat dem stellt sich erstmal
die Frage was Hochverfügbarkeit überhaupt ist. Da gibt es insbesondere die
Hochverfügbarkeitsklassen um Hochverfügbarkeit genauer zu spezifizieren:
https://de.wikipedia.org/wiki/Hochverfügbarkeit

Im Kontrast dazu steht Verfügbarkeit:
https://de.wikipedia.org/wiki/Verfügbarkeit

Zum Vergleich: bei Netcup bekommen wir eine Verfügbarkeit von 99,6% oder max.
35,04 Ausfallstunden pro Jahr (siehe AGB). Andere Dienste wie bspw.
DigitalOcean bieten Hochverfügbarkeit in der Hochverfügbarkeitsklasse 4 mit
99,99% Verfügbarkeit oder max. 52:36 Ausfallminuten pro Jahr (siehe SLA).

Preise und Ausstattung liegen so bei:
Netcup VM (99,6%, 2x2,5Ghz, 6GB RAM, 150GB HDD): 8€/Monat
DigitalOcean Cloud (99,99, 1x Core, 1GB RAM, 30GB SSD): 9€/Monat

Das sind so die Facts. Eine Lösung um Hochverfügbarkeit wie bei DigitalOcean
umzusetzen ist z.B. OpenStack, aber ich hatte ja schon erwähnt, dass das alles
andere als trivial ist und der ein oder andere ist glaube ich bereits bei
Puppet ausgestiegen weil auch dort einiges an Zeit für die Einarbeitung
draufgeht.

Da kompliziert oder alternativ sehr teuer, ist die Frage: was brauchen wir
eigentlich? Meine persönliche Meinung dazu ist: da bei einem Ausfall niemand
stirbt und wir auch nichts verkaufen oder eine Verfügbarkeit per SLA
garantieren, brauchen wir auch keine Hochverfügbarkeit. Aber Backup, IRC und
ein Ausdruck der Wikiseite "Debugging eines Anwendungsservers" sollte man als
Admin griffbereit haben um eine ordentliche Störungsbehebung durchführen zu
können. Wenn jeder Admin ein Auge auf diese drei Punkte hat, dann ist das für
unser Projekt denke ich ausreichend.

Viele Grüße
Clemens

Full Ack. Der Aufwand steht imho in keinem Verhältnis zum nutzen, und für DNS und als Backup-Mx gibt es ja srv02. Wenn 01 mal einen Abend nicht läuft, ist das zwar doof, aber auch kein Beinbruch. Unsere Domains werden weiter aufgelöst, Mails dann später zugestellt. Und Störungen sind bei Netcup ja nun selten.

VG
Bjo