[Admin] Notfallplan

Moin,

letzte Nacht war 06 ja mal wieder down, und heute morgen hatte ich 20
Nachrichten auf dem Smartphone.

Eine kleine Checkliste für Notfälle:

Andere Gateways oder Router nicht erreichbar:
- bat0 in br-mesh? 'brctl show' -> 'brctl addif br-mesh bat0'
- fftransit und batfast in batman? 'batctl if' -> 'batctl if add
batfast' (bzw fftransit)
- hängt trotzdem? -> 'ifdown br-mesh && ifup br-mesh' (hängt ggf. mit
den MACs der VPN-Interfaces und bat0 zuzsammen)

Kein Traffic ins Netz?
- defaultroute von table ff? 'ip r s t ff' (ip route show table ff)
-> 06: systemctl bird restart
-> 05, 08: ip r a default via 10.18.xx.1 table ff (xx = 24 für 06, 16
für 04)

Keine DHCP-Leases?
- alle: systemctl restart dnsmasq

Server hängt mit:
kernel:[49526.928204] unregister_netdevice: waiting for batfast to
become free. Usage count = 1
-> reboot (irgendwelche Versuche das Interface zu befreien führen gern
zu einer Kernelpanic)

Bitte nach dem Reboot ausführen (wird von manchen rc.locals nicht
ausgeführt, muss gefixed werden)

batctl it 5000
batctl bl 0
batctl nc 0
batctl mm 0

checken: announced der Gateway sich als solcher? batctl gw ->
batctl gw server 1000Mbit/1000Mbit

Soweit erstmal, bis zum nächsten Ausfall :slight_smile:

vg