[Admin] srv01: slow IO

Moin,

tun wir uns so einen großen Gefallen, wenn wir srv01 weiter verwenden?
Mit netmon wieder darauf dürfte das nicht besser werden.

/dev/vda:
Timing cached reads: 17912 MB in 2.00 seconds = 8965.49 MB/sec
Timing buffered disk reads: 22 MB in 9.30 seconds = 2.37 MB/sec

Und selbst manches ls im Homedir von root dauert schon 10-15sec.

vg

Die last ist grade nicht sehr groß, aber srv01 lähmt.
https://status.nordwest.freifunk.net/munin/ffnw.de/srv01.ffnw.de/index.html
Wir sollten ihm nicht mehr last geben, eher die last besser verteilen.
Was haben wir auf ihm was ihn so belastet?
Sollten wir noch mal den srv auf Herz und Nieren über prüfen?!

Welche alternativen haben wir?

Hi,

ich Frage mich gerade warum die Kiste immer noch konstant 30 Disk IOs pro Sekunde hat. Da läuft doch aktuell nichts IO intensives drauf. Irgendwas vergessen abzuschalten oder so?

LG
Clemens

munin-update rödelt da rum.

ich bin das we am munin dran!
entferne nicht gebrauchte plugins und schau mir die last an,
nötigen falls entferne ich unwichtige, last lästige plugins
z.b multiping, httpload und sowas.

# RRD updates are per default, performed directly on the rrd files.
# To reduce IO and enable the use of the rrdcached, uncomment it and set
it to
# the location of the socket that rrdcached uses.

Hi,

wenn Munin so krass IO zieht dann ist Plugins entfernen ist nur ein Tropfen auf den heißen Stein. Wenn wir das ganze auf den monitoring Server umziehen sollten wir da was mit tmpfs (o.Ä.) machen und die updates im RAM halten: https://deadlockprocess.wordpress.com/2012/03/09/how-to-configure-a-virtualized-munin-server-to-monitor-100-servers-in-centosrhel/

Gut dass uns das auffällt bevor wir die monitoring kiste vorbereitet haben :smiley:
Hätte nicht gedacht dass munin so krass io zieht.

LG
Clemens

Hi,

wenn Munin so krass IO zieht dann ist Plugins entfernen ist nur ein Tropfen auf den heißen Stein. Wenn wir das ganze auf den monitoring Server umziehen sollten wir da was mit tmpfs (o.Ä.) machen und die updates im RAM halten: https://deadlockprocess.wordpress.com/2012/03/09/how-to-configure-a-virtualized-munin-server-to-monitor-100-servers-in-centosrhel/

Gut dass uns das auffällt bevor wir die monitoring kiste vorbereitet haben :smiley:

Jap :smiley:

vg
Tarek

Klingt nach einer Idee.

ja das sollten wir machen ein ramdisk erstellen dafür!

rrdcached und ramdisk parallel?

besserung konnte ich erreichen...
https://status.nordwest.freifunk.net/munin/static/dynazoom.html?plugin_name=ffnw.de%2Fsrv01.ffnw.de%2Fmunin_stats&start_iso8601=2015-07-18T10%3A19%3A17%2B0200&stop_iso8601=2015-07-18T11%3A53%3A47%2B0200&start_epoch=1437207557&stop_epoch=1437213227&lower_limit=&upper_limit=&size_x=800&size_y=400&cgiurl_graph=%2Fmunin-cgi%2Fmunin-cgi-graph

jetzt möchte ich rrdcached probieren!

Zitat von Bjoern Franke <bjo@nord-west.org>:

tun wir uns so einen großen Gefallen, wenn wir srv01 weiter verwenden?
Mit netmon wieder darauf dürfte das nicht besser werden.

munin hat rrdcached bekommen, diesen hat clemens installiert, getestet usw...
die IO ist wieder normal und avg load bewegt sich wieder im normalen bereich (avg1 0.12 | avg5 0.19 | avg15 0.21)
dokumentiert ist das ganze auch
https://pad.freifunk.net/p/ffnw-admin-dienste -> Munin -> Admin-Doku: https://fr32k.de/pad/p/ffnw_munin