0

Zum Serverausfall am 6. und 7. August

Am Samstag und Sonntag war der Server 87.106.7.32 mehr offline als online. Offene Worte sind mir am liebsten und helfen wohl auch am ehesten.

Punkt 1: Was am Wochenende lief war grosser Mist.
Punkt2: Soviel Scherereien wie mit diesem Server haben wir noch mit keinem gehabt.


Die ausführlichere Variante

Ich möchte mich an dieser Stelle bei meinen Kunden für den Ausfall entschuldigen und bedanke mich vor allem für die Geduld welche die allermeisten aufbrachten!

Vor ein paar Wochen fingen die Probleme auf der Maschine an, vom sporadische einfrieren des Apache-Webservers bis hin zum
komplettem Absturz der Maschine war alles dabei. Zu dem Zeitpunkt haben wir einige Blogs die höhrere Last machten auf einen anderen Server gelegt. Ich hatte gehofft den Fehler endgültig im Griff zu haben, es wurden ja schliesslich einige Änderungen an der Konfiguration durchgeführt. Am wochenende wurde ich eines besseren belehrt…

Am Freitag Abend war der Server komplett weg, ein Reboot half. Leider war der Erfolg nur von kurzer Dauer. Am Samstag morgen gab es nämlich schon die ersten Beschwerden. Das Monitoringsystem hat keinen Ausfall gemeldet, der Server war noch pingbar.

Nach Neustart der Dienste ging ich ins Wochenende und war den Samstag über unterwegs. Wie Murphy wollte, mit leerem Akku. Als ich dann gegen 19.00 in meine Mailbox ansah, da wurde mir klar das hier einiges im argen lag.

Das Dateisystem war total geschrottet. Die Reparatur und das Zurückspielen der Backups dauerte. Gerade weil eben Urlaubszeit
ist und ich auf Techniker im Rechenzentrum angeweisen war hat es ewig gedauert die Arbeiten zu koordinieren und durchzuführen.

Aktuell durchläuft die Maschine einige Tests. Es scheint sich um einen Hardwaredefekt zu handeln. Unklar ist, ob es sich um
einen Fehler bei Speicher, Board, oder CPU handelt. Die Ergebnisse sind widersprüchlich und noch nicht endgültig.

Es wird also definitiv noch einmal Downtime geben um Komponenten zu tauschen. Ich biete daher jedem Kunden an, auf eine zuverlässige Maschine umzuziehen. Die Umzugsarbeiten werden natürlich sofort und kostenlos durchgeführt.

Ich hoffe gegen Ende der Woche dann wieder zu einem normalen und geordneten Betrieb zurückzukehren. Gern stelle ich mich der Diskussion in den Kommentaren.

Besonderen Dank an Herrn Köllner vom Messevlog der jetzt schon den zweiten Servertanz aushält und im WordPressforum eine Lanze für mich gebrochen hat.