0

Zum Serverausfall am 6. und 7. August

Am Samstag und Sonntag war der Server 87.106.7.32 mehr offline als online. Offene Worte sind mir am liebsten und helfen wohl auch am ehesten.

Punkt 1: Was am Wochenende lief war grosser Mist.
Punkt2: Soviel Scherereien wie mit diesem Server haben wir noch mit keinem gehabt.


Die ausführlichere Variante

Ich möchte mich an dieser Stelle bei meinen Kunden für den Ausfall entschuldigen und bedanke mich vor allem für die Geduld welche die allermeisten aufbrachten!

Vor ein paar Wochen fingen die Probleme auf der Maschine an, vom sporadische einfrieren des Apache-Webservers bis hin zum
komplettem Absturz der Maschine war alles dabei. Zu dem Zeitpunkt haben wir einige Blogs die höhrere Last machten auf einen anderen Server gelegt. Ich hatte gehofft den Fehler endgültig im Griff zu haben, es wurden ja schliesslich einige Änderungen an der Konfiguration durchgeführt. Am wochenende wurde ich eines besseren belehrt…

Am Freitag Abend war der Server komplett weg, ein Reboot half. Leider war der Erfolg nur von kurzer Dauer. Am Samstag morgen gab es nämlich schon die ersten Beschwerden. Das Monitoringsystem hat keinen Ausfall gemeldet, der Server war noch pingbar.

Nach Neustart der Dienste ging ich ins Wochenende und war den Samstag über unterwegs. Wie Murphy wollte, mit leerem Akku. Als ich dann gegen 19.00 in meine Mailbox ansah, da wurde mir klar das hier einiges im argen lag.

Das Dateisystem war total geschrottet. Die Reparatur und das Zurückspielen der Backups dauerte. Gerade weil eben Urlaubszeit
ist und ich auf Techniker im Rechenzentrum angeweisen war hat es ewig gedauert die Arbeiten zu koordinieren und durchzuführen.

Aktuell durchläuft die Maschine einige Tests. Es scheint sich um einen Hardwaredefekt zu handeln. Unklar ist, ob es sich um
einen Fehler bei Speicher, Board, oder CPU handelt. Die Ergebnisse sind widersprüchlich und noch nicht endgültig.

Es wird also definitiv noch einmal Downtime geben um Komponenten zu tauschen. Ich biete daher jedem Kunden an, auf eine zuverlässige Maschine umzuziehen. Die Umzugsarbeiten werden natürlich sofort und kostenlos durchgeführt.

Ich hoffe gegen Ende der Woche dann wieder zu einem normalen und geordneten Betrieb zurückzukehren. Gern stelle ich mich der Diskussion in den Kommentaren.

Besonderen Dank an Herrn Köllner vom Messevlog der jetzt schon den zweiten Servertanz aushält und im WordPressforum eine Lanze für mich gebrochen hat.

27 thoughts on “Zum Serverausfall am 6. und 7. August

  1. Marc Kersten - August 7, 2006 at 9:17 pm

    Schön, dass man mal etwas Näheres erfährt, unschön, dass die Ausfälle so lange unbemerkt bleiben können.

    Sagt jemand der heute selbst ins Büro kam und der Rechner wollte einfach nicht mehr booten. Deshalb habe ich ein gerüttelt Maß an Verständnis, aber trotzdem will ich lieber auf einem nicht „verhexten“ Server sein!

    Marc Kersten
    http://www.pdanews.de

    Reply
  2. M.Neuber - August 7, 2006 at 9:21 pm

    Ich werde das Weblog morgen vormittag umziehen. Zugangsdaten zum neuen Sytem sollten Sie schon haben. Dann können Sie schon den Mailaccount einrichten.

    Reply
  3. Thomas Ollendorf - August 7, 2006 at 9:51 pm

    Hallo Herr Neuber,

    danke für Ihre offenen Worte und die Erklärung. Viel Glück bei der Fehlerbehebung. Und lassen Sie mich bitte auf dem Server, das macht es spannender und wenn alle umgezogen sind, ist es meiner :-).

    Gruß

    Thomas Ollendorf

    Reply
  4. rüdiger duddeck - August 8, 2006 at 1:01 am

    hallo herr neuber,

    auch von mir ein dankeschön für die erklärung.
    ich drücke ihnen die daumen das sie die probleme schnell in den griff bekommen, über einen umzug brauchen wir vorerst nicht reden.

    gruss

    rüdiger duddeck

    Reply
  5. moggadodde - August 8, 2006 at 1:46 am

    Hallo Herr Neuber,
    ich bin ganz neu bei Ihnen Kundin und bedanke mich für die ausführliche Erklärung für das Desaster des Wochenendes. Trotzdem hätte ich es als sinnvoll erachtet, wenn für die jetzige Aufräumaktion ein „Keine Aktivitäten möglich von … bis ca. … “ o.ä. gekommen wäre. So ist jetzt einige Arbeit vollkommen vernichtet und ärgere mich kolossal.

    Grüße von
    Heidi Luger

    Reply
  6. M.Neuber - August 8, 2006 at 7:03 am

    @moggadodde

    An welcher Stelle fehlen Ihnen Daten? Sind Beiträge weg oder was meinen Sie genau?

    Reply
  7. J. Kleinholz - August 8, 2006 at 7:58 am

    Hallo Herr Neuber!

    Da wir selbst auch Hosting für einige unserer Kunden anbieten, habe ich vollstes Verständnis für die Probleme. Wenn etwas ausfällt, rege ich mich nicht mehr auf… das Internet „lebt“ auch mit 5 ausgefallenen Domains am WE weiter. 😉

    Besonders schön finde ich jedoch, dass man als Kunde auch einmal näheres zu den Umständen erfährt… bei TEE-Offline würde man soetwas nie mitteilen. Da bleibt alles schön anonym, oder man tut so, als ob der Server garnicht ausgefallen wäre. „Es lag wohl an der Verbindung von Ihnen zum Server…“… Ah ja..

    Danke und viel Erfolg bei der Geistesaustreibung beim Server!

    Reply
  8. Jens Kleinholz - August 8, 2006 at 8:13 am

    Hatte ich fast vergessen: Ich habe auch kein Problem damit, weiterhin auf dem eigenwilligen Server zu bleiben. 🙂

    Reply
  9. Lars Kasulke - August 8, 2006 at 8:24 am

    Hallo Herr Neuber,

    erstmal vielen Dank für die recht ausführliche Info. Leider vermisse ich noch Angaben dazu, welche Konsequenzen ein Umziehen mit sich bringt. Im Post 2 liest man z.B. „Mailaccount“.
    Insbesondere bei einem aufstrebenden Blog ist ein Ausfall ärgerlich, da auch die Mitautoren schnell nachfragen. Grundsätzlich habe ich keine Probleme auf dem Server zu verweilen, wenn abzusehen ist, dass es „der letzte große Ausfall“ war.

    Reply
  10. M.Neuber - August 8, 2006 at 8:29 am

    @ Lars Kasulke

    Grundsätzlich bedeutet ein Umzug das sich die Usernamen ändern, also für Mail, SCP, Confixx usw.

    Das Blog kann komplett kopiert werden. Allerdings haben wir jetzt zwei Plugins gefunden welche wohl mit PHP5 nicht funktionieren. Es wird dann im Einzelfall entschieden ob auf einen Server mit PHP4 gewechselt wird oder ob es eine funktionierende Alternative für das Plugin gibt.

    Reply
  11. Lars Kasulke - August 8, 2006 at 8:55 am

    @ M.Neuber

    dann hoffe ich zunächst lieber, dass es der letzte große Ausfall war 😉

    Reply
  12. Tops - August 8, 2006 at 9:14 am

    Hi,
    als nicht Kunde, aber Nutzer eines betroffenen Blogs habe ich hochachtung für den offenen Umgang mit der Geschichte. Selbst hab ich als Hobby nen Server am laufen, und weiß wie verhext es manchmal sein kann. Das einzige was ich trotz Erklärung kritisieren muss ist die lange Zeit bis es wenigstens „Angegangen“ wurde.
    Doch was solls – der offene Umgang ist einfach über alle maße zu loben.

    Reply
  13. Fontagnier - August 8, 2006 at 10:03 am

    puh! am wochenende hab ich gekocht. natürlich hab ich verständnis dafür. sicher werden sie das problem konsequent angehen. ich bleibe erstmal auf dem server. allerdings: bei einem weiteren, ungewollten ausfall möchte ich dann doch lieber umziehen. erbitte ihre vorab-info falls sie runterfahren müssen … beste wünsche zum zähmen der kiste!

    Reply
  14. Doris - August 8, 2006 at 10:31 am

    Hurra wir leben noch!
    Ist doch nur ein Server und keine AKW

    Reply
  15. rene - August 8, 2006 at 4:39 pm

    den kommentaren möchte ich mich anschließen. das man bei den netztauchern guten service bekommt, weiß ich schon seit jahren und dieser beitrag ist ein gutes beispiel dafür, daß offen die probleme dargestellt werden. – hilfe habe ich hier immer erhalten. 🙂

    danke fürs gute webmaster herr neuber und möge ihnen einer den schweiß von der stirn wischen. 🙂

    lieben gruß rené

    Reply
  16. Frank Temmler - August 8, 2006 at 4:45 pm

    Ich hab auf dem Server ein Forum laufen und gerade am letzten Wochenende war das jährliche Treffen, so dass die Ausfallzeiten genau auf die Zeiten fielen, wo die User folgendes machen wollten: „nochmal schnell gucken wo ich hinfahren muss“ oder am Ende des WEs „berichten wie schön es war“.
    Das war natürlich sehr ärgerlich und ich kann nicht überblicken wie groß der „Schaden“ dadurch war. Ansonsten habe ich schon Verständnis, das Technik auch mal ausfallen kann. Die ausführliche Stellungnahme bin ich von anderen Providern nicht unbedingt gewohnt, kann also trotz alledem auch kein kleines Lob aussprechen 😉

    Achso, ich will auch auf dem Server bleiben.

    Tipp: eine kurze Mail über Zwischenstände hätten die Gemüter früh beruhigen können.

    Reply
  17. M.Neuber - August 8, 2006 at 4:50 pm

    @ Frank Temmler

    Die Benachrichtigung der Kunden zwischendurch ist eine Sache die ich verbessern werde!

    Reply
  18. SpuTniQ - August 9, 2006 at 6:01 pm

    Aloha,

    also erstmal danke für die ausführliche Stellungsnahme. Jeder will doch mal am Wochenende für sich sein. (Gerade bei dem Wetter)

    Doch kann ich mich dem Tipp „eine kurze Zwischenmail“ zu versenden nur anschließen. Im Allgemeinen beruhigt das die Kunden. — eigene Erfahrung. 😉

    Grüße

    SpuTniQ

    axxo,
    ich habe oben in den Kommentaren gelesen, dass einige Server mit PHP 5 und einige mit PHP 4 betrieben werden. Warum werden nicht alle mit PHP 5 betrieben?

    Reply
  19. M.Neuber - August 11, 2006 at 1:12 pm

    @ Sputniq

    PHP5 wird erst seit kurzem eingesetzt. Viele Sachen laufen unter PHP5 noch nicht korrekt. Es gibt aber auch Kunden die modifizierte Shops haben die unter PHP4 gar nicht mehr laufen. Im Grunde dient uns das als Test unter hartem Einsatz.

    Reply
  20. Frank Weide - September 18, 2006 at 10:52 pm

    An dieser Stelle möchte ich anmerken, dass mich Ihre offene Art mit Ihrem Serverproblem vom August umzugehen, bewogen hat bei Ihnen Kunde zu werden. Machen Sie weiter so!

    Reply
  21. Toppi - Oktober 8, 2006 at 10:52 pm

    „Wenn der eigene Provider selbst ein WordPress Blog führt, und somit die Macken dieser Blogsoftware kennt, dann sehe ich hier nur Vorteile.“

    Ja, nur wurde vom Provider hier seit August kein Beitrag mehr geschrieben und oft genug ist wphosting.de gar nicht zu erreichen. So toll ist das mit dieser firma auch nicht.

    Reply
  22. M.Neuber - Oktober 9, 2006 at 11:48 am

    Das hier inhaltlich mehr passieren kann, ist sicher richtig.

    Was die Kritik zur Firma angeht hätte ich das gern konkreter, dann kann ich dazu was sagen. Wenn du dich vom Service überzeugen möchtest dann richte ich gern einen Testaccount ein!

    Reply
  23. meinhard - November 20, 2006 at 6:10 am

    naja, besser als offen worte ist kein ausfall.

    Reply

Leave a Reply