Angefangen hat alles während der Konvertierung am Wochenende. Als wir dabei waren die Wiki-Seiten zu kopieren, kam es ständig zu Ausfällen beim NFS. Matthias (smurfix) war deshalb auch innerhalb kürzester Zeit dreimal im Rechenzentrum, unter anderem auch um 3 Uhr morgens, und hat uns dann schlussendlich einen anderen Server von noris-network temporär zur Verfügung gestellt. Mit dem hat dann auch alles gut funktioniert. Die Ursache hier, war vermutlich eine Fehlfunktion des (fest eingebauten) SCSI-Controllers bei SMP.
Als wir dann endlich Online gingen, wurden wir jedoch mit einer Vielzahl von Anfragen regelrecht überrannt. Kurz darauf ging ubuntu-eu aber auch schon wieder offline, damit wir das NFS wieder auf einen unserer eigenen Server umziehen konnten. In den folgenden Tagen hatten wir leider noch Probleme, gute Werte für die Apache Config zu finden, um die sorgfältig vom Server-Team überlegte Server Architektur mit Load Balancing auszunutzen.
Es gab in der Zwischenzeit auch noch einige Optimierungen am Caching vom Wiki und ein paar slowqueries wurden entfernt. Das betraf unter anderem die Suche nach verwaisten und fehlende Seiten im Wiki.
Das derzeitige Problem liegt aber immer noch an der Server-Architektur, welche zwar für PHP-Skripte und statische Dateien perfekt ausgelegt ist, aber leider nicht optimal für persistente Python Anwendungen geeignet ist. Das Server-Team wird sich, sobald es wieder vollständig da ist (aus irgend einem für uns unerklärlichen Grund sind die nach den Turbulenzen fast alle auf Urlaub gefahren *g*), noch genauere Gedanken über die Umsetzung machen.
Die restlichen Probleme sind aber kleinerer Natur. Unser Trac sammelt brav alle Server-Errors und eure User-Reports um die wir uns in den nächsten Tagen verstärkt kümmern werden. Auch der Suchindex hat während den NFS-Problemen ein paar kleinere Schäden davon getragen und muss noch neu generiert werden.
Wir bedanken uns für eure Geduld, und vor allem auch bei allen Admins die uns tage- und nächtelang geholfen haben (heute ist ja schließlich SysAdmin-Day) und bei dem französischen Team, die ebenfalls einige Probleme mit uns durchgestanden haben. Besonderen Dank haben sich auch noch Matthias Ulrichs (Server-Team Leiter), Herve Rousseau (ein französicher Admin) und Thomas Johansson verdient.
Aus technischen Gründen konnten wir die Kommentare nicht aus dem alten Blog mit importieren. Alte Kommentare lesen.









