HH maczarr.de

Kein gutes Technik-Wochenende

Es gibt ja manchmal so Tage da läuft alles mögliche schief. Bei mir war das neulich ein ganzes Wochenende. Gefühlt alles was ich angefasst hab ging in die Brüche. Erstmal. Fangen wir vorne an.

Mein Stromverbrauch war in letzter Zeit leicht gestiegen und da auch eine Preiserhöhung anstand wollte ich mir einen etwas besseren Überblick über meine Verbraucher verschaffen. Ich besorgte mir erstmal vier "smarte" Steckdosen, auf denen Tasmota bereits vorinstalliert war (Nous A1T, falls es wen interessiert). Ich recherchierte etwas, wie man diese Steckdosen am einfachsten ausgewertet bekommt und stieß auf Home Assistant, dazu fand ich auch eine überschaubare Anleitung zur Einbindung der Steckdosen. Außerdem gab es von Home Assistant einen Docker-Container – "perfekt", dachte ich mir, "setze ich das doch mal schnell auf".

Das NAS

Inzwischen habe ich viele Dienste als Docker-Container dauerhaft auf meinem NAS laufen. Also loggte ich mich dort ein und ... oh... "System hat einen UNC-Fehler auf Laufwerk 1 von DS218+ erkannt." und "E/A-Fehler auf Laufwerk 1 auf DiskStation." wurden mir angezeigt. Das war nicht gut, irgendwas stimmt nicht mit den Festplatten. Meinen eigentlichen Plan für diesen Freitagabend – mal schnell die Steckdosen integrieren und fertig – warf ich über Bord und startete stattdessen einen erweiterten S.M.A.R.T.-Test bei der betroffenen Platte. Dieser lief und lief und lief – bis ich schlafen ging war er immerhin bei 90% angekommen. Am nächsten Tag, gute 12 Stunden nachdem ich den Test mit 90% zurückgelassen hatte, war er immernoch bei 90%. Eine kurze Recherche bestätigte meine Befürchtung: Die Festplatte ist nicht mehr verlässlich und könnte jederzeit den gesamten Betrieb einstellen.

Kurzerhand entschloss ich mich zwei neue NAS-Festplatten (mein NAS läuft in einem Raid1-Verbund) zu kaufen. Das kam jetzt nicht völlig aus dem Nichts. Die aktuellen Platten wurden eh so langsam voll und ich hatte bereits grob den Plan in diesem Jahr mal auf größere Platten umzustellen. Ich recherchierte Preise und Platten und machte mich dann zu Notebooksbilliger hier in Hannover auf, um dort zwei neue 8 Tb-Platten zu kaufen, die meine alten beiden 2 Tb-Platten ablösen sollten. Bevor ich los ging stieß ich nochmal ein Backup auf eine externe Festplatte an, dass dann auch bereits durch war, als ich wieder zuhause ankam.

Nochmal etwas Statistik zu den alten Platten, ich war dann auch okay damit, dass sie jetzt mal den Geist aufgegeben haben. Die Platten habe ich vor ca. 11 Jahren gekauft und ins (Vorgänger-)NAS gesteckt. In der Zeit hat die nun defekte HDD 31451 Betriebsstunden aufgebaut, die andere Festplatte ein kleines bisschen weniger.

Zurück zum NAS: Ich habe zuerst die defekte Platte getauscht und der Rebuild hat dann ca. einen Tag gedauert. Anschließend – mittlerweile war Sonntag – setzte ich den Home Assistant-Docker-Container auf und wunderte mich dann, weshalb ich den in der Anleitung erwähnten Add-on Store nicht finden konnte. Etwas Recherche ergab: die Container-Variante von Home Assistant hat einige Features nicht (u.A. den Add-on Store) bzw. nur wenn man noch einiges mehr an Arbeit reinsteckt. Seufz.
Ich kramte einen RasPi 3 raus, flashte Home Assistant auf eine SD-Karte und richtete das System dort ein. Den Container auf dem NAS entfernte ich wieder und tauschte nun auch die zweite NAS-Festplatte, sodass nun nochmal ein Rebuild los ging. Am nächsten Tag war alles fertig und ich hatte wieder ein sauber laufendes NAS mit viel freiem Speicher.

Am Sonntag ging es aber noch mit dem RasPi weiter. Home-Assistant lief und ich wollte ihm im Netzwerk einen schönen, kurzen Domainnamen geben. Für mein Heim-Netzwerk habe ich eine eigene Domain und alle Dienste, die ich hier so betreibe, sind darüber mit Subdomains erreichbar und bekommen ein TLS-Zertifikat. Verwaltet wird das Ganze von meinem Unbound-DNS-Server, der ebenfalls auf einem RasPi läuft und einem Nginx Proxy Manager.

Der Unbound-RasPi

Als ich mich nun auf besagtem Unbound-RasPi einloggte navigierte ich kurz zur Config-Datei, ergänzte die nötigen Zeilen und wollte speichern. Doch ich bekam die Meldung, dass das Speichern nicht möglich sei, weil "Read-only". Huch, hatte ich die Datei mit falschen Rechten geöffnet? Nope. touch test.txt – ebenfalls keine Schreibrechte. Da fiel mir oben nach dem Login die Zeile auf, die darüber informiert, wann ich zuletzt eingeloggt gewesen sein soll und da stand was von Oktober. Ich wusste aber sicher, dass ich mich danach nochmal eingeloggt hatte. Meinen Verdachte prüfte ich noch an 1-2 weiteren Stellen, aber dann stand fest: Die SD-Karte war hinüber. Der Unbound-Dienst lief lediglich noch, weil er halt schon lief, bevor die Karte kaputt gegangen war, aber er hatte seit Monaten keine Logs geschrieben oder die Ad-Server-Block-Liste aktualisieren können.
Aus dem "ich trage kurz zwei Zeilen in die Config ein" wurde ein eeetwas längeres "ich setze den Unbound auf einer anderen SD-Karte nochmal neu auf". Ich habe zwar kein Ansible-Playbook für den RasPi, aber alle Configs waren aktuell in einem Backup, sodass es tatsächlich mit überschaubarem Aufwand erledigt war, ihn wieder neu aufzusetzen. Da es sich allerdings bei dem RasPi tatsächlich noch um einen RasPi 1 handelt, dauerte alles nur eben etwas länger.

Anschließend war Home Assistant über eine schöne Domain transportverschlüsselt erreichbar, die Tasmota-Steckdosen waren einfach integriert und eingerichtet (und ein paar Tage später dann auch kalibriert).

Diese zwei großen Technik-Ausfälle wurden dann am Wochenende noch von zwei Ausfällen begleitet, die letztlich keine waren, aber im ersten Moment zum Gesamteindruck beitrugen.

Die Waage

Zwischendurch wollte ich mir etwas genervt einen Kaffee machen und dazu mit meiner Küchenwaage die Bohnen wiegen. Doch die digitale Waage zeigte nichts mehr an. Gar nichts. Wenige Stunden vorher hatte ich sie noch problemlos verwendet. Was war los? Letztlich ganz einfach: der Akku war leer, entweder war die Warnung vorher so dezent, dass ich sie nicht gesehen habe oder es gab keine. Aber im ersten Moment dachte ich nur "Was ist denn dieses Wochenende los? Jetzt auch noch die Küchengeräte??"

grub-rescue

Am Sonntag wollte ich weiter machen, wo ich Samstagabend aufgehört hatte. Also startete ich meinen vollverschlüsselten Rechner, gab mein Passwort ein und wurde kurz darauf nur von einem "grub rescue"-Prompt begrüßt. Das Volume wäre nicht auffindbar. Jetzt auch noch der Rechner?? Ohman. Aber es sah schlimmer aus als es war. Ich habe hier seit kurzem ein Manjaro installiert und Manjaro bezieht bei der Vollverschlüsselung auch `/boot` mit ein. Gibt man sein Passwort falsch ein, sieht grub kein System zum Starten (es konnte ja nichts entschlüsselt werden) und bietet einem nur noch `grub-rescue` zur Reparatur an. Etwas dramatisch, wie ich finde. Ein Hinweis darauf, dass evtl. auch einfach das Passwort falsch gewesen sein könnte, wäre hilfreich gewesen. Da ich in der kurzen Zeit, die ich Manjaro habe, mein Passwort noch nie falsch eingegeben hatte und mein voriges OS (Xubuntu) das anders handhabt, war ich kurz etwas überrumpelt von dieser Fehlermeldung. Aber ein Reboot und etwas mehr Konzentration bei der Passworteingabe lösten dann auch dieses "Problem".

Nach dem Wochenende lief glücklicherweise alles wie zuvor und ich bin mit meiner Technik wieder im Reinen.