Oberfläche läd nicht und Fehler im Log

  • Hallo,

    mein Unraid hat ne Macke, das ist in letzter Zeit öfter passiert:


    Die Hauptseite und fast alle anderen Seiten (Plugins, Main, Dashboard) laden zwar, zeigen aber keine Werte.

    Bei den vorherigen Versuchen, das System irgendwie sauber herunterzufahren, bin ich irgendwann nicht mehr um den Resetschalter herumgekommen.

    Die Log-Seite schließt sich nach 1 Sekunde von alleine, ich konnte einen Screenshot machen:


    Sagt das jemandem was? Ne Idee wie ich mein Unraid diesmal heilen kann?


    Danke


    P.S.: Das da steht "no memory" sehe ich schon auch - aber das System hat 32 GB und ich wüsste nicht, warum das knapp werden sollte - bzw. warum "managed" Unraid das nicht irgendwie, anstatt einfach kaputtzugehen? Deswegen glaube ich, dass das was unnormales ist.

  • Das da steht "no memory" sehe ich schon auch

    da steht (bereits in der 1. Zeile) auch "kernel ... segfault ..."

    scheinbar ein kernel oder nginx error/crash und alles Weitere ist dann eine Folge davon - schätze ich mal -

    Fragen:

    - letzte Zeit ein kernel/nginx update gemacht ?

    - Möglichkeit zurück zur vorigen Version zu gehen ?

    - hilft (temporär) ein reboot oder restart von nginx [1] ?

    [1]

    wenn bei mir (Fedora oder LE) kernel updates gelaufen sind, dann mache ich u.a.

    sudo dmesg|grep -iEw 'bad|bug|conflict|corrupted|error|fail|failed|fault|fatal|invalid|Lock|NULL|segfault|stack|trace|warn'

    um grob (!) zu sehen, ob die Kiste sauber läuft.

    Wenn nicht: schaue ich mit "sudo dmesg | more" genauer nach

    Hint:

    das "sudo dmesg|grep ..." findet auch Einträge, die m.M.n. definitiv KEINE Fehler sind

    z.b.:

    ...

    [ 0.077357] Demotion targets for Node 0: null
    [ 0.132717] PCI: Using host bridge windows from ACPI; if necessary, use "pci=nocrs" and report a bug
    [ 1.007966] pcieport 0000:00:06.0: DPC: error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 4, DL_ActiveErr+
    [ 3.617419] systemd[1]: sys-kernel-tracing.mount - Kernel Trace File System was skipped because of an unmet condition check (ConditionPathExists=/sys/kernel/tracing).
    [ 3.892522] Bluetooth: hci0: OTP lock is enabled
    ....

    Ich suche aber trotzdem mit allen obigen Keywords, weil bugs/crashes/etc oft diese keyword enthalten !

    P.S.

    kenne UnRaid nicht !

  • Danke für die Hinweise, habe damit ein bisschen gegoogelt und bin darauf gestoßen:


    Kommentar von malcontentzu „Restart WebGUI without reboot?“
    Entdecke dieses Gespräch und mehr aus der Community unRAID
    www.reddit.com


    Irgendwie habe ich es geschafft, per SSH auf den Server zu gehen und habe diese beiden Befehle eingegeben:


    /etc/rc.d/rc.nginx restart

    /etc/rc.d/rc.nginx reload


    Danach ist die Oberfläche wieder OK.


    Wirklich eine Schande, dass Unraid bei mir so komisch läuft und immer diese Kinderkrankheiten hat.

  • Als Workaround könntest du die beiden einfach Nachts als Cron Job ausführen.

    Das ganze könnte tatsächlich eine Folge von Speichermangel oder defekten Ram sein. Hatte sowas ähnliches selber einmal.

    Hast du evtl. einfach zu viele VM's am laufen, den Ram zu sehr überprovisioniert?

    3x RPI 5 mit Libreelec (Client's), 2x RPI 4 mit Libreelec (Client's), 1x RPI5 als DB Server (MariaDB), PI-Hole auf Rapsi OS, 2x W11, 1xProxmox, 1x Qnap TS-431P2, TS-420 (Backup Nas).

  • Ne, ich habe nur eine kleine VM laufen für HomeAssistant.

    RAM-Defekt kann tatsächlich immer mal sein, kaum herauszufinden ohne Neukauf.

    Speichermangel könnte auch sein, als Amateur würde ich denken: 32 GB sollten reichen - und ich würde auch von einem OS erwarten, dass es nicht die Oberfläche, die wahrscheinlich die meisten verwenden (halt die Webgui) nicht als Erstes kaputtgeht.

    Vielleicht setze ich mich mal hin und schaue mir den Unraid Quellcode an, auch wenn ich keine Ahnung davon habe. Dann würde ich einen Check einbauen: Wenn der nginx Dienst kaputtgeht, starte ihn neu. Um niemanden vor den Kopf zu stoßen, würde ich dann diesen Check in den Einstellungen als Option zum Ein- und Ausschalten machen. Standard wäre an. Aber es gibt ja Leute, die darauf stehen, Systeme per Konsole zu reparieren.

  • Speichermangel könnte auch sein

    kannst du ja grob checken mit:

    free -h

    wenn die Kiste sauber läuft und nachdem der Bug aufgetreten ist.

    Ich denke allerdings auch eher, dass 32 GB reichen.

    ===

    - du kannst auch mit den Fehlern oder Teilen davon direkt googlen (z.B. "nginx segfault")

    - ggf. auch in Foren von UnRaid/nginx mal suchen, ob du mit den Fehler alleine bist oder es sogar einen Fix gibt, andernfalls einen Bug Report aufmachen.

    - ich schätze UnRaid ist debian: da lässt sich doch sicher auch memtest oder so ähnlich als BootOption installieren und mal über Nacht laufen lassen

    Für alles Weitere zur Bedienung von memtest musst du das INet bemühen z.b.

    MemTest86 - Wikipedia
    en.wikipedia.org

    man könnte auch bei Verdacht auf RAM-Riegelfehler die RAM-Riegel in den Slots tauschen oder temporär auch jeweils nur mit einem Riegel die Kiste betreiben/mem-testen, um zu sehen, ob sich die Riegel unterschiedlich verhalten.

    ===

    Schön wäre auch einen kompletten Log unmittelbar nach einem frischen Boot erzeugt mit entweder "sudo dmesg" oder "sudo journalctl -b0" zu sehen (du hattest nur einen Teil gezeigt), um zu sehen, ob deine Fehler nicht schon Nachfolgefehler von was Anderem sind ....

  • ich schätze UnRaid ist debian: da lässt sich doch sicher auch memtest oder so ähnlich als BootOption installieren und mal über Nacht laufen lassen

    nein, slackware.

    Über apps gibts den Live Memory Tester for Unraid. Einfach installieren.

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!