[HowTo] Papierloses Heim mit Paperless inkl. OCR

  • Ich war da bisher zu faul zum suchen ... hab immer das PDF geöffnet und bei Drucken gesagt speichern als PDF ... schwupps war die Signatur weg und alles gut :D Aber viel zu umständlich. So ist's doch schöner

    das Einzige was am Ende zählt ist
    dass ihr lebt was ihr liebt und liebt wofür ihr lebt


    Kodi HTPC - W11 | AMD Athlon 3000G | Pioneer A 504R Bj. 96
    OMV NAS - NAS | Emby Server | LogitechMediaServer
    3x Logitech SqueezeBox & 3x RasPi PiCorePlayer
    Loxone SmartHome

  • Bin gerade über dieses Thema gestolpert und habe mir paperless ngx mal angeschaut. Sieht sehr gut aus!! Habe bisher mit Open Paperwork versucht zu arbeiten, aber das war nicht das was ich gesucht habe. Paperless sieht da deutlich besser aus. Werde es mal testen.

    Vielen Dank für den Tipp!!

  • Ich brauche nochmal eure Hilfe. Hat von euch jemand automatische ASN Zuweisung am Laufen? Ich bekomme das einfach nicht hin.

    Ich habe mir von Avery Klebeetttiketen bestellt, die wie folgt aussehen:

    ASN00001  ASN00002 ...

    Danach habe ich in Unraid entsprechend die folgenden Env-Vars angelegt:

    Docker Container neugestartet und dann ein Dokument mit dem Aufkleber gescannt. Paperless-ngx erkennt im OCR auch die ASN00001, aber weißt sie nicht der ASN zu.

    Was mache ich denn falsch?

  • Hi,

    ich habe mir nun endlich auch mal Paperless-NGX (v.2.6.3) auf meiner Syno installiert. (Docker)

    Habe testweise auch ein Dokument hochgeladen und mein Gmail-Konto eingebunden. Das läuft soweit.

    Zusätzlich habe ich noch einen Ordner auf der Syno freigegeben und diesen in Windows 11 als Netzlaufwerk hinzugefügt. Mein Ziel ist es, wenn ich dort eine Datei reinkopiere, dass diese dann automatisch nach ca. einer Stunde dann in Paperless landet.

    Habe das per Befehl in der Aufgabenplanung der Syno gemacht, aber irgendwie läuft das nicht und ich weis nicht wieso.

    Das mit dem Netzlaufwerk geht. Wenn ich dort eine Datei rein kopiere, dann seh ich die auch in meinem freigegebenen Ordner auf der NAS. Möchte nun per Script einfach, dass alle ca. 60 min im freigegebenen Ordner (paperlessngxincoming) geguckt wird, ob neue Files da sind und wenn ja, dann sollen die in

    /docker/paperless-ngx/consume kopiert werden. Daraufhin sollte ja Paperless die Files einlesen (können)?


    Oder seh ich das falsch? Bzw. wo liegt denn mein Fehler?


    Zweitens...ich verstehe das mit der Nextcloud nicht, wie es auf Seite 1 hier beschrieben ist. Muss ich Nextcloud im Docker installieren oder wie? So wie ich es verstanden habe, kann ich dann per Handy ein Dokument abfotografieren und dieses wird dann in die Nextcloud hochgeladen und von dort gehts dann in mein Paperless auf der NAS?! Verstehe da nicht so ganz, wie ich das genau einrichten muss. :(

  • Warum machst du es dir denn mit dem Verzeichnis so kompliziert? Also welchen Grund hat es das du ein zusätzliches Verzeichnis nutzen möchtest?

    Für Paperless gibt es ja das Volume


    /usr/src/paperless/consume

    Und dieses Volume kannst du ja hin kopieren wo du willst. Sobald Dateien hier rein kopiert werden, werden sie von Paperless verarbeitet.

    Nextcloud musst du nicht zwangsweise nutzen, wenn es dir nur darum geht Dateien per Handy-Upload in dein Paperless zu kriegen, dann kannst du auch einfach die App von denen nutzen. Möchtest du aber auch von extern auf deine Daten zugreifen und ggf. noch mehr mit der Nextcloud machen, dann bietet sich das natürlich an.

    NAS: Gehäuse: Jonsbo G3, Mainboard: MSI B460M PRO, CPU: Intel Pentium G6400, OS: OMV 6

    Client: NVIDIA Shield Pro 2019

  • Einfach den Consume Ordner Freigeben und darein kopieren, fertig :) So wie benny das sagt, ansonsten Tipp ich Berechtigungsproblem. Werden die Daten denn rein kopiert sauber? Wenn ja, was sagt der Log vom paperless? Sollte ja in der GUI auch was dazu stehen. Links unten unter "Dateiaufgaben" oder "Protokolle" mal reinschauen.

    das Einzige was am Ende zählt ist
    dass ihr lebt was ihr liebt und liebt wofür ihr lebt


    Kodi HTPC - W11 | AMD Athlon 3000G | Pioneer A 504R Bj. 96
    OMV NAS - NAS | Emby Server | LogitechMediaServer
    3x Logitech SqueezeBox & 3x RasPi PiCorePlayer
    Loxone SmartHome

  • Ahh okey. Ja, die App habe ich gefunden. Muss aber dann noch Ports freigeben, damit ich die Adresse dort eingeben kann, weil ich vllt. auch von unterwegs da mal was hochladen möchte.


    Zu der Ordnerfreigabe... Ich hab gelesen, dass wenn ich z.B. eine *.pdf in den Consumer-Ordner ablege, die dann dort "gelöscht" wird und zu Paperless hinzugefügt wird. Wenn ich aber das so mache, wie ich es vorhabe, dann habe ich die Datei auch trotzdem noch in meiner Freigabe drin.

    Das wollte ich damit erreichen. Da werde ich heute Abend nach der Arbeit/morgen Früh mal nachschauen, was die Log von Paperless sagt.


    Wobei...ich lege zusätzlich noch meine Files in meinem OneDrive ab. Also könnte ich direkt den Consumer-ordner nutzen. Aber was genau würde denn nun die Nextcloud bringen? Jedenfalls mir? Ich habe die noch nie benutzt. :D

    Meine Geräte:
    Wohnzimmer: LG OLED55C17LB mit HDFury Diva Ambilight, Denon AVR-X2500H,AXAS E4HD Ultra DVB-C, NVIDIA ShieldTV Pro (2019), Teufel Ultima MK2 5.1-Set & Atmos Reflect Speaker
    Schlafzimmer: Samsung UE55KU6079, FireTV Stick 4k Max Gen.2, Teufel Cinebar One, Teufel Subwoofer T6
    Zubehör: Logitech Harmony 950 mit Hub, Amazon Alexa (2x Dot Gen.4, 2x Echo Show 5 Gen.2, 1x Echo Show 10 Gen.1), Philips Hue, Google Nest, Playstation 5 & PSVR2, Xbox Series X, Nintendo Switch, Meta Quest 3, PC

  • NextCloud ist eine eigene, selbstgehostete Cloud wie OneDrive, DropBox etc nur etwas umfangreicher und halt - dein Eigen :)

    hat aber mit Paperless nix am Hut.

    Warum willst du die Datei nochmal wo anders aufheben? Wofür doppelt? Die Datei bleibt ja erhalten. Sie wird aus dem Consume Pfad ge-OCR'd und dann in den Media/Documents/ Ordner verschoben und nach deinen Vorgaben einsortiert. Falls du mal irgendwann kein Paperless mehr haben willst oder unabhängig vom Paperless zugreifen willst kannst du das über diesen Ordner tun. Wenn du eine Anständige Struktur festgelegt hast wird das super Sinnig abgelegt und ist auch ohne Paperless gut zu durchsuchen. Abgesehen davon sind die Dokumente bereits geOCR'd und selbst er Windows Dateiexplorer kann somit die Inhalte der PDFs durchsuchen.

    Das auch einfach so nach Außen Freigeben, ich weiß nicht. Ich bastel derzeit an ner Vorschaltseite um das sicherer zu gestalten, bin da aber noch in der Lernphase und .. zu viele Projekte auf einmal :D

    das Einzige was am Ende zählt ist
    dass ihr lebt was ihr liebt und liebt wofür ihr lebt


    Kodi HTPC - W11 | AMD Athlon 3000G | Pioneer A 504R Bj. 96
    OMV NAS - NAS | Emby Server | LogitechMediaServer
    3x Logitech SqueezeBox & 3x RasPi PiCorePlayer
    Loxone SmartHome

  • Oh, ok, na dann brauch ich das auch nicht. Habe jetzt auch die App am Handy eingerichtet. Läuft. :)

    Achso, das wusste ich nicht. Ich dachte, wenn mal Paperless sich verabschiedet, dann sind auch die Dateien futsch. Dann ist das ja halb so wild. :)

    Jetzt habe ich aber trotzdem noch 2 Fragen...ich möchte den Consumer-Ordner trotzdem als Netzlaufwerk bei mir in Windows einbinden. Wie mache ich das? Ich bekomme den irgendwie nicht freigegeben.

    Und...gibts irgendwelche Tipps wie ich paperless an sich nun bediene? Ich sehe sehr viele Möglichkeiten, aber hab keine Ahnung, wie ich genau nun irgendwas machen kann/muss.

    Also mal angenommen, ich möchte nun Rechnungen, Lohnsteuer, Gehaltsnachweise usw. schön separiert haben und das sollte es auch automatisch dann machen/können, sobald ich sowas "einscanne". Geht sowas? Wenn ja, wie? Gibts ja irgendwelche schöne Tutorials oder sowas?

    Meine Geräte:
    Wohnzimmer: LG OLED55C17LB mit HDFury Diva Ambilight, Denon AVR-X2500H,AXAS E4HD Ultra DVB-C, NVIDIA ShieldTV Pro (2019), Teufel Ultima MK2 5.1-Set & Atmos Reflect Speaker
    Schlafzimmer: Samsung UE55KU6079, FireTV Stick 4k Max Gen.2, Teufel Cinebar One, Teufel Subwoofer T6
    Zubehör: Logitech Harmony 950 mit Hub, Amazon Alexa (2x Dot Gen.4, 2x Echo Show 5 Gen.2, 1x Echo Show 10 Gen.1), Philips Hue, Google Nest, Playstation 5 & PSVR2, Xbox Series X, Nintendo Switch, Meta Quest 3, PC

    Edited 2 times, last by taker-` (March 26, 2024 at 11:47 PM).

  • obs da fertige Tutorials gibt weiß ich nicht ... nur beschränkt bei YouTube und einige die das für Geld anbieten.
    Das mit der Ordnerfreigabe hat geklappt? :) Wichtig ist halt, das du in der Konfiguration dir eine anständige Ordnerstruktur überlegt hast. Die legst in der Docker Config an:

    Advanced Topics - Paperless-ngx

    ich persönlich nutze bpsw das Format:

    PAPERLESS_FILENAME_FORMAT: '{correspondent}/{created_year}/{created_month}/{title}'

    und so sieht das am Ende aus wie Paperless die Dateien ablegt im MEDIA Ordner:

    Grundsätzlicher Ablauf:

    Am Anfang geschieht noch relativ viel manuelle - das System muss erstmal Informationen von dir Sammeln was wie wo es machn und ablegen soll. Dafür nimmst du dir einfach mal einen Schwung unterschiedlicher Dokumente und schmeißt sie in deinen Consume Ordner.

    Da gehst du einfach an das erste Dokument im Posteingang und fängst an:

    • Korrespondenten definieren und festlegen woran dieser erkannt wird
    • Dokumententyp definieren - ist es ein Brief, Rechnung, Lieferschein, Versicherungsschein, Kontoauszug, Gehaltsebbrechnung etc. und woran soll erkannt werden das es eben jener ist
    • zusätzliche Tags - diese sind optional und helfen der genaueren Kategorisierung. Bsp.: AutoVersicherung habe ich einen Tag mit dem Kennzeichen des Autos hinzugefügt das es betriefft, Bei Rechnungen hab ich einen Tag wie bezahlt wurde bspw. Lastschrift, PayPal oder den Tag "zum Bezahlen" - somit kann ich später filtern was an Rechnungen noch offensteht. Hier kannst du auch den Lohnsteuer-Tag hinzufügen! Diesen setzt du entweder manuell oder automatisch nach deinen vordefinierten Begriffen die auftauchen müssen hierfür.

    Das sind erst einmal die wichtigsten Parts, wenn du damit die ersten 20-30 Dokumente eingepflegt hast wird schon relativ viel automatisiert geschehen und du lernst was wie worauf reagiert. Dann kann man bei Bedarf / Interesse tiefer rein gehen.

    Gibt dann so Punkte wie:

    • Ansichten erstellen - du bekommst links oben eine Filteransicht die dir alle Dokumente mit festgelegten Infos auflistet. hier habe ich bpsw. nach dem Dokumententyp Rechnung und den Tag "zum Bezahlen" gefiltert und finde somit umgehend alle Rechnungen die ich noch zahlen muss :)
    • benutzerdefinierte Felder
    • Benutzerrechte
    • weitere automatisch Vorgänge

    So ein kleiner Auszug aus meinen Dokumententypen :)

    Ich hoffe das hilft etwas weiter.

    das Einzige was am Ende zählt ist
    dass ihr lebt was ihr liebt und liebt wofür ihr lebt


    Kodi HTPC - W11 | AMD Athlon 3000G | Pioneer A 504R Bj. 96
    OMV NAS - NAS | Emby Server | LogitechMediaServer
    3x Logitech SqueezeBox & 3x RasPi PiCorePlayer
    Loxone SmartHome

  • Moin,

    ja, mit der Freigabe hat funktioniert. Der Ordner tauchte nicht auf, weil sowieso der docker-Ordner schon frei war. Musste im Prinzip nur den Pfad bei der WIndowsfreigabe bzw. beim Netzlaufwerk anpassen und dann hats schon gepasst. :)


    Okey, danke für die Infos. Ich schaue mir das mal an und versuche ein wenig damit zu hantieren. :D Wenn ich noch Fragen habe, melde ich mich. :)


    Lg

    Meine Geräte:
    Wohnzimmer: LG OLED55C17LB mit HDFury Diva Ambilight, Denon AVR-X2500H,AXAS E4HD Ultra DVB-C, NVIDIA ShieldTV Pro (2019), Teufel Ultima MK2 5.1-Set & Atmos Reflect Speaker
    Schlafzimmer: Samsung UE55KU6079, FireTV Stick 4k Max Gen.2, Teufel Cinebar One, Teufel Subwoofer T6
    Zubehör: Logitech Harmony 950 mit Hub, Amazon Alexa (2x Dot Gen.4, 2x Echo Show 5 Gen.2, 1x Echo Show 10 Gen.1), Philips Hue, Google Nest, Playstation 5 & PSVR2, Xbox Series X, Nintendo Switch, Meta Quest 3, PC

  • Habe jetzt mal paar Dinge probiert und es läuft schon. :) Aaaber...wo genau muss ich das machen? Also wo finde ich diese Docker Config genau? Geht das einfacher mit Portainer? Das habe ich auch installiert. Wahrscheinlich ist es super easy, aber ich finde es gerade nicht wirklich wo ich da hin muss. :P

    Siehe Anhang - Muss ich den Befehl dort einfügen?

    Images

    Meine Geräte:
    Wohnzimmer: LG OLED55C17LB mit HDFury Diva Ambilight, Denon AVR-X2500H,AXAS E4HD Ultra DVB-C, NVIDIA ShieldTV Pro (2019), Teufel Ultima MK2 5.1-Set & Atmos Reflect Speaker
    Schlafzimmer: Samsung UE55KU6079, FireTV Stick 4k Max Gen.2, Teufel Cinebar One, Teufel Subwoofer T6
    Zubehör: Logitech Harmony 950 mit Hub, Amazon Alexa (2x Dot Gen.4, 2x Echo Show 5 Gen.2, 1x Echo Show 10 Gen.1), Philips Hue, Google Nest, Playstation 5 & PSVR2, Xbox Series X, Nintendo Switch, Meta Quest 3, PC

  • Jaa genau, da ist richtig :) einfach eine Zeile im Bereich enviroment hinzufügen und das rein. Zusätzlich aus der Seite zuvor kannst du noch den hinzufügen:

    Code
    PAPERLESS_OCR_USER_ARGS: '{"invalidate_digital_signatures":true}'

    dann werden auch PDF Dokumente die Signiert sind verarbeitet (aber die Signierung entfernt)

    Ebenso würde ich noch die Zeitzone definieren ;)

    Code
    PAPERLESS_TIME_ZONE: Europe/Berlin

    das Einzige was am Ende zählt ist
    dass ihr lebt was ihr liebt und liebt wofür ihr lebt


    Kodi HTPC - W11 | AMD Athlon 3000G | Pioneer A 504R Bj. 96
    OMV NAS - NAS | Emby Server | LogitechMediaServer
    3x Logitech SqueezeBox & 3x RasPi PiCorePlayer
    Loxone SmartHome

  • Klasse, dann halte ich mal den Stack an, füge die 3 Befehle ein und starte es wieder. :)

    Werden diese Änderungen nun auch nachträglich berücksichtigt? Oder muss ich nun von vorne anfangen?

    Meine Geräte:
    Wohnzimmer: LG OLED55C17LB mit HDFury Diva Ambilight, Denon AVR-X2500H,AXAS E4HD Ultra DVB-C, NVIDIA ShieldTV Pro (2019), Teufel Ultima MK2 5.1-Set & Atmos Reflect Speaker
    Schlafzimmer: Samsung UE55KU6079, FireTV Stick 4k Max Gen.2, Teufel Cinebar One, Teufel Subwoofer T6
    Zubehör: Logitech Harmony 950 mit Hub, Amazon Alexa (2x Dot Gen.4, 2x Echo Show 5 Gen.2, 1x Echo Show 10 Gen.1), Philips Hue, Google Nest, Playstation 5 & PSVR2, Xbox Series X, Nintendo Switch, Meta Quest 3, PC

  • die gelten erst ab jetzt, aber mit einem Befehl kannst das alles erneut ausführen lassen ... wo wie war das, ich suche


    btw, den best practice find ich ganz hilfreich:

    Basic Usage - Paperless-ngx


    wie stack anhalten ... ich trag das immer rein und sag neudeployn :D

    das Einzige was am Ende zählt ist
    dass ihr lebt was ihr liebt und liebt wofür ihr lebt


    Kodi HTPC - W11 | AMD Athlon 3000G | Pioneer A 504R Bj. 96
    OMV NAS - NAS | Emby Server | LogitechMediaServer
    3x Logitech SqueezeBox & 3x RasPi PiCorePlayer
    Loxone SmartHome

  • wie stack anhalten ... ich trag das immer rein und sag neudeployn :D

    Er arbeitet halt mit nem Compose-File (Stack), trägt die Änderungen ein und lässt es dann wieder starten...ist im Grunde genommen alles das gleiche.

    NAS: Gehäuse: Jonsbo G3, Mainboard: MSI B460M PRO, CPU: Intel Pentium G6400, OS: OMV 6

    Client: NVIDIA Shield Pro 2019

  • ja das war schon klar, mach ich ja exakt gleich nur ... ich halte den nicht vorher extra an. Soll der doch vor die Wand fahren und dann sauber hochfahren, selbst schuld wenn's Software wird [ag] [bk] so wars gemeint


    Dr_Cox1911 keine Sorge, nicht übersehen. Nur noch nicht ausprobiert...

    das Einzige was am Ende zählt ist
    dass ihr lebt was ihr liebt und liebt wofür ihr lebt


    Kodi HTPC - W11 | AMD Athlon 3000G | Pioneer A 504R Bj. 96
    OMV NAS - NAS | Emby Server | LogitechMediaServer
    3x Logitech SqueezeBox & 3x RasPi PiCorePlayer
    Loxone SmartHome

  • Danke :)


    Habe erst 15 Files gehabt. Hab die gelöscht und nochmal eingefügt. Klappt nun auch mit den neuen Befehlen. - So wies aussieht läuft alles und nun kann ich das Teil mal mit Daten füttern. Danke für die Hilfe ^^

    Und ja, Ich nutze Compose-File (Stack).


    //edit: Eine Frage noch zur Android App. Das klappt ja alles. Habe es mal mit 1 2 Briefe getestet. Aber ist es normal, dass ich nach dem Fotografieren und Croppen dann selbst den Korrespondent usw. auswählen muss? Geht das dann nicht "einfach hochladen" und dann ordnet es das automatisch zu?

    Mache ich da noch irgendwas falsch, oder ist das normal?

    Meine Geräte:
    Wohnzimmer: LG OLED55C17LB mit HDFury Diva Ambilight, Denon AVR-X2500H,AXAS E4HD Ultra DVB-C, NVIDIA ShieldTV Pro (2019), Teufel Ultima MK2 5.1-Set & Atmos Reflect Speaker
    Schlafzimmer: Samsung UE55KU6079, FireTV Stick 4k Max Gen.2, Teufel Cinebar One, Teufel Subwoofer T6
    Zubehör: Logitech Harmony 950 mit Hub, Amazon Alexa (2x Dot Gen.4, 2x Echo Show 5 Gen.2, 1x Echo Show 10 Gen.1), Philips Hue, Google Nest, Playstation 5 & PSVR2, Xbox Series X, Nintendo Switch, Meta Quest 3, PC

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!