[HowTo] Papierloses Heim mit Paperless inkl. OCR

  • Du musst dich von sowas lösen wenn du ein DMS verwendest.... Wir haben auf Arbeit ein sau teures DMS ! Da werden die Daten so verhackstückelt abgelegt das du sie in 100Jahren nicht mehr finden würdest auser du hast das Frontend...das ist ganz normal

    Support ME ! Buy me a Coffee :thumbup:


    Dont Touch ME

    LivingRoom: SilverStone Milo ML03 | Gigabyte B450 | Ryzen 3400G | 250GB NVME | 16GB DDR4-3200| Win10 64 bit | KODI 18 | Logitech Harmony Elite | SONOS Playbar + SUB
    BedRoom: PLAY:3
    Kitchen: PLAY:3
    BathRoom: Play:3

  • Würde ich gerne, echt. Aber dafür ist die Benamung der Dokumente einfach zu "bescheiden".
    Was ist, wenn das frontend oder sogar der Server mal länger ausfällt und du unbedingt ein Dokument benötigst? Durchnummerierte Namen wie 000001.pdf helfen dir da nicht weiter.
    Datum-Dokumentenname.pdf und ich wäre sofort dabei und es würde ein zentraler Ordner reichen.

    Das wäre ein gutes Feature. Ich denke, die Programmierer könnten das sicher auch einfach umsetzen.
    Könntest es denen ja mal vorschlagen. ;)

  • Jo und sieht ja ziemlich aktuell aus - bzw die haben ja wohl sogar eine Lösung ist nur noch nicht ins Master gelaufen wenn ich das richtig deute

    Support ME ! Buy me a Coffee :thumbup:


    Dont Touch ME

    LivingRoom: SilverStone Milo ML03 | Gigabyte B450 | Ryzen 3400G | 250GB NVME | 16GB DDR4-3200| Win10 64 bit | KODI 18 | Logitech Harmony Elite | SONOS Playbar + SUB
    BedRoom: PLAY:3
    Kitchen: PLAY:3
    BathRoom: Play:3

  • mal so auf papierlose archivierung umzustellen waere schon prima.

    Ich strauchele aber schon am ersten schritt: Damit das effizient ist, muesste ich am drucker/scanner einfach nur eine mehrseitiges dokument in den ADF legen koennen, dann eine taste druecken, und dann taucht das irgendwo gescannt in einem verzeichnis auf. Also nix hin und herrennen um scanparametre einstellen, oder mit'm handy rumfummeln. Ist ja auch wurscht, wenn das alles erstmal mit viel zu viel aufloesung gescannt wird.

    Wuesste halt nicht, wie ich so ein automatisches scannen hinkriege. Die Dokumentation meines Multifunctions ist halt erbaermlich. Canon G7050.

  • @te36

    da ich leider einen MuFu ohne ADF habe kann ich dir da nix zu sagen, mein Tipp ecodms ist aber in der Lage ADFzu scannen.
    Ob das mit deinem Gerät klappt kann ich somit nicht sagen.

    Spoiler anzeigen


    Server1: MSI A320 Board Athlon 3000G 16GB RAM Win11 Pro / Emby - ecodms - DVBViewer MediaServer
    Server2: Athlon 3000G sichert Daten von Server1 Win11 Pro
    Client 1: AMD Ryzen 3600X, 32 GB RAM AMD 5700XT Win11 Pro
    Client2: i5 6500 16GB RAM AMD 390 8GB RAM Win11 Pro
    Stream: FireTV 4K / FireTV / Android Tablet
    Media: Samsung UHD 55" / Denon AVR-X1400H 7.1 Boxen/ LG UHD BR / VU+ Uno 4KSE / XBOX One S /Harmony Touch
    Netzwerk: Fritze 7590 Kaskade Fritze 7490
    SmartHome: Alexa Dot / HomeMatic IP /OpenHab / PiHole / Heimdall

  • hab jetzt nicht versucht zu kucken, was ecodms funktional macht, aber preis und multi-plattform passt.
    Denke ich will was unter linux aufsetzen,
    muesste jetzt also mal gucken, ob ich sane fuer mein MuFu zum laufen kriege.

    Denke aber mal das ich nicht am MuFu knopf druecken kann der dann automatisiert mit backend software laeuft. Also braeuchte ich wohl doch 'ne art ersatz fuer bedienpanel, das dann auf dem linux-rechner einen sane scann startet. Mal gucken.

  • Mal so ne Frage...
    Wie lange dauert es bei euch eigentlich über Docker und Paperless (aktuellste Version des Docker Images, Stand 2020-03-25) ein 14 seitiges Dokument zu erkennen?
    Bei mir rödelt der Docker paperless-consume jetzt schon über ne Stunde damit rum..

    Das ist das Docker-Log dazu:
    (leider ohne Timestamps oO)

    Wie gesagt, 14 seitiges Dokument, als PDF ca 6,5 MB groß.

    Und hier die Dockereinstellungen für dne consumer:


    Jetzt halt die Frage, ob man da noch was optimieren kann...
    CPU ist ein Pentium G4560

  • Hi,

    ich komme leider irgendwie hier nicht weiter. Bei mir funktionieren derzeit zwei Dinge nicht:

    1. Der Ordner den ich in Nextcloud per externem Speicher Plugin gemountet habe, ist nicht beschreibbar.
    Komisch finde ich hier, dass der Ordner, wenn er per Docker-Compose erstellet wird, mit root:root erstellt wird. Eigentlich sollte dies nicht der Fall sein, da ich einen eigenen Docker-User eingerichtet habe.

    2. Wenn ich PDFs manuell in meinen Consume Ordner kopiere, werden diese nicht gefunden.
    Hier habe ich leider gar keine Idee...

    Ich fürchte, dass es sich um ein Berechtigungsproblem handelt, aber ich habe mittlerweile so viele chowns und chmods durch, dass mir der Kopf raucht.


    Hier ist ein Teil meines compose files:


    Hat es bei euch auf Anhieb geklappt oder musstet ihr noch etwas einstellen? Hat sonst jemand eine Idee?

    Grüße
    Kingbuzzo

  • Ich nutze es zwar immer noch nicht produktiv (habe mir vorerst eine andere Herangehensweise überlegt), aber verfolge das Projekt trotzdem noch. Wenn es irgendwann mal nach meinen Vorstellungen läuft, werde ich sicher auch Paperless produktiv nutzen.

    Mir gefällt ja zB nicht, dass die Original Dateien nicht mit dem richtigen Titel abgespeichert werden, sondern einfach nur fortlaufend nummeriert. So kann man sie im Share nicht wirklich durchsuchen und ist immer auf die WebUI angewiesen.

    Da tut sich mittlerweile was. Man kann nun mit der Variable `PAPERLESS_FILENAME_FORMAT` den Dateinamen festlegen.
    Ich habe {created} - {title} getestet. Funktioniert auch soweit. Raus kommt sowas: 2020-04-28-0000000000 - test-0000007.pdf

    Mich würde da noch die Uhrzeit (0000000000) und der Zähler (0000007) stören. Brauche ich nicht, denn 2020-04-28 - test.pdf wäre der richtige Titel.

    Aber immerhin schon mal ein Anfang. :thumbup:

  • Hallo,
    habt ihr euch da auch über die Sicherheit Gedanken gemacht?
    Sind die Daten verschlüsselt ? Wenn jemand Zugriff auf das System bekommt, könnte man ja im schlimmsten Fall alle Dokumente raus kopieren und lesen. Wenn es als Papier im Ordner liegt, müsste erstmal jemand ins Haus einbrechen, was meiner Meinung nach schwerer ist als eine Sicherheitslücke zu finden.
    Sortiert ihr nach jedem Scan die Dokumente manuell oder kann man es soweit automatisieren, dass Briefe von der Versicherung mit Versicherung gezeichnet werden?

    Hatte sonst noch das hier gefunden, das auf jeden Fall verschlüsselt sein soll:
    https://github.com/sismics/docs

    Meine Konfig

    Spoiler anzeigen

    Server:

    • Intel Pentium G4560 2x 3.50GHz
    • Gigabyte GA-B250M-DS3H Intel B250
    • 16 GB RAM DDR4
    • SSD Cache
    • HDDs
    • unRAID mit der aktuellsten Stable-Version


    Kodi:

    • Nvidia Shield TV (2017)
    • KODi immer mit der aktuellsten Stable-Version

    Einmal editiert, zuletzt von Taobyebye (29. Mai 2020 um 19:18)

  • ist das hier noch aktuell?
    bei mir scheiterts schon bei nextcloud...
    wie/als was muss der externe Speicher denn konfiguriert werden?

    Lokal wirds ja kaum sein, oder?
    bei webdav (das müsste mit Docutain möglich sein) ist mir nicht ganz klar, wie die url ausschauen sollte...

    Grüße

  • Wenn du deinen Speicher an Nextcloud weiter reichst, dann kannst du ihn auch als lokalen Speicher einbinden, habe ich bei mir auch so am laufen.

    NAS: Gehäuse: Jonsbo G3, Mainboard: MSI B460M PRO, CPU: Intel Pentium G6400, OS: OMV 6

    Client: NVIDIA Shield Pro 2019

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!