[HowTo] Papierloses Heim mit Paperless inkl. OCR

  • Soweit bin ich noch gar nicht. :D
    Scanne erstmal nur zum Test die Dokumente als PDF. Und bei mehrseitigen Dokumenten kommt meist sowas raus.
    Für den Eigenbedarf sicher ok, aber wenn man doch mal so ein Dokument weitergeben möchte, sieht das etwas "doof" aus.

    Oder ändert Paperless da noch was dran?

  • Thema Scanbot

    Ich habe heute noch mal den Support bemüht und folgende Antwort bekommen:

    Wir haben mittlerweile für iOS ein Feature implementiert, mit dem man das Format beim Scannen festlegen kann. Für Android werden wir dieses Feature eventuell auch bald einführen.


    Na da bin ich ja mal gespannt.

  • Danke für die Anregung ich habe es ein wenig anders Audfgebaut

    Meine Hardware :
    Proxmox Server +LXC Container
    Scanbot ftp Uploud

    Ich habe ein Bash Script gefunden der mir den Paperless Server in ein Ubuntu LXC Container installeriert

    Externer Inhalt gist.github.com
    Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

    Edit:
    In der /etc/paperless.conf OCR noch auf Deutsch(deu) gesetzt
    via sudo apt-get install tesseract-ocr-deu Deutches OCR nachinstallieret

    Und mit der Scanbot App sende ich die Daten via Sftp auf den "Lauschenden Ordner" (home/ftpupload)

    Läuft echt Super

    Mfg
    Marco

  • hab den Fred gerade erst endeckt.
    Sau coole Idee, nach sowas suche ich schon SEHR lange.

    Ich überlege nur gerade, wie ich das in meinem Fall am besten machen kann.
    Vorhanden:
    - iPhone
    - Fritzbox (mit oder ohne HDD dran)
    - jede Menge Papierkram.
    eine Cloud-HDD wollte ich eh auch schon immer mal haben, falls das damit klappt.

    Und nu?

    TVServer: origenAE (S16V) als DVBViewer MediaServer
    SAT>IP Hardware: 3x Digibit Twin
    Clienten: 1x DuneHD, 2x KII Pro DVB-S2 (S905) (CE 9.2.8), 1x FireTV Stick 4K MAX, 1x OctagonSF8008 E2 Receiver (openATV)

  • @Onkel-W: ja, versuche ich, spätestens am Wochenende mal (sofern wir nicht ins Schwimmbad gehen...), wie man so ne tolle Thread Übersicht wie @xSaSx macht, ggf. kann, wenn ich es soweit hab, dann ja ein Mod irgendwie auch nach Oben schieben in dem Thread...

    Im endeffekt habe ich mich an das hier (trotz des englischs und der nicht vorhandenen Dockerkenntnisse) https://forums.unraid.net/topic/87196-su…perless-docker/ gehalten.

    letztlich hatte es nur geharkt bei Punkt Nr 4, wegen dem consumer service, da ich dort auch den Dockerpfad angepasst hatte, was man nicht soll, da der consumer service ja die gleiche Datenbank nutzen soll, so wie ich es verstanden habe. :)

    Aber mach ich mal ;)
    Mit Bildern, wenn ich es schaffe!

    Hab mich mal auch an die Beschreibung dort gehalten. So weit so gut.
    Das Teil mit dem ändern der Post Arguments scheitert bei mir. Ändere ich das so scheint er zwar laut Log was zu scannen aber ich komme nicht mehr ins Webif
    Wie sieht das denn bei dir aus ?(

  • Kann ich leider erst am Wochenende schauen.
    Während er scannt, und versucht zu erkennen, ist das WebIf aber auch bei mir "tot".
    Da dieselbe Datenbank genutzt wird, so wie ich das verstehe.
    Nach dem scannen / erkennen geht aber wieder alles.

    Schau mal in das Log vom "consumer-container" was er da schreibt / macht, ob es ein Problem gab.

  • Muss man noch nachinstallieren, siehe weiter oben.
    gab da zwei möglichkeiten glaub ich, ich habs über wget gemacht.
    Fehlende Sprache, und Pfad wo die hin musste war im Log vom consumer-docker.

    (aber wie gesagt, am Wochenende schau ich nochmal, ob ich da eine bessere Anleitung erstellen kann)

  • Danke für die Anregung ich habe es ein wenig anders Audfgebaut

    Meine Hardware :
    Proxmox Server +LXC Container
    Scanbot ftp Uploud


    Hallo Makkoo
    ich habe auch Interesse das Projekt auf Proxmox zu nstallieren.
    Würdest Du die einzelnen Schritte einem nicht Linux Spezialisten vielleicht näher erklären?
    Danke Pieto

  • Muss man noch nachinstallieren, siehe weiter oben.
    gab da zwei möglichkeiten glaub ich, ich habs über wget gemacht.
    Fehlende Sprache, und Pfad wo die hin musste war im Log vom consumer-docker.

    (aber wie gesagt, am Wochenende schau ich nochmal, ob ich da eine bessere Anleitung erstellen kann)

    Ahh jetzt hab ich geschnallt wie du das meintest. Lesen hilf doch öfter als gedacht :whistling:
    Ich muss das wget... im richtigen Ordner ausführen. In dem Fall /usr/share/tessdata :thumbup:

  • So hab mich nun auch mal dran versucht.
    Die beiden Docker hab ich auf Unraid zum laufen gebracht.
    Was ich nicht hin bekomme, ist die Einbindung des Consume Ordners als externen Speicher bei Nextcloud. Kann mir da jemand evtl weiterhelfen?

    EDIT:
    Habe es nun hinbekommen, den externen Speicher einzubinden. Ich Idiot habe es immer über die externe URL von Nextcloud probiert, dass hat nicht funktioniert. Habe ich es aber über die interne URL /IP gemacht, lies sich der Ordner als externer Speicher einbinden. :thumbup:

    Nun hab ich gleich noch etwas rumgespielt. Funktioniert alles ganz gut. Auch die OCR Erkennung oder der Upload per Scanbot App.

    Was mich persönlich stört, ist die Tatsache, dass alle Dokumente am Ende in einem Ordner landen. Ich bin da eher ein Perfektionist und würde die Dateien gern in Ordner einsortiert haben. Nach dem Prinzip als Beispiel "Kontoauszug/DKB/2020/Dokument".
    Außerdem, dass die Dokumente am Ende nach dem Schema 0000009.pdf abgespeichert werden. "20200302-Dokumentname" hätte mir besser gefallen.

    Aber ansonsten eine gute Hilfe um etwas Ordnung ins Chaos zu bringen. Mir persönlich würde es wohl nicht reichen.

  • Das Prinzip ist meiner Meinung nach eben wie bei Sharepoint oder vergleichebarem. Es ist egal wo physisch die Daten liegen man sortiert und bearbeitet nur im Frontend.

    Eventuell gibt es ja die Möglichkeit das er Rekursiv Scannt (x ordner drunter) dann könntes du über Scanbot den Main Scanordner auswählen und darunter verschiedene Ordner anlegen die er aber auch nimmt.

    Das hab ich noch nicht versucht.

    EDIT:

    Geht wohl nicht

    https://github.com/the-paperless-…mment-489510534

    Habe aber mal ein Issue aufgemacht und die Thematik zu klären:

    https://github.com/the-paperless-…less/issues/617

    Support ME ! Buy me a Coffee :thumbup:


    Dont Touch ME

    LivingRoom: SilverStone Milo ML03 | Gigabyte B450 | Ryzen 3400G | 250GB NVME | 16GB DDR4-3200| Win10 64 bit | KODI 18 | Logitech Harmony Elite | SONOS Playbar + SUB
    BedRoom: PLAY:3
    Kitchen: PLAY:3
    BathRoom: Play:3

    Einmal editiert, zuletzt von xSaSx (3. März 2020 um 08:23)

  • Moin,

    ich habe nun kurz rein gelesen, verwende eh alles auf Win Basis.
    Meine Software ecodms gibt es aber auch, kostenpflichtig, als Docker Version.
    Nur so als Hinweis. Habe bisher an die 3000 Dokus eingescannt und bin mehr als
    begeistert.

    Spoiler anzeigen


    Server1: MSI A320 Board Athlon 3000G 16GB RAM Win11 Pro / Emby - ecodms - DVBViewer MediaServer
    Server2: Athlon 3000G sichert Daten von Server1 Win11 Pro
    Client 1: AMD Ryzen 3600X, 32 GB RAM AMD 5700XT Win11 Pro
    Client2: i5 6500 16GB RAM AMD 390 8GB RAM Win11 Pro
    Stream: FireTV 4K / FireTV / Android Tablet
    Media: Samsung UHD 55" / Denon AVR-X1400H 7.1 Boxen/ LG UHD BR / VU+ Uno 4KSE / XBOX One S /Harmony Touch
    Netzwerk: Fritze 7590 Kaskade Fritze 7490
    SmartHome: Alexa Dot / HomeMatic IP /OpenHab / PiHole / Heimdall

  • @xSaSx ja so funktioniert es ja auch gut. Aber man ist dann total davon abhängig und wenn es irgendwann mal nicht mehr funktioniert steht man da und hat nur tausende Dokumente in einem Ordner, die auch noch nichts sagend benannt sind.

    Wie gesagt, ich finde es gut das es sowas gibt, mir gefällt eben nur nicht die Ablegemethode der Dokumente.

  • https://github.com/the-paperless-…less/issues/617

    klare Aussagen - ist halt ein SharePoint like strukture

    Sollte aber meiner Meinung nach kein Problem sein bei richtiger Sortierung und Tagging im GUI - aber ich versteh was du meinst

    Support ME ! Buy me a Coffee :thumbup:


    Dont Touch ME

    LivingRoom: SilverStone Milo ML03 | Gigabyte B450 | Ryzen 3400G | 250GB NVME | 16GB DDR4-3200| Win10 64 bit | KODI 18 | Logitech Harmony Elite | SONOS Playbar + SUB
    BedRoom: PLAY:3
    Kitchen: PLAY:3
    BathRoom: Play:3

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!