No more Paperwork again! - Open source document digitization with Paperless-NGX [EN Subtitles

Поділитися
Вставка
  • Опубліковано 3 сер 2024
  • Paperless-NGX is a free document management software with text recognition (OCR).
    docs.paperless-ngx.com/
    This means that the digitization of documents in paper format, but also the merging of their “digital cousins” in PDF or image format, is very nicely solved.
    There are apps for this and it's a really helpful tool for managing paperwork.
    I now scan everything that comes in directly and then just put it in a box and in principle I could heat the paper directly (but I don't have an oven)
    I also copy PDF files directly in, so I have everything together.
    That's why Paplerless-NGX is also an integral part of my SmartHome script.
    This is available via the newsletter at ei23.de
    ---
    Do you find this helpful or do you want more? Then support this project, because it is very costly and time-consuming to create such videos.
    You can find information about this at ei23.com/donate/
    If you would rather support us with time, knowledge and skills instead of money, that would of course be just as great!
    Become part of the community:
    forum.ei23.de
    t.me/ei23de
    / discord
    / ei23
    If you order from Amazon every now and then, you can use my Amazon partner link
    ei23.de/amzn will redirect a small advertising commission to me; you only have to click on the link once before making your purchase. The prices do not change as a result.
    This works the same way with Berrybase ei23.de/bbase
    and with AliExpress ei23.de/alxprss/
    It's best to save the links as bookmarks.
    Thanks in advance
    and always stay smart and independent!
  • Наука та технологія

КОМЕНТАРІ • 74

  • @eikeimnetz
    @eikeimnetz Рік тому +5

    Was für ejn geiles Timing, hab mich vor einer Woche angefangen, mit dem Thema zu beschäftigen. Freu mich schon riesig aufs gucken später

  • @bernharddichtl9710
    @bernharddichtl9710 Рік тому +1

    tiptop, werd ich demnächst mal testen ;)

  • @Holzkistle
    @Holzkistle Рік тому +2

    Habs geschafft: Pi400 aufgesetzt, Samba drauf + eingerichtet, ei23 installiert und paperlessngx zum Laufen gebracht.
    Mit der 64bit Version von Raspberry Pi hatte ich Probleme mit der ei23 Installation (aktuell wohl in beta Status), aber mit der 32 bit läuft es super. Mit der Kombination aus diesem Video und dem zur Einführung von ei23 geht's ganz gut.
    Like und Abo mega verdient.
    Verdient weit aus mehr als das und vor allem mehr Beachtung. Bin durch Zufall auf meiner Suche nach einer Raspberry Pi PaperlessNGX Anleitung drauf gestoßen und hat nach ein paar anfänglichen Schwierigkeiten mit den Samba settings super geklappt.
    Jetzt werde ich mich erstmal mit Paperless NGX etwas tiefer auseinander setzen.

    • @ei23de
      @ei23de  Рік тому

      Vielen Dank für die Anerkennung! Freut mich sehr!
      64Bit sollte eigentlich keine Probleme mehr machen, ich hab mein Produktivsystem auch auf 64Bit (mit SSD über USB)
      Gerade bei Paperless auch zu empfehlen direkt zu 64Bit zu gehen, da die Datenbanken 32/64Bit nicht portierbar sind.
      Zumindest nach meinem letzten Wissensstand.

    • @Holzkistle
      @Holzkistle Рік тому

      Danke für den Hinweis. Dann probiere ich es nochmal mit 64bit.
      Also, die Installation mit 64bit hat funktioniert, aber nur wenn ich esphome aus der Installation rausgeworfen hab, sonst bringt es einen Error. Paperless NGX läuft, jetzt muss ich es nur noch einrichten.
      Danke für deinen Support.

  • @matthiasrammes
    @matthiasrammes Рік тому +3

    Sehr cool. Bislang mache ich das ganze nur mit OfficeLens und nutze die OfficeLens eigene OCR Erkennung. Das funktioniert aber nur mit PDF Dokumenten und die kann man meines Wissens nach nur auf OneDrive ablegen. Hole mir die Daten dann zwar per Cloud Sync auf meine Synology. Aber ich würde gerne auf die Cloud verzichten. Gucke mir Paperless auf jeden Fall mal an. Danke für den Tipp und schöne Grüße aus dem Emsland.

    • @ei23de
      @ei23de  Рік тому +1

      Hier klappts auch mit normalen Bildern.
      Ich nutze die Paperless App um es direkt auf den Server zu schicken. Ein einfacher FTP Upload geht aber auch.
      Der Rest wird dann vom Server erledigt.
      Die Sortierung und automatische Erkennung vom Datum ist auch nochmal ein ganz großes Plus.
      Und damit Gruß an die Nachbarn im Emsland!

  • @SaschiIein
    @SaschiIein Рік тому +3

    Hab davon gehört, aber bisher kein Interesse, da ich wie du schon sagtest, es hasse, wenn Dokumente in einem proprietären Format oder einer Datenbank abgelegt werden und wenn das System (das Dokumentenmanagement-System) nicht mehr funktioniert oder nicht weiter entwickelt wird, ist alles weg oder bleibt für immer auf einem alten Stand.
    Aber so wie das hier beschrieben wird, liegen die Dateien einfach in Verzeichnissen und sind easy zu sichern und heraus zu ziehen - das hat mein Interesse geweckt - auch für die Firma....
    Danke!

    • @ei23de
      @ei23de  Рік тому

      Dahinter steckt keine Firma, es ist ein Open Source Software Projekt (was es im Prinzip noch besser macht)

    • @SaschiIein
      @SaschiIein Рік тому

      @@ei23de Stimmt - wir hatten ein Programm im Einsatz für Rechnung/Lieferschein etc. Das kostete mal 49,- und ist inzwischen eine Aboseuche, die versucht Zwangsupdates zu ziehen (bis ich denen den Stecker per IP-Blockierung gezogen habe). Ohne Update auf den Abo Dreck konnten wir nichtmal das Programm öffnen um am die Daten zu kommen - das ist schon kriminell.

    • @ei23de
      @ei23de  Рік тому

      Die wollen alle nur unser bestes €€€$$$

  • @electronicstv5884
    @electronicstv5884 Рік тому

    Von Paperless-NGX lese ich irgendwie gerade überall. Sieht auf jeden Fall sehr praktisch aus! Als 17-jähruger hab ich nur noch keine Rechnungen die ich scannen müsste 😅

    • @ei23de
      @ei23de  Рік тому +1

      Die Dokumente kommen noch, Papier wird hier so schnell noch nicht abgeschafft 😉

    • @electronicstv5884
      @electronicstv5884 Рік тому +1

      @@ei23de Hab grad für eine Sekunde vergessen, dass wir in Deutschland leben 😅

  • @m.vanhall6806
    @m.vanhall6806 Рік тому

    Super Video! alles sehr gut erläutert! Was noch interesannt wäre, ist eine Sicherung der Datenbanken, das wäre super! ;-)

    • @ei23de
      @ei23de  Рік тому +1

      Ich hätte es erwähnen können, aber das so einfach, dass es eigentlich keine Erklärung bedarf.
      Einfach nur den ei23-docker/volumes/paperlessngx sichern und fertig.
      Bestenfalls regelmäßig automatisiert z.B. mit rsync über ssh

    • @m.vanhall6806
      @m.vanhall6806 Рік тому

      @@ei23de Danke für die schnelle Rückmeldung! kann man bei paperless so einstellen, dass alle Dokumente in einem Ordner gespreichert werden und nicht für jeden Tag ein neuer Ordner angelegt wird?

    • @ei23de
      @ei23de  Рік тому

      Ja, das geht. Die Struktur kann man beliebig wählen.

  • @RupertoCamarena
    @RupertoCamarena Рік тому +5

    (document_type)/(created_year)-(created_month)-(created_day)_(tag_list)(title)

  • @best.grafix
    @best.grafix Рік тому +1

    Sehr nice, bin auch gerade dabei, guter tipp auch mit der zweiten Instanz für die Frau die nen Geschäft hat, muss der Port für den broker nicht geändert werden ? Hauptsache die container haben anderen namen und der webseiten port ist anders ? Cool ist auch das du das mal mit dem Speicherpfad gezeigt hast, jetzt weiß ich wie es geht. 👍

    • @ei23de
      @ei23de  Рік тому

      Ja der externe Port, das Volume und die Container Namen müssen geändert werden, damit sie sich nicht überschneiden.

  • @MrBenedict.
    @MrBenedict. Рік тому

    gutes Video ! Frage: ich hab gesehen du greifst auf die volumes deiner Container mit winscp zu - wie geht das?

    • @ei23de
      @ei23de  Рік тому +1

      Danke!
      sftp (ftp über ssh)
      Wenn es geht immer ftp vermeiden.
      Jeder Server der SSH kann, kann auch meistens sftp (auch über Port 22)
      Und dann am besten mit Public Key, hab einen Beitrag auf meiner Website.

  • @mk-hh
    @mk-hh Рік тому +1

    Tolles Programm, benutze ich auch schon seit einiger Zeit , nun steht auch für mich auch die Frage im Raum, was für ein Dokumentenscanner sinnvoll ist? Mich würde auch interssieren, wie eine Backup_Strategie mit Docker aussehen könnte?

    • @ei23de
      @ei23de  Рік тому +1

      Meine Backupstrategie ist:
      Das komplette Verzeichnis (volume) mit rsync über ssh auf meinen Rechner synchronisieren.
      Eine Wiederherstellung ist dann auch ohne Weiteres möglich und falls alle Stricke reißen, habe ich immer noch eine gute Ordnerstruktur mit allen PDFs (sinnvoll benannt) als Sicherung
      Als Scanner für Android gefällt mir Office Scan am besten.

    • @magnesiafrost1863
      @magnesiafrost1863 7 місяців тому +1

      ScanSnap als Dokumentenscanner! Scannt duplex ganze Dokumente bestehend aus mehreren Seiten/Blättern innerhalb weniger Sekunden.

  • @tremonia0231
    @tremonia0231 Рік тому

    Was für einen Pi nutzt du denn hierfür? OCR braucht ja mitunter schon etwas Leistung ?

    • @ei23de
      @ei23de  Рік тому

      Pi 4 mit 4GB, bisher keine Probleme gehabt. Aber ich scanne auch keine Bücher ;)

  • @deutschland09
    @deutschland09 Рік тому

    Wenn ich das mit der Ordnerstruktur nachträglich mache, also bei bereits hochgeladenen Dokumenten, diese dann jeweils einem (neuen) Speicherpfad vergebe; dass funktioniert dann noch und das jeweils ausgewählte Dokument verschiebt sich in den angelegten Speicherpfadordner?

    • @ei23de
      @ei23de  Рік тому

      Kann man beliebig nachträglich ändern. Das ändert automatisch den Pfad und Dokumentnamen.
      Ich mache nochmal ein Video zur Dateisynchronisation unter Linux.
      Am besten spiegelst du den Dokumenten-Ordner nochmal woanders hin, so das die Struktur entsprechend mit geändert wird.

  • @DerSearge
    @DerSearge Рік тому

    Sehr spannend, beschäftige ich mich auch gerade mit. Wenn ich das richtig sehe, ist das nur für Linux?

    • @ei23de
      @ei23de  Рік тому

      Ich bin nicht ganz sicher, aber ich hab es nur auf Linux probiert. Es würde natürlich auch im Windows Linux Subsystem laufen.

    • @DerSearge
      @DerSearge Рік тому

      @@ei23de Natürlich nur wenn man W11 hat. :) Gäbe es so etwas vielleicht für NextCloud? Obwohl, da hat man es auch nicht in seinem eigenen Umfeld.

    • @CortVermin
      @CortVermin Рік тому

      @@DerSearge win10 hat auch wsl. nextcloud kannst du dir auch auf einem linuxsystem im eigenen netzwerk installieren. aber nextcloud hat mit paperless nix zu tun. so gar nichts :D

    • @DerSearge
      @DerSearge Рік тому

      @@CortVermin Ich schrieb ja auch "für" Nextcloud. Aber egal, ist mir zu aufwendig.

  • @fritzbienert3251
    @fritzbienert3251 Рік тому

    Prima Idee! Ich hab es schon unter OMV5 Versucht und da hab ich Paperless nicht zum laufen gebracht. Unter Unraid läuft es. Wie machst du das mit den Daten auf dem Raspi, die Micro sSD ist ja öfters mal kaputt oder macht Probleme. Ich hab einen Raspi4 und werde es mal mit eienr Ramdisk versuchen die dann automatioisch eine Sicherung auf meinen Server macht. Würde mich mal interessieren wie lange und zuverlässig das System bei dir läuft?
    MfG Fritz

    • @ei23de
      @ei23de  Рік тому +1

      Ich hab eine SSD am Pi, darauf läuft das ganze System.
      Mein System läuft jetzt bereits 3 Jahre.

  • @CortVermin
    @CortVermin Рік тому

    kann man bei dem dokumentenpfad auch ein netzlaufwerk angeben?

    • @ei23de
      @ei23de  Рік тому +1

      Nein geht nur intern, aber du kannst den Ordner ja nachträglich über rsync, unison oder sftp synchronisieren.
      So mache ich das.

  • @NIXWarhammer
    @NIXWarhammer Рік тому

    Würde es eigentlich funktionieren, paperless auf einem RPi laufen zu lassen, den Speicherort aber auf ein NAS zu legen? Leider habe ich auf meinem RPi nämlich viel zu wenig Speicher für ein DMS und mein NAS ist zu alt für Docker/Paperless…

    • @ei23de
      @ei23de  Рік тому

      Du könntest dein NAS als Netzwerkspeicher auf den RPi mounten und das Verzeichnis dann als Volume für Paperless nutzen.
      Zumindest theoretisch geht das, hab es aber so noch nicht getestet.

  • @reineroberhaus
    @reineroberhaus Рік тому

    Hallo, wie installliert man denn Updtes ??

    • @ei23de
      @ei23de  Рік тому +2

      über den ei23 Befehl im Terminal

  • @m1cs0w
    @m1cs0w 9 місяців тому

    Gibt es auch eine Anleitung wie man Paperless sichern kann? Und ggf. wiederherstellen, ohne Portainer, ohne direkte Installation auf einer NAS?

    • @ei23de
      @ei23de  9 місяців тому

      Du musst nur das Volume sichern, oder beim restore wieder einkopieren.
      Außer beim Wechsel von 32Bit auf 64Bit, da klappt das nicht.
      Alternativ reicht es vielleicht auch den Archive Ordner aus dem Volume zu sichern.

    • @m1cs0w
      @m1cs0w 9 місяців тому

      ​@@ei23de, also nur den Ordner bzw. den Inhalt Volume sichern, und dann nachdem man push pull gemacht hat von Docker, den Ordner mit Inhalt in Volume hineinkopieren, denke du meinst var/lib/docker/volumes? Ich habe ja das Script genutzt von Paperless.
      Reicht dann wohl einfach das Volume irgendwo hinkopieren, quasi mit FTP oder wie auch immer und dann paperless über docker stoppen, daraufhin ein Pull durchführen oder wie ist hier der Befehl?

    • @ei23de
      @ei23de  9 місяців тому +1

      Ich kann nur für mein Skript sprechen, bzw. das Docker Compose Template.
      Da ist es in ~/ei23-docker/volumes/paperless

    • @m1cs0w
      @m1cs0w 8 місяців тому

      Danke für die Rückmeldung. Ich versuche es mal via protainer auf einer anderen vm und füge dort nachträglich das Volume. Das einzige was ich merkwürdig finde. Paperless selbst sagt wenn man über docker hub installiert hat muss man den pull vom docker machen. Aber wie es von statten gehen soll, wenn man deren installiere Script nutzt gibt es keine konkrete Info.

  • @lrs_pfehler2719
    @lrs_pfehler2719 Рік тому

    Ist dein Homeserver noch ein PI? Kann mir nicht vorstellen das der genug Power hat für so ein Tool oder?

    • @ei23de
      @ei23de  Рік тому

      Klar packt das der Pi.
      Die Verarbeitung dauert wohl mal ne Minute, aber die Zeit kann er sich nehmen.
      Ich hab auch parallel immer noch Nextcloud und meine Telefonanlage drauf laufen.
      Mir ist der Pi wegen dem geringen Stromverbrauch so sympathisch.

    • @ei23de
      @ei23de  Рік тому +1

      Ansonsten ist ein VPS vermutlich noch die sinnvollste Lösung.
      Oder ein NUC oder NAS...
      Naja muss jeder selbst entscheiden. Das Skript läuft jedenfalls mittlerweile auf fast allen Debian Systemen.

    • @lrs_pfehler2719
      @lrs_pfehler2719 Рік тому

      @@ei23de ahh okay das hört sich gut an. Ich habe selber aktuell 2 PIs laufen über lege aber auf ein anderes diy System umzusteigen da ich auch mehr Festplatten anschließen möchte und das bekanntlich schwer ist beim Pi. Hatte ja sein können das du schon ein anderes System im Einsatz hast.

    • @ei23de
      @ei23de  Рік тому

      Ich hab noch einen Linux Rechner mit Festplatten, den schalte ich aber nur bei Bedarf an. Der zieht sonst dauerhaft 80Watt.
      Auch wie beim Türschloss ein hybrides System zum Strom sparen.

    • @lrs_pfehler2719
      @lrs_pfehler2719 Рік тому

      @@ei23de ahh okay das ist klug. Aber hast du auch Mal beim Linux Rechner Mal geguckt wie hoch der Strombedarf ist wenn die Festplatten abgeschaltet sind?

  • @vornamenachname6026
    @vornamenachname6026 Рік тому

    Wie kann ich extern ein Ordner als Quelle einbinden?

    • @ei23de
      @ei23de  Рік тому

      Es gibt einen Ordner "consume". Wenn man da Dokumente einfügt, dann werden diese automatisch eingelesen und einsortiert.

    • @vornamenachname6026
      @vornamenachname6026 Рік тому

      Ich habe meine Dokumente auf dem Nas und paperless auf wsl2.
      Wenn man auf der wsl2 Ubuntu auf /nmt/paperless den Ordner mountet kann man damit eigentlich arbeiten aber er liest es nicht ein :/

    • @ei23de
      @ei23de  Рік тому

      Synchronisation mit rsync (ggf. über ssh) vielleicht?
      Ist ja nicht falsch es an zwei Stellen zu speichern.

    • @vornamenachname6026
      @vornamenachname6026 Рік тому

      @@ei23de wäre eine Option. Ich verstehe nicht ganz das paperless die Daten verarbeitet und kopiert.
      Vielleicht kannst du Mal ein Video dazu machen, wenn du Zeit uns Lust hast wie man externe Quelle als consum Ordner einbinden und verarbeiten kann :)

  • @georgmondwurf7158
    @georgmondwurf7158 Рік тому +3

    Guten Tag! Kompliment! Das ist ein tolles Video. Leider geht mir das mit dem Hinweis, wie sich eine zweite Instanz einrichten lässt, zu schnell. Wäre das nicht sogar eine Idee für ein eigenes Video? Mich würde es freuen und ich würde es ganz sicher "liken" ... Danke!

    • @ei23de
      @ei23de  Рік тому +1

      Ich kann mich demnächst nochmal in einem kleinen Video der Docker-Compose Geschichte widmen, ok.

    • @georgmondwurf7158
      @georgmondwurf7158 Рік тому

      @@ei23de Das wäre wirklich großartig - auch wenn ein Multi-User System offenbar von den Entwicklern angekündigt wurde, ich kann mir gute Gründe vorstellen, warum eine zweite Instanz trotzdem Sinn macht. Herzlichen Dank im Voraus!

  • @Fr4nkieFPV
    @Fr4nkieFPV 5 місяців тому

    Gutes Video, bei mit hat dieser Pfad nur funktioniert: {document_type}/{created_year}-{created_month}_{tag_list}_{title}

    • @ei23de
      @ei23de  5 місяців тому

      cool

  • @stefanEf
    @stefanEf 11 місяців тому

    Für die meisten Menschen nicht geeignet... Nur für Spezialisten gedacht. Wenn ich ein Dokument bearbeiten möchte, muss ich noch Wissen in Programmierung über Konsole haben...? Bestimmt interessant für den ein oder anderen, erschwert die Ablage von Dokumenten. Es gibt wesentlich anwenderfreundlichere Möglichkeiten und Software.

    • @ei23de
      @ei23de  11 місяців тому +2

      Gebe ich dir recht:
      In einem Land wo der Nachrichtensprecher (Steffen Seibert) WLAN und Internet nicht unterscheiden kann, da wird die Anpassung von Textdateien als Programmierung und die Bedienung eines Konsolenfenster als Hacken angesehen...
      Traurig, aber wahr!
      Es gibt Länder, da können das bereits Kinder, aber hier darf man ja keinen mehr überfordern...

    • @MO-vd5kz
      @MO-vd5kz 9 місяців тому +1

      ​@@ei23de Es muss alles mundgerecht serviert werden, bloß nicht selber nachdenken