MRMCD2024 Paperless - was das ist und warum du das haben willst
Вставка
- Опубліковано 25 лис 2024
- media.ccc.de/v...
Wir haben ihn alle: Den unordentlichen Stapel geöffneter Briefe, Faxe und Flaschenpostsendungen irgendwo in einer Ecke, den man einmal im Jahr durchwühlt, um seine Steuererklärung zu machen. Fortgeschrittene haben Aktenordner, aber auch in denen findet man Dinge schwer wieder. Und dann gibt es da auch noch diese neuartigen digitalen Dokumente, die es einem regelmäßig ins Postfach spült. Was macht man eigentlich damit?
Fear not! Elektronische Dokumentenmanagementsysteme gibt es inzwischen in Open Source, und sie ergeben sowohl für Organisationen als auch für Privatpersonen Sinn. Lerne auch du, mit Technik Ordnung in deine Dokumentensammlungen zu bringen. Bürokratie kann so aufregend sein!
In diesem Talk werde ich auf die Nachteile klassischer heimischer Dokumentenablageansätze eingehen und erklären, wie sich diese mit einem Dokumentenmanagement lösen lassen. Weiterhin werde ich einen Crashkurs zum Aufbau eines eigenen Ablagesystems auf Basis von Paperless-ngx geben.
mart-w
talks.mrmcd.ne...
#mrmcd24
creativecommon...
Schoener Vortrag. Die Idee, den QR-Code am Anfang etwas länger mitzuschleifen finde ich super und werde ich in Zukunft auch so machen.
4:24 Die Anspielung auf D.Kriesel: ... wissen Sie nicht ob alle Zahlen noch stimmen ....
Paperless kann simplex gescannte Dokumente zusammenführen. Man muss dann nur das Dokument einmal einscannen, umdrehen und dann nochmal einscannen. Das ganze in einen bestimmten Ordner und paperless führt einem das zusammen. Ist eine env-var und ein bisschen versteckt
Das mit der Datenbank kannste dir klemmen, wenn du das export-Kommando verwendest. Dann wird das original, die Paperless-Variante und die Metadaten für jedes Dokument exportiert. Damit kann man die Daten auch wieder in eine neue Instanz einspielen.
Schöner Vortrag. Taste mich seit 6 Monaten an Paperless ran. Der "gescannt & abgelegt" Stempel mit der ASN ist mega cool. Wo bekommt man sowas her?
Gibt genügend Orte, die dir Stempel nach deinen Wünschen fertigen :D
Ich mache das mit zwei Stempeln: Einmal der violette "Gescannt & abgelegt"-Stempel und dann zusätzlich ein günstiger Paginierstempel, den ich in das Feld drücke. Es ist natürlich auch möglich, Paginierstempel mit integrierter Druckplatte zu bekommen, aber das kostet dann schon deutlich dreistellig, und das Geld lässt sich in meinen Augen besser in einen guten Scanner investieren :)
Cool!
Wenn du auf traue keinem scan den du nicht selbst gefällst hast, referenzierst bei deinem Kopieren joke. Inwiefern trifft dies dann nicht 10min später auch zu, wo du sagst du brauchst nen guten Scanner?
Kauf halt keine Scanner von Xerox, dann haste das Problem halt nicht ;)
@@HanzFromHellis ja auch quatsch, da ja das Problem behoben worden ist. Wer weiß wer noch seine scanns fälscht
@@Stephan4711Ist doch eh alles nur Humor und Spaß, nicht so ernst nehmen;-)
Was mir so auf der Hälfte des Vortrags komme - kann paperless zugferd und/oder xrechnung verarbeiten?
ICH WUSSTE ES
😁😁
Bei mir fischt Paperless automatisch alle Dokumente aus meinen E-Mails heraus. Was ich dann doch nicht haben möchte, lösche ich einfach wieder. Ich habe auch E-mails selbst importiert, aber die Darstellung gefällt mir gar nicht. Daher werden ich Gotenberg & Co für eml-Formate wieder rausnehmen. Ich importiere wichtige Mails lieber als PDF, das sieht einfach besser aus, ist aber etwas zusätzliche Arbeit.
Kann Paperless auch Dokumente nach einem Zeitraum X löschen?
crontab -e junge
Nicht von Haus aus, aber es gibt eine REST-API die quasi alles kann. Ich habe ein NodeRED drangeflanscht um ein paar Sachen zu automstisieren, da ginge natürlich auch sowas.
Was mir bei Paperless fehlt: automatisches Backup der Datenbank inklusive der Originale, was stündlich oder täglich läuft und alte Backups auch automatisch wegräumt. Ja, man kann in den Container rein gehen und manuell ein Backup schreiben, was man auch über ein Cron Job automatisch ausführen kann. Doch diese Funktion räumt keine alten Backups weg.
Lieber wäre mir eine Backup- und Restore-Funktion in der Benutzeroberfläche, wo man sagen könnte, dass man täglich ein Backup haben möchte und wieviele Backups man aufheben will. Als Backup Ziel sollte FTP, SMB und Clouddienste wie Dropbox & Co. möglich sein, und das bitte mit Verschlüsselung.
Was mir noch fehlt ist eine automatische Reparatur: Jetzt kann man sich nur anzeigen lassen, welche Dokumente verwaist sind oder fehlen. Die Option „repair“ fehlt leider. Man muss jedes Dokument mühselig von Hand reparieren. Die Reparaturfunktion dürfte auch gerne in die Admin-Oberfläche wandern.
Was schön wäre, waäre eine OCR-Funktion auf Basis eines neuronalen Netzwerks, so das die Zuverlässigkeit der Erkennung nahe an 100 % geht. Denn jetzt erkennt Paperless ein O manchmal als 0, oder ein l als 1 und ähnliche Dinge.
Aber ansonsten bin ich sehr begeistert von Paperless und ich habe schon 5305 Dokumente drin, was etwa 35 randvolle Büroordner an Dokumenten entspricht.
Kann Mayan EDMS das? Achso, EDMS ist allgemein gesprochen der Name für diese Kategorie von Archivierungssoftware mit OCR. Hätte ein allgemeines Video besser gefunden, Werkzeuge installieren bekomme ich hin. Aber von einer Kategorie an neuen Werkzeugen erstmals hören ist viel mehr wert.
@@andreashabermas7964 _„Kann Mayan EDMS das?“_
Das weiß ich nicht, ich kenne das nicht.
Ich habe vorher ecoDMS verwendet, das konnte zumindest ein zeitgesteuertes Backup aus der Oberfläche heraus machen. Es räumt aber auch nicht die alten Backups weg. Außerdem ist die Dokumentennachbearbeitung viel zu aufwändig und ich habe keinen Ordner mit den PDFs.
Bei Paperless habe ich einen Archiv-Ordner mit PDFs, den ich mir auf den Mac synchronisieren kann. So finde ich die Dokumente auch mit Spotlight oder einfach in einer sinnvollen Ordnerstruktur.
Cronjob?
Der Link zum PDF ist 404.
Ist repariert, danke dir!
Ich würde gern paperless auf meinem Server laufen lassen, aber sowohl die Datenbank als auch die Dateien auf einem abgebundenen Netzwerkspeicher liegen haben wollen. Ist das so konfigurierbar?
Geht grundsätzlich, indem du auf deinem Netzwerkspeicher entsprechende Verzeichnisse anlegst und diese über das Netzwerk auf deinen Paperless-Server mountest. Sei aber vorsichtig, denn wenn die Netzwerkstrecke nicht grundsolide ist oder dein NFS wackelt, ist das ein ausgezeichneter Weg, um Daten zu verlieren oder zu korrumpieren (ask me how I know). Die Datenbank lässt sich inzwischen resilienter machen, indem du von SQLite auf MariaDB umstellst und die Datenbank eben ganz normal über das Netzwerk als MariaDB ansprichst, aber für dein Archivverzeichnis musst du dir dennoch Gedanken machen. Je nachdem, was du machst, wird das aber auch nicht superriesig. Mein Paperless hält aktuell etwas über 800 Dokumente in teils recht hoher Qualität, und mein Archiv ist ca. 3 GiB groß. Das sind durchaus Größenordnungen, die auch auf kleine Server noch gut draufpassen können, ohne dass gleich das NAS als primäres Speichermedium herhalten muss.
Ich hab zwei Ordner für Papierrechnungen (steuerrelevant/nicht). In Thunderbird eine automatische Ablageregel für "Rechnung" von einer Liste von Absendern.
Kaum Anlageaufwand (alleine Einscannen wäre mir zu stressig), innerhalb 10 Minuten ist alles für die Steuerklärung da.
Sehe keinen Use case für mich, aber behalte es im Hinterkopf.
Hat jemand Empfehlungen für einen gebrauchten Scanner?
18:41 FAX? oder es IST FAX`?!!!?!?!?
Ich Würd darauf Wetten das dass Fax ist,..
😊😊😂😂🤣🤣
Was mich bei Paperless ein wenig stört ist dass es sowohl redis als auch postgres braucht, während postgres im Grunde auch redis ersetzen kann.
Zu viele deps x) ich nutze paperless aber trotzdem ..
GoBD-konform?
ja, sollte entsprechend konfigurierbar sein (Originale speichern, vernünftige Struktur etc.). Es gibt aber soweit ich weiß kein Zertifikat oder so dafür, falls du das meinst.
Meines Wissens bisher leider nicht.
Dazu müsste es revisionskonform sein. Das kann es aber nur sein, wenn neben der Tatsache, dass alle Versionen eines Dokuments aufbewahrt werden, auch die Löschung nur mit Dokumentation möglich ist - also auch nach dem Löschen noch nachvollziehbar ist, dass das Dokument einmal drin war.
Auch die Modifikation von Metadaten muss meines Wissens nachvollzogen werden können.
Einfach ein wenig BlaBla und schon ist das konform.
Ich mach meine ganze Buchführung damit. Diese ganzen Cloud-Programme sind teuer und unbrauchbar für EÜR.
_„GoBD-konform?“_
Nicht komplett. Aber wenn man die Originale aufhebt ist es auch nicht unbedingt nötig. Ich selber hebe nur wichtige Dokumente im Original auf wie Geburtsurkunden, große Rechnungen usw. Kleine Rechnungen (Bagatellbelege), wo das Finanzamt wahrscheinlich nie das Original anfordern wird und bei denen es auch nicht dramatisch ist, wenn das FA sie rausnimmt, habe ich nur in Paperless. Das Original kommt bei mir weg.
Paperless verwendet das Audit-Log des Django-Frameworks, das, einmal aktiviert, nicht mehr deaktiviert werden kann. Damit werden zumindest Änderungen dokumentiert, aber Löschungen sind meines Erachtens nicht ausreichend nachvollziehbar. Aber bei Unternehmensgrößen, bei denen Paperless in Frage kommt, dürfte das Archivieren der Originale auch nicht allzu schmerzhaft sein.