Hallo VanilleBear, Danke für das Feedback! Ich habe es noch nicht ausprobiert mit PAD und seitenübergreifenden Tabellen , aber Du könntest die Tabellenfunktion von PAD mal probieren, die ist vor ein paar Wochen zu PAD hinzugekommen und die habe ich in dem folgenden Video beschrieben. ua-cam.com/video/A9bbyGGPcBs/v-deo.html Wenn Du die Dokumentenanalyse professionell, also in einer Firma einsetzen und Prozesse automatisieren möchtest, empfehle ich Dir den Dienst Docparser, den ich in diesem Video vorgestellt habe: ua-cam.com/video/AkJoMu2QhV0/v-deo.html Den setze ich selbst ein und bin extrem zufrieden. Grüsse und viel Spass SwiPowE
Hallo. :) Schönes Video. Ich bin zwar auf einer anderen Suche (Auf Prozess warten, ohne den Prozess zu kennen, bzw. gibt mir Power Automate nicht den Prozess zur Auswahl den ich brauche), aber an der Stelle wo die Rechnung Nr. ausgelesen wird, kam mir die Frage in den Sinn: Gibt es nicht die Möglichkeit die erste numerische Folge nach dem Text "Rechnung Nr." abzufragen? dann könnte man sich das mit den Stellen zählen und angeben sparen. Und man könnte auch n+1 Nummern haben. Grüße
Hallo Edler Tropfen, danke für das Lob...und zu Deiner Frage: ja, man kann solche "intelligenten" Abfragemöglichkeiten über "reguläre Ausdrücke" bzw. "regular Expressions" oder kurz regex erledigen... hier kann man sich dazu schlau machen: regex101.com/ Grüsse SwiPowE
Erst mal Danke fürs Lob! So lange der Suchtext gefunden wird (im Beispiel "Rechnung Nr.") und sich im Anschluss die Rechnungsnummer befindet und diese nicht zu viele Stellen hat, funktioniert es. Wenn man mehrere Rechnungen die sich unterscheiden in einem Batch verarbeiten möchte, dann muss man den Flow anpassen. Z.B. könnte man den Lieferanten ermitteln und den Flow dann mit "If Then" Statements gestalten. Komplexe Dokumente mit z.B. Tabellen mit den Positionen lassen sich nicht auswerten. Dafür gibt es dann Tools wie z.B. Docparser. Ich plane darüber mal ein Video zu machen. Beste Grüsse Bernd aka Swipowe
Hi danke fürs Tutorial Hätte da noch eine frage wie kann ich aus einer pdf mehrer positionen extrahieren beispiel alle Reihen die bestellnr enthalten er zeigt mit diese dann zwar als werte an in positions kann jedoch die daten nicht ausgeben als text
Hallo Qwertz, zu dem Thema Tabellen Extraktion habe ich auch ein Video gemacht. ua-cam.com/video/A9bbyGGPcBs/v-deo.html Wenn du wirklich professionell mit Dokumenten arbeiten möchtest, es also kommerziell nutzen möchtest, empfehle ich mit Docparser zu arbeiten. Damit bin ich super zufrieden. Auch dazu habe ich ein Video: ua-cam.com/video/AkJoMu2QhV0/v-deo.html Grüsse und viel Erfolg SwiPowE
Hallo, vielen Dank für das Video! Wie kann ich mithilfe von Power automate desktop eine Excel Formel in eine von mir ausgewählte excel Zelle schreiben? Gruß
Hallo leybax054 ich habs in dem Video beschrieben: ua-cam.com/video/shWV0fX12RQ/v-deo.html Es geht über "Zelle in Excel Arbeitsblatt aktivieren" und danach über die Aktion "Tastaturbefehle senden" die Formel eintragen. Mit {Return} die Aktion abschliessen. Viel Erfolg SwiPowE
@@SwiPowE Hallo, ich habe herausgefunden, dass man auch mithilfe von “in Excel Arbeitsblatt schreiben“ die Formel in eine bestimmte Zelle schreiben kann. Einfach in englischer Sprache die Formel eingeben. Danke dennoch für deine Hilfe!
Hallo Andy, überprüfe mal die Werte, die du für das abrufen des Subtextes verwendest, das sind ja Variablen. Also den Wert der Variablen überprüfen (rechts in der Variablen Ansicht oder über ein Nachrichten Feld diese im Flow anzeigen. Dieses sind vermutlich keine Zahlen.. Zum Testen der Funktion ersetze mal die Variablen in der Subtext abrufen Aktion mit Zahlen, also festen Werten, dann funktioniert es ja, oder? Viel Erfolg und Grüsse SwiPowE
Hallo und Danke für das Video. Weißt du wie ich das mit Excel Dateien hinbekomme? Also ich habe 60 Excel-Dateien die alle gleich aufgebaut sind. Die Informationen aus den einzelnen Spalten möchte ich in eine einzige Tabelle packen
Hallo Ohrfeigenbaum, erstmal Glückwunsch zum Namen, den mag ich ... ;-) Zur Frage: Ja, das weiss ich...es gibt zwei Varianten: 1. Die für mich einfachere ist per "SQL Verbindung" auf die Excel Tabelle zugreifen...wie man auf eine Excel Datei / Tabelle / Arbeitsblatt per "SQL Verbindung" zugreift, steht noch auf der Agenda für zukünftige Videos. 2. Die andere Variante sind die in PAD vorhandenen Excel Befehle, da kannst Du Excel öffnen, Daten auslesen und auch wieder zurückschreiben.
Hallo Andy, danke für das Feedback. Was genau meinst Du denn mit "mehrere Infos"? Wenn es um Tabelleninhalte (z.B. Rechnungspositionen) geht, dann schaue Dir dieses Video ua-cam.com/video/A9bbyGGPcBs/v-deo.html an, da habe ich das Thema behandelt. Grüsse SwiPowE
Super Video! Ich versuche gerade aus dem Text die größte Zahl zu finden. Geht das irgendwie? Ich hab mehrere Rechnungen und leider auch verschiedene Beträge. Ich möchte eigentlich nur das Gesamtbrutto. Leider findet sich auch keine gute Position in dem Text...
Hallo Robert, danke für das Feedback! Eigentlich musst Du doch anhand irgendeines eines Stichworts oder mehrerer das Gesamtbrutto identifizieren oder eingrenzen können, oder? Eingrenzen bedeutet, Dir aus dem Gesamttext den Textteil "auszuschneiden", der das Gesamtbrutto enthält. (Mit vorlaufendem und nachlaufenden Stichwort und den entsprechenden Textfunktionen.) Normalerweise enden ja die Positionen mit Gesamtsumme, Mehrwertsteuer oder ähnlichem und nach der Gesamtsumme kommt wieder ein Stichwort, was das Ende markiert. Dann müsste man nur den Zahlenwert aus diesem Textteil rausholen. Mit grösstem Zahlenwert würde ich nicht arbeiten, schnell ist dann Deine Rechnungssumme immer die BIC oder IBAN Nummer... ;-). Grüsse SwiPowE
@@SwiPowE Wow! Vielen Dank für die ausführliche Antwort. Leider habe ich das Problem, dass in der Variable "ExtractedPDFText" kein vorlaufender Text steht, sondern unterschiedliche Teilbeträge. Nach dem Brutto steht ein Text (nächste Zeile). Aber wie lässt sich der Text nur danach ausschneiden? z.B. Zeile | Text 46| 232,25 EUR 47| 242,62 EUR 48| 474,87 EUR 49| Ihr Rechnungsbetrag xxxx gewünschter Wert wären die 474,87 EUR. Leider ist das auch noch je nach PDF-Dokument eine andere Position :) Sonst hätte ich mich danach gerichtet.
Wenn ich es richtig verstehe, musst Du die Summe VOR "Ihr Rechnungsbetrag" extrahieren, korrekt? Dann könntest Du z.B. den Text BIS Ihr Rechnungsbetrag ausschneiden. Wenn es dann am Ende immer eine feste Zeichenanzahl ist oder es einfach das letzte Freizeichen usw., dann könnte man das nehmen. Du könntest probieren, ob es dann Zeilenumbrüche gibt (das sind versteckte Zeichen, die kann man aber auch analysieren (sehen kann man die z.B. wenn man den Text in einen Texteditor wie Notepad++ oder auch z.B. in die Webseite regex101.com in den Bereich "Test String" einfügt) und damit einfach den letzten Zeilenumbruch im Text ausschneiden. Oder Du suchst nach allen EUR in dem ausgeschnittenen Text (dürfte eine Liste geben), dann kannst Du die Zeichen vor dem letzten EUR rausholen. Ich muss aber auch immer ein bisschen probieren, bis ich ein funktionierende Lösung habe... Eins ist aber garantiert: irgendwie geht es! Dran bleiben, zur Not auch noch mal Regex Funktionen anschauen, die helfen auch häufig weiter...Und wenn es gewerblich ist, empfehle ich immer mit dem Dienst DocParser.com zu arbeiten, das funktioniert super, setze ich auch für Projekte ein. Habe ich ein Video zu gemacht: ua-cam.com/video/AkJoMu2QhV0/v-deo.html Grüsse und viel Erfolg SwiPowE
Hallo Danke für das Video! Ich habe leider ein Problem: Ich möchte ebenfalls ein Text aus einer PDF extrahieren jedoch erkennt er diesen nicht. In der PDF ist ein "fester Text" und eine zeile jeweils daneben, worin von Hand freier Text (in meinem Fall Zahlen) geschrieben werden können. Diese werden dann halt nicht erkannt. Was kann ich tun? Liebe Grüße Erkin
Hallo Erkin, dann wird ein Teil Deines Textes wohl nicht als Text erkannt, der Textlayer fehlt. (Du kannst den Text dann auch vermutlich nicht manuell markieren, oder?). Du kannst probieren ein OCR zu machen (Optical Character Recognition). Es gibt eine "OCR" Funktion auch in Power Automate Desktop, damit könntest Du etwas rumspielen und probieren, ob der Text dann identifiziert wird. Für professionelle Dokumentenanalysen verweise ich auf Docparser, bei diesem Dienst kann auch ein "OCR" gemacht werden. Hier der Link: docparser.com/?ref=gqpyw und hier der Link zum Video ua-cam.com/video/AkJoMu2QhV0/v-deo.html , das den Docparser behandelt. Viel Erfolg! SwiPowE
Hallo, danke für das hilfreiche Video! Ich habe das Problem, dass bei der Extraktion des PDF Textes je nach pdf nur fettgedruckter oder gar kein Text erkannt wird. Die Qualität der pdfs ist normal. Hast du eine Idee, woran es liegen könnte?
Mmmh, nein, nicht wirklich...in elektronisch generierten PDFs ist ja ein "TextLayer" versteckt, der von PAD ausgewertet wird. Für gewöhlich kannst Du diesen Text dann auch in einem PDF Viewer markieren und kopieren. Geht das bei Deinem Dokument? Wenn das nur für den fetten Text geht, dürfte der andere Text kein erkennbares Text Layer Format haben. Du könntest auch probieren, das Dokument mal mit der OCR Funktion von PAD zu analysieren und zu schauen, ob dann mehr Text erkannt wird. Schlussendlich würde ich die Datei auch mal z.B. vom Docparser analysieren lassen. Zu diesem sehr coolen Dienst habe ich auch schon ein Video gemacht und ich setze diesen gerne ein, da er sehr zuverlässig ist. ua-cam.com/video/AkJoMu2QhV0/v-deo.html 30 Dokumente sind kostenlos im Monat, der Link zum Dienst hier: docparser.com/?ref=gqpyw Viel Spass MrSpexxx !
@@SwiPowE Vielen Dank für die ausführliche Antwort! Ich kann den Text in der PDF tatsachlich nicht markieren. Ich werde also die von dir genannten Funktionen mal ausprobieren. Wenn ich dran denke gebe ich Feedback, was geklappt hat!
@@focusforfreedom9829 Mittels OCR war in meinem Fall die Auslesung deutlich zu fehlerhaft, auch Docparser konnte das Problem nicht lösen. Docparser hat schon sehr coole Funktionen aber zaubern kann es eben auch nicht, ohne Textebene kann man das automatische Auslesen meiner Erfahrung nach vergessen, zumindest wenn es um größere, zum Teil variable Datentabellen geht. Da muss jetzt an anderer Stelle Fortschritt gemacht werden, z.B. in puncto digitale Signatur.
Coole Video, sehr gut erklärt und einfach zu verstehen. 😊 vielen Dank !!! Ist es möglich power automate bzw. den Flow von außen über einen Button zu starten? Und könntest du evtl. ein Video machen, in dem erklärt wird, wie man E-Mail Anhänge aus einem bestimmten Postfach in einen Ordner bekommt? So könnte man den aktuellen Flow mit Outlook verbinden. Vielen Dank im Voraus 😊 VG Sebastian
Hallo Sebastian, danke für das Feedback.. In der Tat habe ich einen Prozess bei E-mail Anhänge lokal gespeichert und dann analysiert werden.. ja, gute Idee für ein Video . Bzgl. einem Trigger für PAD: das geht mit einer premium Lizenz für Power Automate, dann kannst du den Flow nach Zeit oder anderen Ereignissen laufen lassen, wenn natürlich der Rechner verfügbar ist. LG Bernd als SwiPowE
Ich habe aktuell dass Problem beim nachmachen, dass wenn die Daten in Spalte 2 und 3 eingetragen werden, also in deinem Fall RechDatum und RechBeitrag, die Daten nicht in die erste freie Spalte eingetragen werden, sondern unter der Höhe von dem letzten Eintrag der Spalte 1.
Hallo Weg zur ersten Million, man steuert die Spalten ja über zwei Wert an, einen variablen Wert (Zeile oder FirstFreeRow) und einen fixen Wert (Spalte). Du kannst in Deinen Flow einen Haltepunkt einbauen und kontrollieren, welche Werte verwendet werden um die Excel Liste zu befüllen. Der variable Wert muss mit jeder Zeile hochzählen (Eventuell hast Du in Spalte 1 keine Werte die eingetragen werden, deswegen wird diese wieder als "FirstFreeRow" ermittelt?). Alternativ kannst Du eine Variable erstellen und in jeder Schlaufe um 1 (dafür gibt es eine Funktion in "Variablen") erhöhen und diese Variable dann in den Befehl "in Excel Arbeitsblatt schreiben" "Zeile" eintragen. Grüsse und viel Erfolg SwiPowE
Vielen Dank für das tolle Video! Ich habe den gesamten Prozess nachgebaut und er funktioniert wunderbar! Nur ein Problem habe ich noch. Gibt es die Möglichkeit bei der Analyse des Texts auch „oder“ Operatoren zu verwenden? Also soll z.B. „Rechnung Nr“ oder „Invoice No“. gesucht werden. Ich habe es mit „or“ versucht, aber irgendwas mache ich falsch. LG Jule
Hallo Jule, es freut mich, dass es Dir gefallen hat..ich würde es folgendermassen machen: Es gibt ja immer nur einen der beiden Werte, insofern kannst Du nach beiden Werten suchen und im Anschluss über eine "If Then" Bedingung überprüfen, welcher der beiden Werte befüllt ist und diese dann in eine separate Variable schreiben, die Du dann in Deine Datenquelle einträgst. Sinngemäss dieser Ablauf nachdem die Variablen (%varRechnungNr% / %varInvoiceNo%) befüllt wurden: [ If %varRechnungNr% = leer then %varRechNrfürExcel% = %varInvoiceNo% else %varRechNrfürExcel% = %varRechnungNr% end ] Wenn also die RechnungsNr Variable leer ist, befülle die Arbeitsvariable mit der Invoice Nummer Variable, sonst eben mit der RechnungsNr Variablen. Viel Spass noch beim Automatisieren! Grüsse Bernd aka SwiPowE
Echt eine Super Anleitung und Hilfe hier bei dir!!! TOP! Ich konnte so meinen eigenen lokalen PDF-Reader erstellen, welcher 2 Zahlenfolgen aus PDFs extrahiert und dann in eine CSV zeilenweise ablegt. Doch kann ich das Ganze auch gleichwertig in der in der Power Automate Browser/Cloud Version anlegen? Aber eben ohne den vorgefertigten AI-Builder, da dieser doch ein Premium Abo voraussetzt. in der Cloudversion finde ich besonders das Variablen setzen viel komplizierter als am Desktop.
Hallo Thomas, danke für das Lob! Bzgl. Text Extraktion in Power Automate Cloud: es gibt keine Standardfunktion, die den Textlayer aus einem PDF rausholt. Da musst Du auf Premium Konnektoren zurückgreifen. Encodian z.B. bietet diese Funktion an, da hast Du 50 Aktionen im Monat kostenlos. support.encodian.com/hc/en-gb/articles/360015539373-Get-PDF-Text-Layer Du kannst sehr komfortabel auch mit dem Dienst DocParser Texte aus Dokumenten holen und diese dann an PowerAutomate übergeben. Dazu habe ich bereits ein Video gemacht: ua-cam.com/video/AkJoMu2QhV0/v-deo.html, auch bei Docparser gibt es monatlich kostenlose Kontingente. Grüsse SwiPowE
@@SwiPowE Danke dir. Ja dein Video dazu hab ich auch schon gesehen. Aber eigentlich bekomm ich ja auch die Umwandlung des PDF´s in Text hin. Kann ich hier nicht einfach sagen, "zieh dir nur Zeile 298..." und... das versteh ich halt nicht.
Hallo Thomas, grundsätzlich geht das auch über Zeilen, wenn es wirklich immer Zeile 298 ist. Du musst dann Zeilenumbrüche zählen. Zeilenumbrüche solltest Du über Char(10) oder Char(13) oder Regex Funktionen ermitteln können.
Hallo Spadress ja, das kann man natürlich auch machen, nach dem ersten Leerzeichen zu suchen ... wie genau man das macht, hängt von der Rechnungsnummer und dem Layout des Dokuments ab, das man auswerten möchte. Wenn die Rechnungsnummer "2024 0014545" ist, kann man nach der zweiten Leerzeichen suchen. Man kann auch nach Zeilenumbrüchen suchen oder nach bestimmten Nummernsystematiken, dafür verwendet man dann "REGEX" Funktionen. So kann man z.B. nach Telefonnummern, die einem bestimmten Format entsprechen, suchen. Viel Erfolg! Grüsse SwiPowE aka Bernd
Bei mir spuckt in Step 5 Power Automate immer den Fehler aus: "Die DLL "pdfium": Die angegebene Prozedur wurde nicht gefunden. (Ausnahme von HRESULT: 0x8007007F) kann nicht geladen werden." Eine Idee wie man das beheben kann? Im Netz finde ich dazu nichts
Hallo HohesHaus, mmmh, keine Ahnung wo Dein Fehler liegt. Ich habe mal mein C-Laufwerk nach dem File durchsucht und er hat ihn nicht gefunden. Ich würde mal drauf tippen, dass es sich um einen Installationsfehler handelt. Vllt. PAD deinstallieren und neu installieren? Bestehende Flows, wenn Du keinen Premium / Trial Account hast, ggf. sichern!
@@SwiPowE Danke für deine Antwort. Das Problem hat sich gelöst, nachdem ich den PC neugestartet habe. Anscheinend wird der DLL erst dann im Hintergrund geladen
Super, vielen Dank. Ich habe nur noch das Problem, dass der Rechnungsbetrag als TEXT in der EXCEL steht. Ich hätte ihn aber gerne als Zahl. Wie geht das?
Hallo Volker, schön, dass Du es nachvollziehen konntest! Ich habe immer wieder Probleme mit den Datentypen gehabt und meistens bin ich mit "TEXT" besser gefahren. Aber wenn es unbedingt eine Zahl sein muss, dann musst Du die den Wert über eine Text Funktion in eine Zahl umwandeln und im Update Statement die Hochkommas weglassen, also %Variable% statt '%Variable%'. Achte darauf, dass mindestens in der ersten Zeile Deiner Excel Tabelle auch ein Zahlenwert steht, ansonsten gibt es Mecker...bzw. eine Fehlermeldung. Klappt das? Grüsse SwiPowE aka Bernd
Vielen, vielen Dank. Super nachvollziehbar erklärt. Top!
Cool! Danke Dir für Dein nettes Feedback.
Vielen, vielen Dank, das ganze Video hat mir sehr geholfen! :)
Das freut mich! Danke für das Feedback!
Herzlichen Dank!
Hallo
herzlichen Dank für das "herzlichen Dank" 👌🙏 !
Hallo, danke für dieses tolle Video. Wie kann ich denn aus einer PDF mehrere Seiten auslesen? Beispiel sammelrechnung über mehrere Seiten?
Hallo VanilleBear,
Danke für das Feedback!
Ich habe es noch nicht ausprobiert mit PAD und seitenübergreifenden Tabellen , aber Du könntest die Tabellenfunktion von PAD mal probieren, die ist vor ein paar Wochen zu PAD hinzugekommen und die habe ich in dem folgenden Video beschrieben. ua-cam.com/video/A9bbyGGPcBs/v-deo.html
Wenn Du die Dokumentenanalyse professionell, also in einer Firma einsetzen und Prozesse automatisieren möchtest, empfehle ich Dir den Dienst Docparser, den ich in diesem Video vorgestellt habe: ua-cam.com/video/AkJoMu2QhV0/v-deo.html
Den setze ich selbst ein und bin extrem zufrieden.
Grüsse und viel Spass
SwiPowE
Hast du eine Lösung gefunden? Mich beschäftigt zurzeit derselbe Fall
@@romiafifi9453 nein, leider nicht hinbekommen bzw. Noch nicht probieren können. :(
Hallo. :) Schönes Video. Ich bin zwar auf einer anderen Suche (Auf Prozess warten, ohne den Prozess zu kennen, bzw. gibt mir Power Automate nicht den Prozess zur Auswahl den ich brauche), aber an der Stelle wo die Rechnung Nr. ausgelesen wird, kam mir die Frage in den Sinn: Gibt es nicht die Möglichkeit die erste numerische Folge nach dem Text "Rechnung Nr." abzufragen? dann könnte man sich das mit den Stellen zählen und angeben sparen. Und man könnte auch n+1 Nummern haben. Grüße
Hallo Edler Tropfen, danke für das Lob...und zu Deiner Frage: ja, man kann solche "intelligenten" Abfragemöglichkeiten über "reguläre Ausdrücke" bzw. "regular Expressions" oder kurz regex erledigen... hier kann man sich dazu schlau machen: regex101.com/ Grüsse SwiPowE
Erstmal Prima sehr ausführlich erklärt , ich habe dazu eine frage was ist wenn dazu mehrere Rechnungen die nicht den selben aufbau haben ?
Erst mal Danke fürs Lob! So lange der Suchtext gefunden wird (im Beispiel "Rechnung Nr.") und sich im Anschluss die Rechnungsnummer befindet und diese nicht zu viele Stellen hat, funktioniert es. Wenn man mehrere Rechnungen die sich unterscheiden in einem Batch verarbeiten möchte, dann muss man den Flow anpassen. Z.B. könnte man den Lieferanten ermitteln und den Flow dann mit "If Then" Statements gestalten. Komplexe Dokumente mit z.B. Tabellen mit den Positionen lassen sich nicht auswerten. Dafür gibt es dann Tools wie z.B. Docparser. Ich plane darüber mal ein Video zu machen.
Beste Grüsse Bernd aka Swipowe
Cool merci=)
Danke für das Feedback!
Hi danke fürs Tutorial
Hätte da noch eine frage wie kann ich aus einer pdf mehrer positionen extrahieren beispiel alle Reihen die bestellnr enthalten er zeigt mit diese dann zwar als werte an in positions kann jedoch die daten nicht ausgeben als text
Hallo Qwertz,
zu dem Thema Tabellen Extraktion habe ich auch ein Video gemacht. ua-cam.com/video/A9bbyGGPcBs/v-deo.html
Wenn du wirklich professionell mit Dokumenten arbeiten möchtest, es also kommerziell nutzen möchtest, empfehle ich mit Docparser zu arbeiten. Damit bin ich super zufrieden. Auch dazu habe ich ein Video: ua-cam.com/video/AkJoMu2QhV0/v-deo.html
Grüsse und viel Erfolg
SwiPowE
Hallo, vielen Dank für das Video!
Wie kann ich mithilfe von Power automate desktop eine Excel Formel in eine von mir ausgewählte excel Zelle schreiben?
Gruß
Hallo leybax054
ich habs in dem Video beschrieben: ua-cam.com/video/shWV0fX12RQ/v-deo.html
Es geht über "Zelle in Excel Arbeitsblatt aktivieren" und danach über die Aktion "Tastaturbefehle senden" die Formel eintragen. Mit {Return} die Aktion abschliessen.
Viel Erfolg
SwiPowE
@@SwiPowE Hallo, ich habe herausgefunden, dass man auch mithilfe von “in Excel Arbeitsblatt schreiben“ die Formel in eine bestimmte Zelle schreiben kann. Einfach in englischer Sprache die Formel eingeben.
Danke dennoch für deine Hilfe!
Hi ich noch einmal, bei mir kommt, bei Subtext abrufen, dass die Zeichenposition Numerischen Wert haben muss. Ich kann den Flow sonst nicht ausführen.
Hallo Andy,
überprüfe mal die Werte, die du für das abrufen des Subtextes verwendest, das sind ja Variablen. Also den Wert der Variablen überprüfen (rechts in der Variablen Ansicht oder über ein Nachrichten Feld diese im Flow anzeigen. Dieses sind vermutlich keine Zahlen.. Zum Testen der Funktion ersetze mal die Variablen in der Subtext abrufen Aktion mit Zahlen, also festen Werten, dann funktioniert es ja, oder?
Viel Erfolg und Grüsse
SwiPowE
Hallo und Danke für das Video. Weißt du wie ich das mit Excel Dateien hinbekomme? Also ich habe 60 Excel-Dateien die alle gleich aufgebaut sind. Die Informationen aus den einzelnen Spalten möchte ich in eine einzige Tabelle packen
Hallo Ohrfeigenbaum, erstmal Glückwunsch zum Namen, den mag ich ... ;-)
Zur Frage: Ja, das weiss ich...es gibt zwei Varianten:
1. Die für mich einfachere ist per "SQL Verbindung" auf die Excel Tabelle zugreifen...wie man auf eine Excel Datei / Tabelle / Arbeitsblatt per "SQL Verbindung" zugreift, steht noch auf der Agenda für zukünftige Videos.
2. Die andere Variante sind die in PAD vorhandenen Excel Befehle, da kannst Du Excel öffnen, Daten auslesen und auch wieder zurückschreiben.
Hi, super Video jedoch folgende Frage.
Ich will mehrere INfo's aus der PDF abrufen.
Wie mache ich das?
Grüße
Hallo Andy, danke für das Feedback. Was genau meinst Du denn mit "mehrere Infos"? Wenn es um Tabelleninhalte (z.B. Rechnungspositionen) geht, dann schaue Dir dieses Video ua-cam.com/video/A9bbyGGPcBs/v-deo.html an, da habe ich das Thema behandelt. Grüsse SwiPowE
Super Video! Ich versuche gerade aus dem Text die größte Zahl zu finden. Geht das irgendwie? Ich hab mehrere Rechnungen und leider auch verschiedene Beträge. Ich möchte eigentlich nur das Gesamtbrutto. Leider findet sich auch keine gute Position in dem Text...
Hallo Robert, danke für das Feedback!
Eigentlich musst Du doch anhand irgendeines eines Stichworts oder mehrerer das Gesamtbrutto identifizieren oder eingrenzen können, oder?
Eingrenzen bedeutet, Dir aus dem Gesamttext den Textteil "auszuschneiden", der das Gesamtbrutto enthält. (Mit vorlaufendem und nachlaufenden Stichwort und den entsprechenden Textfunktionen.) Normalerweise enden ja die Positionen mit Gesamtsumme, Mehrwertsteuer oder ähnlichem und nach der Gesamtsumme kommt wieder ein Stichwort, was das Ende markiert. Dann müsste man nur den Zahlenwert aus diesem Textteil rausholen.
Mit grösstem Zahlenwert würde ich nicht arbeiten, schnell ist dann Deine Rechnungssumme immer die BIC oder IBAN Nummer... ;-).
Grüsse
SwiPowE
@@SwiPowE Wow! Vielen Dank für die ausführliche Antwort. Leider habe ich das Problem, dass in der Variable "ExtractedPDFText" kein vorlaufender Text steht, sondern unterschiedliche Teilbeträge. Nach dem Brutto steht ein Text (nächste Zeile). Aber wie lässt sich der Text nur danach ausschneiden?
z.B.
Zeile | Text
46| 232,25 EUR
47| 242,62 EUR
48| 474,87 EUR
49| Ihr Rechnungsbetrag xxxx
gewünschter Wert wären die 474,87 EUR. Leider ist das auch noch je nach PDF-Dokument eine andere Position :) Sonst hätte ich mich danach gerichtet.
Wenn ich es richtig verstehe, musst Du die Summe VOR "Ihr Rechnungsbetrag" extrahieren, korrekt? Dann könntest Du z.B. den Text BIS Ihr Rechnungsbetrag ausschneiden. Wenn es dann am Ende immer eine feste Zeichenanzahl ist oder es einfach das letzte Freizeichen usw., dann könnte man das nehmen.
Du könntest probieren, ob es dann Zeilenumbrüche gibt (das sind versteckte Zeichen, die kann man aber auch analysieren (sehen kann man die z.B. wenn man den Text in einen Texteditor wie Notepad++ oder auch z.B. in die Webseite regex101.com in den Bereich "Test String" einfügt) und damit einfach den letzten Zeilenumbruch im Text ausschneiden.
Oder Du suchst nach allen EUR in dem ausgeschnittenen Text (dürfte eine Liste geben), dann kannst Du die Zeichen vor dem letzten EUR rausholen. Ich muss aber auch immer ein bisschen probieren, bis ich ein funktionierende Lösung habe...
Eins ist aber garantiert: irgendwie geht es! Dran bleiben, zur Not auch noch mal Regex Funktionen anschauen, die helfen auch häufig weiter...Und wenn es gewerblich ist, empfehle ich immer mit dem Dienst DocParser.com zu arbeiten, das funktioniert super, setze ich auch für Projekte ein. Habe ich ein Video zu gemacht: ua-cam.com/video/AkJoMu2QhV0/v-deo.html
Grüsse und viel Erfolg
SwiPowE
Hallo Danke für das Video! Ich habe leider ein Problem: Ich möchte ebenfalls ein Text aus einer PDF extrahieren jedoch erkennt er diesen nicht. In der PDF ist ein "fester Text" und eine zeile jeweils daneben, worin von Hand freier Text (in meinem Fall Zahlen) geschrieben werden können. Diese werden dann halt nicht erkannt.
Was kann ich tun?
Liebe Grüße
Erkin
Hallo Erkin, dann wird ein Teil Deines Textes wohl nicht als Text erkannt, der Textlayer fehlt. (Du kannst den Text dann auch vermutlich nicht manuell markieren, oder?). Du kannst probieren ein OCR zu machen (Optical Character Recognition). Es gibt eine "OCR" Funktion auch in Power Automate Desktop, damit könntest Du etwas rumspielen und probieren, ob der Text dann identifiziert wird.
Für professionelle Dokumentenanalysen verweise ich auf Docparser, bei diesem Dienst kann auch ein "OCR" gemacht werden. Hier der Link: docparser.com/?ref=gqpyw und hier der Link zum Video ua-cam.com/video/AkJoMu2QhV0/v-deo.html , das den Docparser behandelt.
Viel Erfolg!
SwiPowE
@@SwiPowE Wow. Vielen Dank für die schnelle Rückmeldung! Ich versuch mal mein Glück
Danke !!!
Hallo, danke für das hilfreiche Video! Ich habe das Problem, dass bei der Extraktion des PDF Textes je nach pdf nur fettgedruckter oder gar kein Text erkannt wird. Die Qualität der pdfs ist normal. Hast du eine Idee, woran es liegen könnte?
Mmmh, nein, nicht wirklich...in elektronisch generierten PDFs ist ja ein "TextLayer" versteckt, der von PAD ausgewertet wird. Für gewöhlich kannst Du diesen Text dann auch in einem PDF Viewer markieren und kopieren. Geht das bei Deinem Dokument? Wenn das nur für den fetten Text geht, dürfte der andere Text kein erkennbares Text Layer Format haben.
Du könntest auch probieren, das Dokument mal mit der OCR Funktion von PAD zu analysieren und zu schauen, ob dann mehr Text erkannt wird.
Schlussendlich würde ich die Datei auch mal z.B. vom Docparser analysieren lassen. Zu diesem sehr coolen Dienst habe ich auch schon ein Video gemacht und ich setze diesen gerne ein, da er sehr zuverlässig ist.
ua-cam.com/video/AkJoMu2QhV0/v-deo.html
30 Dokumente sind kostenlos im Monat, der Link zum Dienst hier:
docparser.com/?ref=gqpyw
Viel Spass MrSpexxx !
@@SwiPowE Vielen Dank für die ausführliche Antwort!
Ich kann den Text in der PDF tatsachlich nicht markieren. Ich werde also die von dir genannten Funktionen mal ausprobieren. Wenn ich dran denke gebe ich Feedback, was geklappt hat!
@@mrspexxx3583 Hallo. Hat es funktioniert?
@@focusforfreedom9829 Mittels OCR war in meinem Fall die Auslesung deutlich zu fehlerhaft, auch Docparser konnte das Problem nicht lösen. Docparser hat schon sehr coole Funktionen aber zaubern kann es eben auch nicht, ohne Textebene kann man das automatische Auslesen meiner Erfahrung nach vergessen, zumindest wenn es um größere, zum Teil variable Datentabellen geht. Da muss jetzt an anderer Stelle Fortschritt gemacht werden, z.B. in puncto digitale Signatur.
@@mrspexxx3583 Da drücke ich dir Daumen, dass du noch eine gute Lösung für dich findest. Bist du noch regelmäßig aktiv mit PowerAutomate?
Coole Video, sehr gut erklärt und einfach zu verstehen. 😊 vielen Dank !!! Ist es möglich power automate bzw. den Flow von außen über einen Button zu starten?
Und könntest du evtl. ein Video machen, in dem erklärt wird, wie man E-Mail Anhänge aus einem bestimmten Postfach in einen Ordner bekommt? So könnte man den aktuellen Flow mit Outlook verbinden. Vielen Dank im Voraus 😊 VG Sebastian
Hallo Sebastian, danke für das Feedback.. In der Tat habe ich einen Prozess bei E-mail Anhänge lokal gespeichert und dann analysiert werden.. ja, gute Idee für ein Video .
Bzgl. einem Trigger für PAD: das geht mit einer premium Lizenz für Power Automate, dann kannst du den Flow nach Zeit oder anderen Ereignissen laufen lassen, wenn natürlich der Rechner verfügbar ist.
LG Bernd als SwiPowE
Hallo Sebastian,
habe zwei Videos gemacht wie man E-Mail Anhänge in einen lokalen Ordner downloaden kann.
Viel Spass damit!
SwiPowE aka Bernd
Ich habe aktuell dass Problem beim nachmachen, dass wenn die Daten in Spalte 2 und 3 eingetragen werden, also in deinem Fall RechDatum und RechBeitrag, die Daten nicht in die erste freie Spalte eingetragen werden, sondern unter der Höhe von dem letzten Eintrag der Spalte 1.
Hallo Weg zur ersten Million,
man steuert die Spalten ja über zwei Wert an, einen variablen Wert (Zeile oder FirstFreeRow) und einen fixen Wert (Spalte). Du kannst in Deinen Flow einen Haltepunkt einbauen und kontrollieren, welche Werte verwendet werden um die Excel Liste zu befüllen. Der variable Wert muss mit jeder Zeile hochzählen (Eventuell hast Du in Spalte 1 keine Werte die eingetragen werden, deswegen wird diese wieder als "FirstFreeRow" ermittelt?).
Alternativ kannst Du eine Variable erstellen und in jeder Schlaufe um 1 (dafür gibt es eine Funktion in "Variablen") erhöhen und diese Variable dann in den Befehl "in Excel Arbeitsblatt schreiben" "Zeile" eintragen.
Grüsse und viel Erfolg
SwiPowE
Vielen Dank für das tolle Video! Ich habe den gesamten Prozess nachgebaut und er funktioniert wunderbar! Nur ein Problem habe ich noch. Gibt es die Möglichkeit bei der Analyse des Texts auch „oder“ Operatoren zu verwenden? Also soll z.B. „Rechnung Nr“ oder „Invoice No“. gesucht werden. Ich habe es mit „or“ versucht, aber irgendwas mache ich falsch. LG Jule
Hallo Jule,
es freut mich, dass es Dir gefallen hat..ich würde es folgendermassen machen:
Es gibt ja immer nur einen der beiden Werte, insofern kannst Du nach beiden Werten suchen und im Anschluss über eine "If Then" Bedingung überprüfen, welcher der beiden Werte befüllt ist und diese dann in eine separate Variable schreiben, die Du dann in Deine Datenquelle einträgst.
Sinngemäss dieser Ablauf nachdem die Variablen (%varRechnungNr% / %varInvoiceNo%) befüllt wurden:
[ If %varRechnungNr% = leer then %varRechNrfürExcel% = %varInvoiceNo% else %varRechNrfürExcel% = %varRechnungNr% end ]
Wenn also die RechnungsNr Variable leer ist, befülle die Arbeitsvariable mit der Invoice Nummer Variable, sonst eben mit der RechnungsNr Variablen.
Viel Spass noch beim Automatisieren!
Grüsse
Bernd aka SwiPowE
@@SwiPowE super, danke für die schnelle Antwort. Bin schon fleißig am Basteln 😀
Hallo,
wenn du in deinem Suchfeld einen regulären Ausdruck verwendest, kannst du dir die "If then" Abfrage sparen!
zBsp: "(Rechnung Nr|Invoice No)"
Echt eine Super Anleitung und Hilfe hier bei dir!!! TOP!
Ich konnte so meinen eigenen lokalen PDF-Reader erstellen, welcher 2 Zahlenfolgen aus PDFs extrahiert und dann in eine CSV zeilenweise ablegt.
Doch kann ich das Ganze auch gleichwertig in der in der Power Automate Browser/Cloud Version anlegen? Aber eben ohne den vorgefertigten AI-Builder, da dieser doch ein Premium Abo voraussetzt.
in der Cloudversion finde ich besonders das Variablen setzen viel komplizierter als am Desktop.
Hallo Thomas, danke für das Lob!
Bzgl. Text Extraktion in Power Automate Cloud: es gibt keine Standardfunktion, die den Textlayer aus einem PDF rausholt. Da musst Du auf Premium Konnektoren zurückgreifen. Encodian z.B. bietet diese Funktion an, da hast Du 50 Aktionen im Monat kostenlos. support.encodian.com/hc/en-gb/articles/360015539373-Get-PDF-Text-Layer
Du kannst sehr komfortabel auch mit dem Dienst DocParser Texte aus Dokumenten holen und diese dann an PowerAutomate übergeben. Dazu habe ich bereits ein Video gemacht: ua-cam.com/video/AkJoMu2QhV0/v-deo.html, auch bei Docparser gibt es monatlich kostenlose Kontingente.
Grüsse
SwiPowE
@@SwiPowE Danke dir. Ja dein Video dazu hab ich auch schon gesehen. Aber eigentlich bekomm ich ja auch die Umwandlung des PDF´s in Text hin. Kann ich hier nicht einfach sagen, "zieh dir nur Zeile 298..." und...
das versteh ich halt nicht.
Hallo Thomas, grundsätzlich geht das auch über Zeilen, wenn es wirklich immer Zeile 298 ist. Du musst dann Zeilenumbrüche zählen. Zeilenumbrüche solltest Du über Char(10) oder Char(13) oder Regex Funktionen ermitteln können.
Was ist wenn die Rechnungsnummer nicht immer gleich lang ist? Gibt's da keine intelligente Lösung, wie bis zum nächsten Leerzeichen?
Hallo Spadress
ja, das kann man natürlich auch machen, nach dem ersten Leerzeichen zu suchen ... wie genau man das macht, hängt von der Rechnungsnummer und dem Layout des Dokuments ab, das man auswerten möchte. Wenn die Rechnungsnummer "2024 0014545" ist, kann man nach der zweiten Leerzeichen suchen. Man kann auch nach Zeilenumbrüchen suchen oder nach bestimmten Nummernsystematiken, dafür verwendet man dann "REGEX" Funktionen. So kann man z.B. nach Telefonnummern, die einem bestimmten Format entsprechen, suchen.
Viel Erfolg!
Grüsse
SwiPowE aka Bernd
Bei mir spuckt in Step 5 Power Automate immer den Fehler aus: "Die DLL "pdfium": Die angegebene Prozedur wurde nicht gefunden. (Ausnahme von HRESULT: 0x8007007F) kann nicht geladen werden."
Eine Idee wie man das beheben kann? Im Netz finde ich dazu nichts
Hallo HohesHaus,
mmmh, keine Ahnung wo Dein Fehler liegt. Ich habe mal mein C-Laufwerk nach dem File durchsucht und er hat ihn nicht gefunden. Ich würde mal drauf tippen, dass es sich um einen Installationsfehler handelt. Vllt. PAD deinstallieren und neu installieren? Bestehende Flows, wenn Du keinen Premium / Trial Account hast, ggf. sichern!
@@SwiPowE Danke für deine Antwort. Das Problem hat sich gelöst, nachdem ich den PC neugestartet habe. Anscheinend wird der DLL erst dann im Hintergrund geladen
Warum benutzt du keine Regulären Ausdrücke? Das würde die Suche im Text sehr erleichtern.
Hallo Erhard, vermutlich aus Unwissenheit ;-) .. Danke für den Hinweis. Grüsse SwiPowE
das klappt leider nicht mit den regulären Ausdrücken, weswegen er es wahrscheinlich auch nicht benutzt hat
falls du wissen solltest wie es funktioniert, kannst du es dann gern teilen!
Super, vielen Dank. Ich habe nur noch das Problem, dass der Rechnungsbetrag als TEXT in der EXCEL steht. Ich hätte ihn aber gerne als Zahl. Wie geht das?
Hallo Volker, schön, dass Du es nachvollziehen konntest! Ich habe immer wieder Probleme mit den Datentypen gehabt und meistens bin ich mit "TEXT" besser gefahren. Aber wenn es unbedingt eine Zahl sein muss, dann musst Du die den Wert über eine Text Funktion in eine Zahl umwandeln und im Update Statement die Hochkommas weglassen, also %Variable% statt '%Variable%'. Achte darauf, dass mindestens in der ersten Zeile Deiner Excel Tabelle auch ein Zahlenwert steht, ansonsten gibt es Mecker...bzw. eine Fehlermeldung. Klappt das? Grüsse SwiPowE aka Bernd