Hinweis für die Prompts: Für realistische Bilder solltest du nicht das Wort "realistic" nutzen, besser "photo", "instagram post" usw. Der Grund ist, dass in den Trainingsdaten echte Fotos nicht mit "realistic" getaggt sind, das sind i.d.R. am Computer erstellte oder gemalte Bilder, die realistisch sein sollen. "Realistic" im Prompt führt dann oft dazu, dass das Bild eher nach einem gerenderten Bild aus Blender o.ä. aussieht.
Ja FLUX wurde in Supermachine integriert und kann genutzt werden. Kenne noch keinen anderen KI-Bildgenerator, wo FLUX integriert wurde - Supermachine war da echt schnell...
Hallo, wie immer sehr interessantes Video. Könntest du evtl. mal was bezüglich der richtigen Prompts und Negativprompts bei Supermachine erklären? Damit könnte man sicher noch einiges aus den Bildern rausholen. Ich bekomme es z.B. nicht hin, eine Person komplett auf dem Bild abzubilden. Auch wird oft ein wenig oben vom Kopf weggeschnitten. Gibt es dafür bestimmte Befehle?
Beim Wolf ist sowohl Flux als auch Midjourney mega aber wenn ich wählen müsste würde ich das von Flux nehmen, weil sich bei Midjourney Fehler im Gebiss finden lassen.
Cooler Abspann 😃 Aber das soll den Inhalt Deines Clips natürlich nicht schmälern. Der war auch super und sehr informativ. Ich weiß schon, warum ich Deinen Kanal abonniert hatte. Vielen Dank.🙌
@@RobertLeitinger Danke, ich habs hinbekommem. Nur.....nur leider gibts das program nur mit Kreditkarte. Aber für einmal möchte ich mir keine Karte holen. Sind diese Programme nur für Firmen gedacht?
@@soonix134 Nein AppSumo ist nicht nur für Firmen - jeder kann hier einkaufen. Ist halt eine US Firma - deswegen PayPal und Kreditkarte werden als Zahlungsmittel unterstützt
Der entscheidende Punkt ist das flux die Grundversion ist die von der comunity Weiter trainiert werden wird. Wie bei xl wirds drastisch besser werden plus loras, ip adapter und controllnetzen
Versuch mal was mit einem Bogen (Jäger, Waldläufer). Damit haben die meisten Bilder KIs echte prbleme. Papageien gehen auch nicht immer und Hände oder Bilder zu Turnsport/Bodenturnen usw.
Ja Finger sind immer noch teilweise ein Problem, funktioniert mit FLUX aber generell deutlich besser als in SD und SDXL. Aber teilweise gibts da immer noch ein Problem.
Kann schon sein, dass sie ihren Firmensitz verlegt haben. Bei der Privacy Policy findest du noch: Should you have any questions about our privacy practices or this Privacy Notice, please email us at support@blackforestlabs.ai or contact us at Sedanstraße 7, 79098 Freiburg im Breisgau. Aber ist derzeit für viele Firmen sowieso populär DE zu verlassen 🚦
@@RobertLeitinger der letzte Satz ist Unsinn (Unternehmen kommen und gehen, aktuell Vollzeit Beschäftigung und es gibt keine Tendenz, dass sich das sich das kurz oder mittelfristig ändern wird + quasi kaum arbeitslose was gegen deine Aussage spricht..). Beim rest. Danke für die info :)
Ich konnte Flux1 im Gegensatz zu Fooocus nicht dazu bewegen, einen Jungen darzustellen, der ein Modellflugzeug hält, das ihm im Bild nicht das Gesicht verdeckt. Auch Anforderungen wie "hohe Tiefenschärfe, keine unscharfen Bildbereiche" wurden ignoriert. Die Bilder wirkten insgesamt trotz einer grafisch wirkenden Unnatürlichkeit sehr überschärft. Bei anderen Bildthemen wurden sogar chromatische Aberrationen dargestellt.
Hier ein schneller Versuch (3 Bilder): riku-assets.com/generations/113b9ec9-8a21-4736-ad99-6bb7ee0964cd.png riku-assets.com/generations/d38507b2-fc59-47d4-9831-ba3c1679a1f4.png riku-assets.com/generations/e61f48a6-04b5-4b81-b89e-3cc0538d13c5.png CAs wären mir bei FLUX noch nicht bewusst aufgefallen - bei DALL-E ist das immer extrem.
Schon sehr viel besser als meine Ergebnisse. Wie war der englische Prompt dazu? Hohe Tiefenschärfe ist beim dritten Bild auch nicht gegeben. Auch scheitert auch FLUX an technischen Details wie der Anzahl von Motoren und Propellerblättern. Auch Fliegen haben oft nur einen Flügel.
@@HaraldBendschneider Also wenn man sich ein ganz konkretes Ergebnis vorstellt und das genau so umsetzen möchte (was immer noch schwierig ist bei allen Bilder-KIs) dann muss man es so angehen, dass man mehrere Bilder produziert und teilweise immer den Prompt ein wenig anpasst und dann das beste Ergebnis wählt. Ich hab hier nur einen simplen Prompt eingegeben ohne groß nachzudenken: german boy holding a model aircraft, full body, high depth of field
@ceasy: Lade dir mal Pinokio runter, gibt es für alle Plattformen , 1 Klick und fertig. Es wird alles lokal installiert, alles selbst mit 6GB VRAM noch machbar, nur langsamer. Als Beispiel, 12GB VRAM, 24GB RAM limitiert von 64GB, 40 Sekunden für ein Bild in 1920x1080 , Flux schnell mit 4 Steps. Das ganze dann 2 fach skaliert und du hast das perfekte 4K Bild.
Weil Leonardo keine "eigene KI" ist sondern ein KI-Bildgenerator mit vielen Custom Models die größtenteils auf Stable Diffusion bzw. SDXL basieren. Leonardo ist also ähnlich wie Supermachine - kann sein, dass auch FLUX bald in Leonardo integriert wird (und kann auch sein, dass sie es dann aber nicht als FLUX betiteln sondern unter einen anderen Namen als Custom Model innerhalb von Leonardo veröffentlichen).
Schau hier habe ich bei den Leonardo Help-Docs weitere Infos gefunden: docs.leonardo.ai/docs/elements-and-model-compatibility Es wird als Grundtechnologie immer SDXL und Stable Diffusion genutzt.
Das mit dem Text (generieren) kann ich leider nicht bestätigen. Auch Flux scheitert daran. "Theater Bayern Krimi Dinner" können die einfach nicht schreiben ;-)
Das funktioniert schon - siehe hier z.B. mein Ergebnis: riku-assets.com/generations/01207ed7-c5c8-4c0b-bde9-4e972e812bf5.png - aber klar - du bist hier über der magischen "3-Wörter-Grenze" - 1 bis 2 Wörter gehen meistens gut, 3 funktionieren auch noch oft und mehr als 3 braucht man oft mehrere Anläufe. Hab bei dem Beispiel jetzt auch 10 Bilder generiert und nur 2 Mal war der Text korrekt. Prompt: man holding a sign with the words "Theater Bayern Krimi Dinner"
@@RobertLeitinger Ja, Du hältst Dich auch sehr einfach. Schrift auf weißem Schild. ;-) Ich teste weiter. Ps. Was hast Du denn für einen Prompt für die Schrift genutzt.
Hmm ich hab das Bild mittlerweile wieder gelöscht, aber der Prompt war komplett simple - sowas wie "Man holding a big sign with the words "Theater Bayern Krimi Dinner"
Mein Fazit Midjourney 1 Platz und 2 Flux. Dale ist mehr für Fantasie Kunst Comic.. Flux probiere ich allein weil es aus Deut kommt und deutsch unterstützt bzw als Sprache hat.
Falsche Aussage zu Flux.Du sagst, dass die drei Flux-Varianten alle im wesentlichen gleich sind. Diese Aussage ist falsch. Flux schnell generiert die schlechtesten Bilder während Flux Pro absolute Profibilder generiert. Flux dev liegt dazwischen. Womit hast Du denn getestet? Hoffentlich nicht mit Flux Schnell. Das wäre ja wohl der Hammer
Meine Aussage ist angelehnt an die Informationen der offiziellen Webseite. Ich zitiere kurz: "...FLUX.1 [dev] is an open-weight, guidance-distilled model for non-commercial applications. Directly distilled from FLUX.1 [pro], FLUX.1 [dev] obtains similar quality and prompt adherence capabilities, while being more efficient than a standard model of the same size. ..." Der interessante Part: obtains similar quality ... Klar gibt es Qualitätsunterschiede, die Spreizung ist aber nicht so groß. Kann jetzt jeder selber beurteilen, ob das von mir direkt eine "falsche Aussage" war...
Zum SUPERMACHINE 🏷 Lifetime-Deal: appsumo.8odi.net/supermachine-deal *
Hinweis für die Prompts: Für realistische Bilder solltest du nicht das Wort "realistic" nutzen, besser "photo", "instagram post" usw. Der Grund ist, dass in den Trainingsdaten echte Fotos nicht mit "realistic" getaggt sind, das sind i.d.R. am Computer erstellte oder gemalte Bilder, die realistisch sein sollen. "Realistic" im Prompt führt dann oft dazu, dass das Bild eher nach einem gerenderten Bild aus Blender o.ä. aussieht.
Als "alter Hase" in StableDiffusion kann ich nur sagen super Tipp! Habe damals ewig gebraucht um das zu realisieren.
Habe die schon ausgiebig in Supermaschine getestet. Selbst wenn du die Textfunktion nicht nutzt macht diese Ki eine super Figur.
Stinkt aber gegen midjourney ab…
@@goexplore1234 Schon aber Flux ist Version 1 Midjourney schon Version 6
Welches Programm würdest du denn empfehlen bei einer Bearbeitung von eigenen Fotos, die verändert, aufgepeppt werden sollen???
Luminar Neo: robert-leitinger.com/luminar-neo/
Guter Vergleich. Flux ist sehr gut.midjourney fand ich einen Tick ästhetischer und realistischer.
danke - sehr gute Übersicht - auch als Grundlage zur Produktanschaffung !!!
Vielen Dank :)))🎉
Interessant!
Verstehe ich richtig: Wer Supermachine hat kann Flux ohne Kosten dort nutzen?
Ja FLUX wurde in Supermachine integriert und kann genutzt werden. Kenne noch keinen anderen KI-Bildgenerator, wo FLUX integriert wurde - Supermachine war da echt schnell...
@@RobertLeitinger Cool!
Das Outro ist ja mal mega lol :)
HaHa - danke 😉
Hallo, wie immer sehr interessantes Video. Könntest du evtl. mal was bezüglich der richtigen Prompts und Negativprompts bei Supermachine erklären? Damit könnte man sicher noch einiges aus den Bildern rausholen. Ich bekomme es z.B. nicht hin, eine Person komplett auf dem Bild abzubilden. Auch wird oft ein wenig oben vom Kopf weggeschnitten. Gibt es dafür bestimmte Befehle?
Beim Wolf ist sowohl Flux als auch Midjourney mega aber wenn ich wählen müsste würde ich das von Flux nehmen, weil sich bei Midjourney Fehler im Gebiss finden lassen.
Genialer Abspann, wie hast du den Generiert?
Mit diesem Tool: robert-leitinger.com/suno-ai/
Cooler Abspann 😃 Aber das soll den Inhalt Deines Clips natürlich nicht schmälern. Der war auch super und sehr informativ. Ich weiß schon, warum ich Deinen Kanal abonniert hatte. Vielen Dank.🙌
🙏 Vielen dank, Frank!
Tolles Video! Sind die generierten Bilder privat, wenn man ein Abo abschließt?
Ja die Bilder sind privat. Du brauchst auch kein Abo, sondern es gibt auf AppSumo einen Lifetime-Deal: appsumo.8odi.net/supermachine-deal *
@@RobertLeitinger Super! Danke Dir.
Seltsam, ich wollte den supermachine - deal klicken, aber der Link verschwand hinter den schon vorhandenen Links. Was ist das kaputt?
Ich hab leider echt keine Ahnung was du damit meinst - der Link funktioniert eigentlich ganz normal: appsumo.8odi.net/supermachine-deal *
@@RobertLeitinger Danke, ich habs hinbekommem. Nur.....nur leider gibts das program nur mit Kreditkarte. Aber für einmal möchte ich mir keine Karte holen. Sind diese Programme nur für Firmen gedacht?
@@soonix134 Nein AppSumo ist nicht nur für Firmen - jeder kann hier einkaufen. Ist halt eine US Firma - deswegen PayPal und Kreditkarte werden als Zahlungsmittel unterstützt
Der entscheidende Punkt ist das flux die Grundversion ist die von der comunity Weiter trainiert werden wird. Wie bei xl wirds drastisch besser werden plus loras, ip adapter und controllnetzen
Versuch mal was mit einem Bogen (Jäger, Waldläufer). Damit haben die meisten Bilder KIs echte prbleme. Papageien gehen auch nicht immer und Hände oder Bilder zu Turnsport/Bodenturnen usw.
wo finde ich nochmal den Link zu Flux, gleich der erste zu Supermachine?
Ja FLUX kannst du innerhalb von Supermachine nutzen - oder eben Open Source. Hier findest du weitere Infos: robert-leitinger.com/flux-bilder-ki/
@@RobertLeitinger Danke
Immerhin war SDXL das einzige Programm, das das Stichwort "Wonderland" umgesetzt hat.
Ja stimmt - da hast du recht!
bei 10:06 beim Festival-Bild von Flux sind die Arme zu lang, sonst sehr die Finger, Gesichter, Realismus schon sehr gut
6-7 Finger, das passt schon. einfach auf die andere Hand schauen. Halt stop, da ist ja auch einer zu viel.
Flux hat aber auch mit der Fingeranzahl Probleme ab und zu. Siehe Bild 3 links und rechts beim Banner die Hände. LG Maiki
Ja Finger sind immer noch teilweise ein Problem, funktioniert mit FLUX aber generell deutlich besser als in SD und SDXL. Aber teilweise gibts da immer noch ein Problem.
Wie kommst du darauf, dass es eine deutsche KI-Firma ist? Ich sehe überall nur Delaware, USA.
Kann schon sein, dass sie ihren Firmensitz verlegt haben. Bei der Privacy Policy findest du noch: Should you have any questions about our privacy practices or this Privacy Notice, please email us at support@blackforestlabs.ai or contact us at Sedanstraße 7, 79098 Freiburg im Breisgau.
Aber ist derzeit für viele Firmen sowieso populär DE zu verlassen 🚦
@@RobertLeitinger der letzte Satz ist Unsinn (Unternehmen kommen und gehen, aktuell Vollzeit Beschäftigung und es gibt keine Tendenz, dass sich das sich das kurz oder mittelfristig ändern wird + quasi kaum arbeitslose was gegen deine Aussage spricht..). Beim rest. Danke für die info :)
Ich konnte Flux1 im Gegensatz zu Fooocus nicht dazu bewegen, einen Jungen darzustellen, der ein Modellflugzeug hält, das ihm im Bild nicht das Gesicht verdeckt. Auch Anforderungen wie "hohe Tiefenschärfe, keine unscharfen Bildbereiche" wurden ignoriert. Die Bilder wirkten insgesamt trotz einer grafisch wirkenden Unnatürlichkeit sehr überschärft. Bei anderen Bildthemen wurden sogar chromatische Aberrationen dargestellt.
Hier ein schneller Versuch (3 Bilder): riku-assets.com/generations/113b9ec9-8a21-4736-ad99-6bb7ee0964cd.png
riku-assets.com/generations/d38507b2-fc59-47d4-9831-ba3c1679a1f4.png
riku-assets.com/generations/e61f48a6-04b5-4b81-b89e-3cc0538d13c5.png
CAs wären mir bei FLUX noch nicht bewusst aufgefallen - bei DALL-E ist das immer extrem.
Schon sehr viel besser als meine Ergebnisse. Wie war der englische Prompt dazu? Hohe Tiefenschärfe ist beim dritten Bild auch nicht gegeben. Auch scheitert auch FLUX an technischen Details wie der Anzahl von Motoren und Propellerblättern. Auch Fliegen haben oft nur einen Flügel.
@@HaraldBendschneider Also wenn man sich ein ganz konkretes Ergebnis vorstellt und das genau so umsetzen möchte (was immer noch schwierig ist bei allen Bilder-KIs) dann muss man es so angehen, dass man mehrere Bilder produziert und teilweise immer den Prompt ein wenig anpasst und dann das beste Ergebnis wählt. Ich hab hier nur einen simplen Prompt eingegeben ohne groß nachzudenken: german boy holding a model aircraft, full body, high depth of field
Also das Landschaftsbild von Flux ist doch bei weitem nicht realistisch. Aber trotzdem danke für den Vergleich
Für mich leider ungeeignet, ich habe Künstler angegeben die verwendet werden soll bei der Erstellung der Bilder, werden leider nicht berücksichtigt.
Sorry, bei Flux: "verschiedene Dateien runterladen und installieren und leistungsfähiger PC, technische Kenntnisse" war ich raus. Schade
Du kannst es auch einfach in Supermachine nutzen - da musst du gar nichts installieren :-)
@ceasy: Lade dir mal Pinokio runter, gibt es für alle Plattformen , 1 Klick und fertig. Es wird alles lokal installiert, alles selbst mit 6GB VRAM noch machbar, nur langsamer. Als Beispiel, 12GB VRAM, 24GB RAM limitiert von 64GB, 40 Sekunden für ein Bild in 1920x1080 , Flux schnell mit 4 Steps. Das ganze dann 2 fach skaliert und du hast das perfekte 4K Bild.
Gerade ausprobiert, und bekomme nur ein Error.
Was genau hast du ausprobiert und wo kommt ein Error?
Warum war Leonardo kein Kandidat für die Vergleichsrunde?
Weil Leonardo keine "eigene KI" ist sondern ein KI-Bildgenerator mit vielen Custom Models die größtenteils auf Stable Diffusion bzw. SDXL basieren. Leonardo ist also ähnlich wie Supermachine - kann sein, dass auch FLUX bald in Leonardo integriert wird (und kann auch sein, dass sie es dann aber nicht als FLUX betiteln sondern unter einen anderen Namen als Custom Model innerhalb von Leonardo veröffentlichen).
@@RobertLeitinger Ah, dankeschön! 🙂
Danke für die super Erklärung @@RobertLeitinger
Schau hier habe ich bei den Leonardo Help-Docs weitere Infos gefunden: docs.leonardo.ai/docs/elements-and-model-compatibility Es wird als Grundtechnologie immer SDXL und Stable Diffusion genutzt.
@@RobertLeitinger Das heißt dann also, ich würde mit Leonardo im Prinzip dieselbe Qualität erreichen, wie in deinem Test mit SDXL, richtig?
Schon KlingAI getestet?
ja hab ich vor ca. einer Woche getestet - ist ziemlich gut für Videos!
Das mit dem Text (generieren) kann ich leider nicht bestätigen. Auch Flux scheitert daran. "Theater Bayern Krimi Dinner" können die einfach nicht schreiben ;-)
Das funktioniert schon - siehe hier z.B. mein Ergebnis: riku-assets.com/generations/01207ed7-c5c8-4c0b-bde9-4e972e812bf5.png - aber klar - du bist hier über der magischen "3-Wörter-Grenze" - 1 bis 2 Wörter gehen meistens gut, 3 funktionieren auch noch oft und mehr als 3 braucht man oft mehrere Anläufe. Hab bei dem Beispiel jetzt auch 10 Bilder generiert und nur 2 Mal war der Text korrekt. Prompt: man holding a sign with the words "Theater Bayern Krimi Dinner"
@@RobertLeitinger Ja, Du hältst Dich auch sehr einfach. Schrift auf weißem Schild. ;-) Ich teste weiter. Ps. Was hast Du denn für einen Prompt für die Schrift genutzt.
Hmm ich hab das Bild mittlerweile wieder gelöscht, aber der Prompt war komplett simple - sowas wie "Man holding a big sign with the words "Theater Bayern Krimi Dinner"
Midjourney ist unschlagbar im Moment…
Mein Fazit Midjourney 1 Platz und 2 Flux. Dale ist mehr für Fantasie Kunst Comic.. Flux probiere ich allein weil es aus Deut kommt und deutsch unterstützt bzw als Sprache hat.
Falsche Aussage zu Flux.Du sagst, dass die drei Flux-Varianten alle im wesentlichen gleich sind. Diese Aussage ist falsch. Flux schnell generiert die schlechtesten Bilder während Flux Pro absolute Profibilder generiert. Flux dev liegt dazwischen. Womit hast Du denn getestet? Hoffentlich nicht mit Flux Schnell. Das wäre ja wohl der Hammer
Meine Aussage ist angelehnt an die Informationen der offiziellen Webseite. Ich zitiere kurz: "...FLUX.1 [dev] is an open-weight, guidance-distilled model for non-commercial applications. Directly distilled from FLUX.1 [pro], FLUX.1 [dev] obtains similar quality and prompt adherence capabilities, while being more efficient than a standard model of the same size. ..." Der interessante Part: obtains similar quality ...
Klar gibt es Qualitätsunterschiede, die Spreizung ist aber nicht so groß. Kann jetzt jeder selber beurteilen, ob das von mir direkt eine "falsche Aussage" war...