Das Stable Diffusion für AUDIO ist da: AUDIO-LDM 2

Поділитися
Вставка
  • Опубліковано 22 гру 2024

КОМЕНТАРІ • 37

  • @ClippyPodcast
    @ClippyPodcast Рік тому +6

    Sehr cooles Video! Auf diese KI habe ich schon lange gewartet❤

  • @aantonio
    @aantonio Рік тому +3

    danke für die regelmäßigen videos und die schnellen updates zum thema KI 💪🏼

  • @lukasxlama
    @lukasxlama Рік тому +9

    Sehr spannend, aber ich werde wohl noch etwas warten, bis sich Audio-LDM weiterentwickelt hat. :)

  • @manuffls1756
    @manuffls1756 Рік тому +2

    Danke, dass du uns darauf aufmerksam machst. Ich denke, ich werde irgendwie versuchen, dass auf Urlaub zum Laufen zu bringen. Das Musik Modell von Facebook ist auch ziemlich gut, allerdings sehr beschränkt auf bestimmte genres.

    • @manuffls1756
      @manuffls1756 Рік тому +1

      Wo wir gerade bei KI sind, die Spracherkennung hat Colab zu Urlaub gemacht 🙃

  • @ZaindTV
    @ZaindTV Рік тому +9

    Junge ich arbeite gerade selber an sowas Ähnlichem und dann kommt sowas 😅🥲

    • @seriosersimon3347
      @seriosersimon3347 Рік тому +4

      Einfach keine Chance, das ist echt hart in dem Bereich

    • @TheMorpheusTutorials
      @TheMorpheusTutorials  Рік тому +2

      Momentan echt brutal, ja 🙈

    • @seriosersimon3347
      @seriosersimon3347 Рік тому

      @@TheMorpheusTutorials
      Ich habe mich vor einigen Jahren in den Bereich orientiert, weil mir klar war, dass das viel Potential hat, aber irgendwie habe ich unterschätzt mit was für einer erbarmungslosen Geschwindigkeit sich das Feld entwickeln würde und wie wenig Chancen man da selbst mit neuen Ansätzen hat, wenn man nicht gerade in einer großen Firma an der Spitze forscht.
      Naja, zumindest verdient man auch so ganz gut und der AI Act wird die Löhne sicher nicht verschlechtern

    • @EinfachAlex-p2t
      @EinfachAlex-p2t Рік тому +1

      So geht's mir ständig 😂

  • @zwixx259
    @zwixx259 Рік тому +2

    Leider funktioniert ROCm noch nicht mit PyTorch unter Windows, schade.

  • @handmade_videos
    @handmade_videos 11 місяців тому

    Hey, geile Sache! Würdest du ein Followupvideo machen, sobald Text-to-speech da ist und mehr Benutzerkomfort? Danke und viele Grüße

  • @manuffls1756
    @manuffls1756 Рік тому +1

    Ich habe es jetzt einfach durch die auf der Seite angegebenen Kommandozeilenbefehle auf Colab zum Laufen gebracht. Es verbraucht jeweils 12gb ram und vram. Dennoch bekomme ich selbst mit dem kleineren Modell nur dann ein Ergebnis, wenn ich eine A100 verwende. Eine V100 mit 25gb ram 16gb vram reicht nicht. Das ist ziemlich seltsam.

  • @tinkerpaper
    @tinkerpaper Рік тому +5

    Gefühlt jeden Tag kommt eine neu Ki! :)

  • @lektionenausallenbereichen7919
    @lektionenausallenbereichen7919 7 місяців тому

    Darf man das kommerziell nutzen?

  • @anekyhongura9455
    @anekyhongura9455 Рік тому +1

    Da freuen sich bestimmt die ganzen Game Devs die am Sound arbeiten ^^

  • @tifor8847
    @tifor8847 Рік тому

    Ich stelle mir die Technik als AI-Drummachine wild vor.
    Mit Auswahl zwischen Loop/Oneshot, Bpm, Frequenzbereich, Stereofeld etc.

  • @EinfachJens-16
    @EinfachJens-16 Рік тому

    Funktioniert das am mac m Prozessor?

  • @robowalker5327
    @robowalker5327 Рік тому

    Also brauchen ich GPU? Oder diese nix kellega??? 😅✌️

  • @thomas.thomas
    @thomas.thomas Рік тому

    Zum letzen Punkt, zwar werden Künstler nicht direkt ersetzt aber nun werden tausende Stunden gespart die ansonsten einer für Skizzen oder Concept art bezahlt bekommen hätte, und schon jetzt sind viele Modelle gut genug um Stock Fotos zu ersetzen

  • @242Gorch
    @242Gorch Рік тому

    Danke was für ein PC ist da am besten?

  • @fortunato1957
    @fortunato1957 Рік тому +2

    Ich leg mich mal 3 Jahre schlafen. Nach dem Aufwachen falle ich wahrscheinlich gleich tot um vor Schreck, was dann alles geht ...

    • @TheMorpheusTutorials
      @TheMorpheusTutorials  Рік тому

      Du wachst in einer völlig neuen Welt auf

    • @thomas.thomas
      @thomas.thomas Рік тому

      @@TheMorpheusTutorials doch der Mensch ist noch wie vor tausenden von Jahren der selbe

  • @JohnDoe-es5xh
    @JohnDoe-es5xh Рік тому

    Mütze Glatze! Darauf habe ich 30 Jahre gewartet.

    • @maxron6514
      @maxron6514 Рік тому

      Für Mütze Glatze gibt es bessere Lösungen

  • @varicand
    @varicand Рік тому +1

    Bei diesen Abhängigkeiten wäre docker doch toll.

  • @ratside9485
    @ratside9485 Рік тому +2

    Bark AI ist ähnlich, zumindest Text to Speech. . Kann zumindest auch Deutsch.

  • @jfpv1337
    @jfpv1337 Рік тому

    Ich würde die Git Projekte mit git clone über die Konsole laden und nicht manuell die zip laden update etc sind sonst nicht so ez

  • @axelberger7895
    @axelberger7895 Рік тому

    Interessantes Video. Danke. Aber warum bist du so hippelig? Total aufgeregt und wirr. Was ist los? Chillen wohl mal dringend nötig 😮

    • @TheMorpheusTutorials
      @TheMorpheusTutorials  Рік тому +1

      Kann nicht chillen 🥺 das Video hat den ganzen Tag gebraucht und war erst 14:45 fertig.. Veröffentlichung um 15 Uhr, das war knapp

  • @obinator9065
    @obinator9065 Рік тому

    lü lü lü