¡CLONA TU VOZ GRATIS con este NUEVO MODELO OPEN SOURCE! | F5-TTS

Поділитися
Вставка
  • Опубліковано 30 жов 2024

КОМЕНТАРІ • 197

  • @javierfernandez7472
    @javierfernandez7472 День тому +66

    11:15 Suenas a scammer indú

    • @ricko13
      @ricko13 День тому +8

      eso mismo pensé

  • @pacobarbas2475
    @pacobarbas2475 День тому +21

    Lo estuve probando la semana pasada, pero mientras siga sin soporte para español seguiré usando XTTS2. Y la calidad de audio tampoco me pareció tan espectacular después de haber oído lo que pueden hacer modelos como GPT-SoVITS V2.

  • @SinergiaAlUnisono
    @SinergiaAlUnisono День тому +18

    Gracias Carlos, esperaré a que salga en español. Ojalá publiques un video nuevo cuando eso suceda. Abrazo

    • @rodrigov.9252
      @rodrigov.9252 День тому

      no lo va a hacer. ya lo dijo en un twiter

  • @javiergacitua8634
    @javiergacitua8634 День тому +37

    Este hombre como puede estar en la GitHub Universe con Midudev y grabar un video chulísimo al mismo tiempo, un Crack!!

    • @luisfernanadoperezalvarado
      @luisfernanadoperezalvarado День тому +2

      lo mismo me lo pregunté

    • @XaviIntheHouse
      @XaviIntheHouse День тому +13

      ​@@luisfernanadoperezalvarado👀
      Usa IA, se ha clonado y ahora hay varios Carlos Santanas dando charlas del uso de IA

    • @SrFrederick
      @SrFrederick День тому +4

      @@XaviIntheHouse Eso mismo pensé, mueve las manos con un patrón repetitivo, está usando un avatar? xD

    • @okamiBoom
      @okamiBoom День тому

      quien es midudev?

    • @ClickPlanet...
      @ClickPlanet... 17 годин тому

      Porque lo grabó antes...

  • @inteligentia_
    @inteligentia_ 10 годин тому

    Gran vídeo. Esto avanza muy rápido, es apasionante!

  • @Kakauet
    @Kakauet День тому +4

    Siempre que publicas un nuevo vídeo me sacas una sonrisa ❤❤

  • @zorrolisto1
    @zorrolisto1 21 годину тому +1

    Muchas Gracias por poner una tarea! me parece muy interesante ponerla en mi TODO list!

  • @foreropa
    @foreropa 23 години тому +1

    Gracias, gracias, gracias por Pinokio!!!! Para mi siempre ha sido difícil entender cómo instalar programas de IA, no siempre me funcionan, algunos como Sable diffusion para AMD han sido difíciles, pero lo he conseguido, pero otros? Imposible, algo siempre falla. Con este programa, todo se vuelve fácil!!

  • @alexisdawn6255
    @alexisdawn6255 День тому

    Está muy bueno para ser un prototipo base, se escucha que el tono es mas agudo en cada Output, supongo que es por como está construido el modelo, pero aún asi conserva el estilo del hablante, muy bueno.

  • @mdchaparror10
    @mdchaparror10 Годину тому

    Muchas gracias, excelente vídeo como siempre

  • @arquitectog
    @arquitectog День тому +1

    MUCHAS GRACIAS, esta buenisimo el ejemplo, saludos desde Guatemala.

  • @felixbel5
    @felixbel5 День тому

    Como siempre excelente contenido y explicacion, super fluido y entretenido y claro lo mas importante. Saludos!

  • @Davilocoo
    @Davilocoo День тому +4

    Que piensas sobre los doblajes? Parece simple con estas herramientas traducir a cualquier idioma. Meta tambien parece estar trabajando en algo de esto, dijeron que doblarian todos los videos de instagram a todos los idiomas.

    • @drillerdev4624
      @drillerdev4624 День тому +1

      Es algo que va a llegar antes o después (creo que ya hay alguna cosa por ahí, vaya)
      La cuestión es cómo manejarán los cambios de cadencia y ritmo entre distintos idiomas

    • @alexiscaceresmontes5271
      @alexiscaceresmontes5271 День тому +4

      Ayer justo lei un post, donde varios actores de dobaljes, locutores y demás que son freenlancer, decían que le había bajado las ofertas de trabajo por la IA un 80% y que muchos ya no son ofrecen sus servicios, y se dedican a otros proyectos mas estables.
      Pero hay que dejar claro, que el que sepa manejar las IA, fácilmente va poder crear un ministudio. Y con lo potente que se están volviendo las pc y el trabajo de la comunidad open source, va ser una locura en unos años.

  • @Marleos
    @Marleos День тому

    ¡Al fin! he estado esperando esto desde hace mucho :y

  • @ElInventor
    @ElInventor День тому +3

    Yo estoy esperando un modelo opensource que nos permita hacer esto mismo pero no con texto sino con voz. En plan yo digo algo con mi voz y suena con la tuya.

    • @bobobo1673
      @bobobo1673 День тому +4

      Da mal rollo tanto lo que quieres como tú foto

    • @MusicaImpactante
      @MusicaImpactante 22 години тому

      Eso ya existe hace rato. ¿Cómo crees que hacen los covers de canciones con voces de artistas famosos? Investigá por ese lado, cómo hacer covers con IA y voces de famosos. Es de código y abierto, los odelos están principalmente en GitHub.

    • @jordirivero
      @jordirivero 16 годин тому

      Esto que pides es muy facil de hacer, hay que pasar de voz a texto y de texto a voz... el unico problema por ahora es el delay de pasar de texto a voz porque no se podria hacer algo con sensacion de realtime como seguro que te gustaría

  • @angelbarraza3224
    @angelbarraza3224 День тому +3

    Jeje 15 segundos con ka GPU de la NASA que tiene Carlos, lo probe con una RX 6600 y demora 40mins con un audio nuevo, y al rededor de 10 minutos con el audio precargado, aún así, los resultados son espectaculares, mi novia es abogada y le hice una pequela broma, le pedi que me mandara un audio leyendo un parrafo en ingles que le mande, para evaluar su progreso en dualingo, luego clone su voz e hice una cesión de derechos verbal de sus bienes a mi persona jajaja

    • @DotCSVLab
      @DotCSVLab  День тому +2

      En mi caso está ejecutado en un Mac con un M2, no es un mal procesador pero no debería de generar tantas diferencias, así que revisa si tienes algo mal configurado

    • @angelbarraza3224
      @angelbarraza3224 День тому +1

      @DotCSVLab wow, no esperaba respuesta, te sigo desde hace años, revisaré la configuración, gracias!, saludos desde Sinaloa.

    • @torretacosmica
      @torretacosmica 22 години тому +2

      @@angelbarraza3224 en una 3090 sencillita tarda solo 20 segundos... Quiza solo acepta CUDA y como tienes AMD te esta procesando con CPU?

    • @APMI-OFICIAL
      @APMI-OFICIAL 10 годин тому

      las IAs no funcionan bien con graficas AMD, todas se hacen especificamente para su uso en graficas de Nvidia, si quieres usar IAs en local tenes que comprar una grafica de Nvidia

    • @torretacosmica
      @torretacosmica 10 годин тому

      @ tampoco es taaan asi, no desinformes. Hay muchos modelos que si corren en amd, pero es cierto el rendimiento y compatibilidad todavía esta muy lejos. Pero no es siempre asi como decis. Stable diffusions por ejemplo corre en ATI a aproximadamente un 0.7 de rendimiento

  • @MsJonny26
    @MsJonny26 День тому +1

    Ufff, clonación de muy buena calidad.
    Se puede guardar en archivos de audio la voz clonada leyendo el texto?

  • @oscarjavier9744
    @oscarjavier9744 День тому

    Está super interesante la tecnología, con sus riesgos, pero interesante.

  • @cu_cu_xiijdd4489
    @cu_cu_xiijdd4489 День тому

    Me viene. Al pelo para mí trabajo

  • @carabelaableful6321
    @carabelaableful6321 День тому

    Muchas gracias por todo. Maestro!

  • @vendeconalma
    @vendeconalma 15 годин тому +1

    Me ha dado error de instalación pinokio y me faltan 3 paquetes de 8 he repetido dos veces la instalación Gracias Carlos.

  • @content1
    @content1 19 годин тому

    muy interesante la herramienta, gracias! hay algun modelo de audio para Stable Diffusion?

  • @dimitridavit7236
    @dimitridavit7236 День тому +4

    Me leíste la mente. Estaba ayer buscando algo así y estaba a punto de instalar Coqui tts pero ahora voy a probar este.
    PD: oh no está en español. Pues toca esperar 😢

    • @santiagomatellan5313
      @santiagomatellan5313 День тому

      😂

    • @rincondepython
      @rincondepython День тому +2

      buenas! Aca un argentino, estuve jugando con Coqui TTS, y salvo que seas español, no clona bien la voz para este idioma. Estuve probando puntualmente XTTS, que es lo mas "sencillo" de entender a la hora de leer e implementar la documentacion que tienen.

    • @dimitridavit7236
      @dimitridavit7236 День тому +1

      @@rincondepython en realidad estaba buscando algo que mejore la voz en locuciones para que suene más profesional y con mejor modulación. Igual creo que no me servía jaja

  • @adrieljonasroitman3783
    @adrieljonasroitman3783 День тому +1

    Hola Carlos y a toda la comunidad. Alguno ha podido correr esto en un Google Colab?

  • @Vay0
    @Vay0 День тому

    buenisimoooooo, pero de que tarjeta de video mínimo estamos hablando????

  • @jaypee6644
    @jaypee6644 День тому +1

    Hay alguna IA que traduzca un audio de un idioma a otro, algo tipo voice2voice? Manteniendo ya sabes la entonación pausas etc...

  • @roberthazidio
    @roberthazidio 11 годин тому

    Pero me quede con la duda de que requisitos de hardware necesita para ser instalado?
    A parte de cuanto texto soporta en una clonacion continua?

  • @lucife1130
    @lucife1130 День тому +1

    Si tienes pinokio e instalar modelos ia cuales son los requisitos recomendables para estos modelos? ram, tarjeta video etc. soy nuevo en esto

    • @Zirulnikoff
      @Zirulnikoff 23 години тому +1

      Pregúntale al gpt mi rey

  • @ElPolemista
    @ElPolemista День тому +1

    9:40 hazlo con critical drinker

  • @RelatosdeRiqueza
    @RelatosdeRiqueza День тому

    No puedo creer que algo tan 'embarazosamente fácil' sea gratuito. ¿Alguno ya lo probó?

  • @neoghini
    @neoghini День тому

    Lo he probado con Pinokio y me muestra el siguiente error:
    ENOENT: no such file or directory, stat 'C:\IA\pinokio\api\E2-F5-TTS\{{input.event[0]}}'

  • @davidvalencia6256
    @davidvalencia6256 День тому

    Crees que dentro de poco haya algo como el asistente de voz de openAI, pero opensource?

  • @lucife1130
    @lucife1130 День тому

    Al instalar e2-f5-tts en pinokio en local ¿con una tarjeta de 4gb gtx 1650 y 8 de ram es suficiente o que se necesita? porque al ejecutar e2-f5-tts en pinokio no me deja y se que se instalo bien pero me sale un link de nvidia y no el programa.

  • @ManuelMariscalMariscal
    @ManuelMariscalMariscal 16 годин тому

    Buenas! he visto que no funciona hacer ningun test en huggingface, te suena por que?

  • @albertovlc933
    @albertovlc933 День тому +1

    Ojala este pronto en ESPAÑOL

  • @Josman-ih3mz
    @Josman-ih3mz День тому

    Mmmmm q nivel de pc necesitaríamos? Para usar pinokio

  • @aedroknowledge9057
    @aedroknowledge9057 23 години тому

    Hay alguno funcional aunque de menor calidad utilizable desde Pinokio pero en español?

  • @KSSenpai
    @KSSenpai День тому

    Chat GPT [Crea un título super creativo para mi modelo AI de texto a voz]

    • @david-w4k1w
      @david-w4k1w 23 години тому

      GPT: [modelo de voz creativa]

  • @sanderpacheco5679
    @sanderpacheco5679 День тому

    sueño con el día que mediante una video llamada se traduzca mi audio en tiempo real y la de la persona con la que hablo para no tener mas barreras en el idioma

    • @dvoraklovelace2801
      @dvoraklovelace2801 День тому +3

      La semana que viene sin falta

    • @danielamado1813
      @danielamado1813 День тому +3

      esto si seria un gamechanger tio, te imaginas hablar con un nativo aleman, y que te entienda el español sin pedo, y que tu le entiendas a el en una llamada por meet por ejemplo

  • @valentinasdasas6182
    @valentinasdasas6182 День тому

    Este modelo el potencialmente peligrosoo, tengan ojito para las futuras clonaciones de voz... si alguien lo hizo y no lo publica, otro lo hará....

    • @david-w4k1w
      @david-w4k1w 23 години тому

      ya hoy x hoy, podemos casi clonar a una persona en video haciendo lo que sea, si parece peligroso la parte de editar voces, vamos mal, el uso esta en la responsablidad de cada uno

  • @Danmaxlara
    @Danmaxlara День тому

    Jejeje genial si es mi voz. En español es como si quisiera hablar en español agringado😂😂😂🎉

  • @orochimaru423
    @orochimaru423 20 годин тому +1

    Lo intenté pero no logro que genere un audio, siempre sale vacio. ¿A alguien más le ha pasado?

  • @Marcos_777
    @Marcos_777 День тому

    Puedes hacer un video cuando haya forma de utilizarlo en Español ??

  • @paisa20
    @paisa20 День тому

    Welcome to The Warning ❤❤❤

  • @orlandocastellanos9263
    @orlandocastellanos9263 День тому

    Cuales son los requerimientos de Hardware? Como se si mi maquina aguanta esta demo

  • @federiedel
    @federiedel День тому +1

    10:27 como crees que hablas ingles. 😎
    11:14 como realmente hablas inglés. 🤣

  • @SeñorSommer
    @SeñorSommer 15 годин тому

    Avísanos cuando esté disponible en español

  • @niwdehu
    @niwdehu 23 години тому

    iguala o mejora a xTTS v2?

  • @Selenaai95
    @Selenaai95 День тому

    Se puede utilizar para canto

  • @Yenyeri
    @Yenyeri День тому

    no me funciono , el audio que me da como resultado no aparece nada :c

  • @Danmaxlara
    @Danmaxlara День тому

    Cuanto es el imput maximo de texto a leer. ??

  • @dei8bit
    @dei8bit 21 годину тому

    Funcionara bien en español? :o

  • @magat155
    @magat155 День тому

    Maravilloso 🤍✨✨✨

  • @OscarLaura
    @OscarLaura День тому

    Creo que ah{i mismo tenía el entrenamiento para entrenar en español.

  • @josetdm6246
    @josetdm6246 День тому

    Espectacular ⭐️⭐️⭐️⭐️⭐️

  • @LeonardoGalindo-v1b
    @LeonardoGalindo-v1b 10 годин тому

    El modelo en Higgingface ya no funciona, ahora da error!

  • @Ruanerz
    @Ruanerz 20 годин тому

    con un demonio lo que me faltaba.jpg ... todavía no está en español :(

  • @Lv7-L30N
    @Lv7-L30N День тому

    gracias joven

  • @JR-mxcu
    @JR-mxcu День тому

    Es posible mejorar la calidad de audio, suena un poco latoso, imagino porque está muy comprimido

  • @WannaCry.
    @WannaCry. 22 години тому

    Cuando esté en español y más idiomas vuelve mostrarlo por favor

  • @j.kstudios1
    @j.kstudios1 18 годин тому

    Ta chido 😃👍

  • @alitomix
    @alitomix День тому

    ¿Si clonas la voz y entonces con IA la cambias un poco? no sería la misma voz y no sería ilegal

    • @cesarfranco5745
      @cesarfranco5745 День тому +1

      Creo que habria un vacio legal, ya que si usas una voz de otra persona, la otra persona no estaria accediendo al uso de su voz ni como input ni como entrenamiento para un modelo de IA.

    • @david-w4k1w
      @david-w4k1w 23 години тому

      lo que no se puede hacer tambien es en publicacion, clona las voces que quieras como si son de famosos o conocidos, pero no lo subas o pubiques porque eso si es ilegal, la persona de la voz puede denunciar

  • @JuanMartinRuiz
    @JuanMartinRuiz День тому

    embarazosamente

  • @abell46s
    @abell46s День тому

    Gracias señor

  • @johngonzalezvideo
    @johngonzalezvideo День тому

    Que tal las pruebas en español?

  • @JuanjoSanchez
    @JuanjoSanchez День тому +13

    A ver si entre todos logramos que funcione en español

    • @jpgallegoar
      @jpgallegoar День тому +2

      Estoy en ello ;)

    • @rodrigov.9252
      @rodrigov.9252 День тому +2

      @@jpgallegoar yo ya lo hice no es necesario que lo hagas crack

    • @jpgallegoar
      @jpgallegoar День тому

      @@rodrigov.9252 compartelo porfa!

    • @NesbyBone
      @NesbyBone День тому

      @@rodrigov.9252 comparte crack dale

    • @cesarfranco5745
      @cesarfranco5745 День тому

      @@jpgallegoar Que cambios estas haciendo para lograrlo?

  • @gilianskalari
    @gilianskalari День тому

    Spoiler: solo disponible en yanki y en chingchongchung

  • @Aristocles-x4k
    @Aristocles-x4k День тому

    Cual era el nombre del narrador que dijo?

  • @VLAD5842
    @VLAD5842 2 години тому

    Brutaaaaal !!!

  • @laultimaverdad1187
    @laultimaverdad1187 День тому

    Algún día en español

  • @nicolasallweb3077
    @nicolasallweb3077 9 годин тому

    esta bueno

  • @eduardo29742
    @eduardo29742 9 годин тому

    Cuando los extorsionadores buscaban cobre y encontraron no oro sino diamantes

  • @KarelyQueen
    @KarelyQueen День тому

    Hey buenísimo esto

  • @patagonia4kvideodrone91
    @patagonia4kvideodrone91 День тому

    la pregunta del millon, sirve en español?¡ xd

  • @diegocardona8632
    @diegocardona8632 День тому +97

    Ya lo vi, bórralo.

    • @2emmmanuel
      @2emmmanuel День тому +5

      Pensé lo mismo 🗿

    • @Carlospp18
      @Carlospp18 День тому +2

      XD

    • @Zarpion12
      @Zarpion12 День тому

      Bbo vk😊😊j9 0 v p j00 h. 00 bjkpj jb kvhbyo o uvk0b 0vb0c 0k0np9 jvph9bbo 0kv 0b. Hg0bv😊😊​@@2emmmanuel

    • @XaviIntheHouse
      @XaviIntheHouse День тому +4

      noo que no lo he visto aun

    • @XaviIntheHouse
      @XaviIntheHouse День тому +9

      ya ahora si ya lo terminé de ver, que lo borre

  • @alamalonzo
    @alamalonzo День тому

    plzz déjanos saber cuando este en español

  • @felixbel5
    @felixbel5 День тому

    Pinokio es lo mismo que LLM STUDIO?

    • @elmegapeluco
      @elmegapeluco День тому +1

      No, Pinokio es una suite de herramientas de IA, LLM Studio de Google es una herramienta para crear Podcast con IA. Para mayor información pregunta a Chat Gpt xD

    • @cesarfranco5745
      @cesarfranco5745 День тому

      @@elmegapeluco Te columpiaste llm studio es algo similar a pinokio que permite descargar y ejecutar modelos de IA, pero va mas enfocados a llms, lo que tu hablas es notebookllm de google

    • @felixbel5
      @felixbel5 День тому +1

      @elmegapeluco Hola gracias por tu respuesta! Pero si no estoy mal me parece q llm studio no es de google, si lo es Notebook LLM, llm studio se instala en tu pc para poder correr diferentes AI de forma local. Por eso preguntaba la diferencia. Ya que El siempre lo promocionaba por eso qieria ssber la diferencia para El. Muchas gracias! Salidos atte.

  • @sopompo3196
    @sopompo3196 День тому

    o sea que no lo puedo usar para hacer videos de youtube?

  • @ministerofjoy
    @ministerofjoy День тому

    Gracias, aterra!

  • @TROPETIMAN
    @TROPETIMAN 14 годин тому +1

    me da error

    • @benjaminnunez8273
      @benjaminnunez8273 5 годин тому

      Otro por aquí. O somos torpes o el programa muy fino no va.

  • @MegaLino111
    @MegaLino111 День тому +3

    scarlet Johanson está en peligro

    • @Xictus
      @Xictus 15 годин тому

      Fue la primera en quien pensé para clonar xD

  • @MrBlackgobbo
    @MrBlackgobbo День тому

    ¿Una vez que produces el audio, si es tu voz, cómo saben que estas haciendo un uso no comercial?

    • @david-w4k1w
      @david-w4k1w 23 години тому +1

      me quede pescando con la pregunta esta como 5 min. pos no lo saben chico,,,🤣🤣🤣

  • @yosepyo.z9905
    @yosepyo.z9905 День тому +1

    omaigaaa

  • @rodrigov.9252
    @rodrigov.9252 День тому +2

    yo ya cree mi canal con la voz de DOT CSV, AHORA SERÁS MI ESCLAVO :D. es internet todo es libre.

    • @Ericzon
      @Ericzon День тому

      poca broma, es un tema interesante. ¿sabemos a nivel legal qué implicaciones tendría algo así?

    • @rodrigov.9252
      @rodrigov.9252 День тому +1

      @@Ericzon na no me importa, porque en internet todo es libre

  •  День тому

    no funciona dice error

  • @albertovlc933
    @albertovlc933 День тому

    Da error al convertir

  • @diesirae4546
    @diesirae4546 День тому

    Genial

  • @italo9537
    @italo9537 День тому +2

    Poco a poco nos acercamos a la clonacion perfecta de las voces y asi poder hacer contenido en diferentes idiomas

  • @darthporterus
    @darthporterus День тому

    dot suena a tutorial indio en la clonación XD

  • @misaelperez6654
    @misaelperez6654 День тому

    Necesito la version en español

  • @luchessi1000
    @luchessi1000 День тому +1

    No se te ocurrió hacer la prueba con una voz en castellano ?

  • @ramoneces
    @ramoneces День тому

    Sam Almant 😝

  • @juancitox
    @juancitox День тому

    Esaaa

  • @SuperFoxy8888
    @SuperFoxy8888 День тому +18

    Hace un minuto, 20 visitas, cuenta en decadencia 😞

    • @anthonygriman8674
      @anthonygriman8674 День тому +4

      Es un capo, que sea viral es una cosa pero que te de información de vamos es otra

    • @SuperFoxy8888
      @SuperFoxy8888 День тому +8

      ​@@anthonygriman8674Es un chiste 🤦

    • @carlosprieto2554
      @carlosprieto2554 День тому +1

      Esta acabado, mis fuentes me cuentan que el tocayo se fue a California a trabajar en un Mcdonald

  • @DaniTeba
    @DaniTeba День тому

    Me encantaria usarlo para eliminar mi acento español cuando hablo en ingles

  • @danielveraec
    @danielveraec День тому +1

    Que hay del uso de voz de personas fallecidas? Por ejemplo implementar alguna plataforma con QRs en lápidas por ejemplos que muestre por ejemplo a la imagen y la voz del fallecido quizás narrando en primera persona datos de quien fue en vida. Sería legal ?

    • @ourtravels3140
      @ourtravels3140 День тому +2

      Depende de quién patrocine al gobierne en turno

    • @rosendocamalt
      @rosendocamalt День тому +1

      Añade a esa situación la implicación cultural.

    • @david-w4k1w
      @david-w4k1w 23 години тому

      si es legal, no deberia, pero me parece un tema estupendo pa irme a dormir.

  • @Charly__UY
    @Charly__UY Годину тому

    mmmm.... no suena bien la segunda prueba.... parece Bad Bunny con su Autotune

  • @LeonardoGraciotti
    @LeonardoGraciotti 23 години тому

    The checkpoints support English and Chinese. 😪

  • @Abandoviewer
    @Abandoviewer День тому +1

    Solo funciona con inglés y chino, el español lo destroza.

  • @sihhumo5269
    @sihhumo5269 День тому

    esperando a español