Clonación de Voz: De Audio a TTS en 18 Minutos | Tutorial Completo
Вставка
- Опубліковано 26 вер 2024
- ¡Descubre el fascinante mundo de la clonación de voz en este tutorial de 18 minutos!
Te guiaré paso a paso a través del proceso, desde dividir un audio en fragmentos, transcribir con Python, hasta entrenar tu propio modelo. Aprende a cargar tus modelos en Hugging Face, ejecutarlos en línea con Spaces, y incluso cómo llevarlo a cabo en Windows con Piper. ¡Haz que tu voz cobre vida con esta increíble tecnología! 🗣️✨ #ClonaciónDeVoz #TTS #tutorialpython
😎 El cuaderno v2 cuenta con transcripción automática de los audios 😎
Audacity: www.audacityte...
Repo con Dataset.py y cuaderno Kaggle: github.com/Hir...
Entrenar en Colab (No verificado si aún funcione): colab.research...
WPY64: winpython.gith...
Clonar Espacio y subir .onnx: huggingface.co...
🎊Nueva App de piper para Windows: www.hircoir.eu...
Piper Releases: github.com/rha...
Gran video! Muchas gracias!
Lástima que no se pueda usar las 2 GPUs para entrenar de manera más eficiente. No sé si esto se deba a que para Piper y el notebook se están usando unas versiones antiguas de PyTorch y otros módulos como Lightning. Para datasets de 2 o más horas será bastante lento. Y cuidado con Numpy 2.0, que no funcionará el cuaderno si se instala esa versión. Yo personalmente uso el modo save & run, no el modo interactivo, ya que así no tengo que interactuar con la página cada 30 minutos. Es algo más manual en cuanto a algunas cosas, pero ya se hizo costumbre.
ya no funciona en codigo para clonar voz en kragle....
Laburaso hermano! Disculpa sabes por que cuando extraigo el tar.gz me extrae solo un archivo onnx.json?? Me falta el onnx en si
Usa el espacio de Huggingface, posiblemente se actualizó el proyecto y por ende se rompió todo: huggingface.co/spaces/HirCoir/Kaggle-Piper-onnx-export-and-inference
@@hircoir Gracias hermano, funciono! Te jodo con una última cosa jaja, a mi me copa esto de la ia, en especial esto del tts. Recomendas algún curso, repo para leer, o algo para aprender más sobre el tema?
@@ernestoflores3873 Te recomiendo leer acerca de Tacotron, CoquiTTS, etc... Como tal no puedo recomendar algo en específico pero lo anterior mencionado son tecnologías para el entrenamiento de modelos de voz
@@hircoir Gracias bro, voy a verlo! Suerte en tus proyectos!
Buen aporte, pero recomiendo usar su producto y reemplazar el audio robótico. Debería tener más me gusta.
@@gustavotsantander4495 Hola!, no entendí a que te refieres con lo del producto 🤔
alguna solución amigos ?
Ya no Funciona el Metodo en kragle, no puedo clonar mi voz. Reviselo Porfavor. Gracias
@@EsetNodplus Puedes decirme cuál es el error?
Recuerda que el máximo de segundos por cada audio debe de ser menor a 10 segundos, de lo contrario al momento de iniciar el entrenamiento este dará un error diciendo que se quedó sin memoria la infancia
@@hircoir DEPRECATION: pytorch-lightning 1.7.7 has a non-standard dependency specifier torch>=1.9.*. pip 24.0 will enforce this behaviour change. A possible replacement is to upgrade to a newer version of pytorch-lightning or contact the author to suggest that they release a version with a conforming dependency specifiers. Discussion can be found at
ImportError: numpy.core.multiarray failed to import
@@EsetNodplus Esta noche le echaré una revisada al código, gracias por avisar 😁
@@hircoir eso seria genial. Gracias...
vas muy rapido y no se entiende que decis!!! esa voz artificial que usas no deja entender bien que queres decir