Как озвучить видео любым голосом
Вставка
- Опубліковано 22 лис 2024
- Делюсь своим опытом работы с нейросетями для озвучки видео. Рассказываю, как выбрать голос и как улучшить интонацию для естественного звучания. Работа в нейросети Elevenlabs
Таймкоды:
00:10 - Лучшая нейросеть для озвучки
00:23 - Модель озвучки
00:33 - Проблемы с интонацией и их решения
00:48 - Как обойти ограничения доступа
01:06 - Текст в речь: как это работает
01:45 - Примеры и советы для использования
02:56 - Возможности перевода голоса на другой язык
Мой Telegram: t.me/lexel_cha...
Очень впечатляет. Даже лучше, чем оригинальный голос у некоторых блогеров я впечатлен этим обзором. Спасибо.
Хорошо говорить - это отдельный навык, которому нужно учиться. Не у всех он сам по себе нарабатывается. А нейронку если на хорошем голосе обучить, то и результат будет более чем приличный)
Супер! Так классно все обьяснили ! Спасибо.
Обалденная подача! Я смотрел и понимал, что всё понимаю. Для меня это неожиданно😅
Просто зашёл сюда, чтобы сказать.
Спасибо! Замечательная информация! Теперь песни, сгенерированные в Suno, можно пропевать своим голосом. Кстати, я заметил, что Suno лучше понимает ударения в словах когда действительно стоят РЕАЛЬНЫЕ знаки ударения. Но опять же, это из моего опыта.
в суно существует много разных подсказок для текста)
можнО ударЕния большИми бУквами ставить. тоже работает.
ну и про всякие [verse], [chorus] я надеюсь знаете)
Suno - super !
Уууу спасибо Алексей. Не было время разбираться с 11лабс, но вот ваш видос подвернулся.
Уже записано видео по хейгену, и на очереди другие нейронки, которыми я активно пользуюсь в работе.
Так что подписывайтесь, чтобы не пропустить!)
Я как раз использую эту нейросеть для озвучки. Для работы с большими объёмами текста много косяков выходит, голос начинает пищать или говорить с сильным акцентом где-то через минуту, приходится озвучивать маленькими кусочками и делать правки в тексте, чтобы он читал хорошо. Для примера, он читал по буквам слов "идти", исправляешь на "ити" и тогда нормально продолжает. Для работы с русским текстом лучше всего подходят голоса Brian, Lily, George и Matilda, вот у них меньше таких проблем, но и результат звучит как более роботизированная версия. Нужно экспериментировать, подбирать голоса и менять текст, чтобы получить более менее приемлемую озвучку.
большие тексты да. там есть настройка стабильности, но всё равно с интонациями на длинной дистанции - худо.
произношение русских слов - тоже иногда хромает. но из всех нейронок, что я пробовал, здесь хромает меньше всех. соответсвенно и работы над косяками меньше.
а вот про разницу письменного текста и устной речи - это вообще целая огромная тема))) то что выглядит как хороший текст - может быть ужасным на слух. и наоборот.
душевно
Приятель мне очень нравится твои записи, мне очень, очень, при очень интересно как ты делаешь запись экрана с вебкой, меня заинтересовало какой программой пользуешься, так как твоя запись экрана с тобой без фона, то есть запись очень интересна, подробней расскажи о ней жду записи, либо скинь ссылку если уже есть у тебя подобный ролик✨
хорошо, подумаю как это оформить и рассказать)
Я успел протестить сеть до того, как доступ из России был перекрыт. Да, мне с озвучиванием больших объёмов текста очень помогло бы. В качестве образца загрузил довольно длительный отрезок начитки с интонированием, протренировал озвучку на разных вариантах текста, остался доволен. Но увы, лавочку лабс прикрыли.
Как видите закрыли, да не совсем) Я успешно использую в работе
@@LexEliseev Да, без впн никуда, реалии. А как с оплатой нейронки?
простите за духоту, но вам бы свой микрофон настроить для начала, фонит так, что невозможно слушать
интересно)
если ваш комментарий наберёт больше 10 лайков, то я пойму, что не только у вас возникло такое ощущение и буду думать, что можно сделать.
@@LexEliseev я не заметил фонового звука, но я обычный пользователь, не звукорежиссер.
Если бы не этот комментарий, я бы даже не прислушалась 😅
Реально фонит
я смотрел с телефона на маленькой громкости, как прибавил услышал фон от микрофона. даже на динамиках телефона микрофон фонит
у меня не работает. пишет что подозрительная активность и бесплатные функции не дадим. ВПН включен, пробовал разные страны
попробуйте зарегестрировать новый акк из под впн, и уже с ним заходить
Чтобы скачивать готовые звуки, сколько стоит подписка на этом сайте?
@frostysummervlog первый месяц заманушная цена 5$
Полезненько 🤝
Ну я короче с включенным гугл-акком вошел, и потом с выключенным получилось поработать, не переходя со страницы. как-то так
Здравствуйте! Не знаете, есть ли что то подобное для стилизации голоса для установки локально , на компьютере?
RVC знаю. игрался с ней полгода назад.
с её помощью каверы раньше делали, как раз для клонирования голоса.
Привет! Чьим сервисом пользуешься для оплаты?
раньше юзал t.me/WantToPayBot?start=w17851188--H6FD18
щас через знакомых)
Спасибо за видео. Теперл мы видим, что любой Алеша может подделать чужой голос для мошенничества и пранка. Порог вхождения кардинально понижен.
в следующем видео я ещё покажу как Алёша создаёт клонов, и не только аудио, но и видео смогут использовать мошенники)
впрочем как и любую другую технологию плохие люди используют во вред
Мошенники типа не знают этих технологий.
добрый день, эту плашку ВПН в настройках плагина можно поменять расположение если в этом углу мешает.. и такой вопрос, что то не увидел про ценники этой нейронки, подскажите.
блин, правда можно? я чё-то тыркался тыркался - так и не победил её)))
по ценам:
есть бесплатный тариф 10 000 кредитов. что равно 10 000 букв, которые он озвучит это примерно 10 минут аудио.
11$ = 30 000 кредитов - 30 минут аудио
22$ = 100 000 - 2 часа
99$ = 500 000 - 10 часов
@@LexEliseev спасибо
@@LexEliseev на значке плагина нажимаешь, там внизу есть кнопка аккаунт, там есть настройка. и там почти вверху выбирается один из 4х углов.. может в другом углу удобней будет
гениально!!! огромное спасибо))) меня реально очень это бесило
@@LexEliseev но мне больше плагин BROWSEC понравился, так же подключение одним нажатием, рекламой особо не достаёт, бесплатный Нидерландовский сервер тоже есть. но конечно если его включить он сразу на всех вкладках действует, что не всегда полезно, ну зато никаких плашек))
Я пишу бесплатную программу для всех для озвучивания книг (и любых текстов) на основе нейросетей. Могу сказать , что качество голоса - это не самая большая проблема. Самая большая и совершенно нерешенная проблема - это УДАРЕНИЯ ! (и конкретно омографы). Никто эту проблему так толком и не решил. При озвучке больших текстов - куча ошибок. Если кто-то знает решение по омографам - ну дайте мне знать, я нормальных вариантов так и не нашел.
Вот вам пример для теста: "Мы подъехали к старому черному замку. Массивные ворота выглядели потрепанными, на них висел огромный странного вида замок. Ноги уже очень болели от долгого перехода, но другу, у которого вообще ноги не было , ему-то было еще хуже. А ведь предупреждали нас жены , что не стоит сюда приезжать. Впрочем, я забыл - у друга жены нет, и предупреждать некому. На башне стрелки, сверкая под солнцем, показывали полдень, а в кустах возле моста сидеть могли стрелки, которых мы не видим. " - тут проблемные омографы: замок, жены, ноги, стрелки.
решение - дообучение модели. ну и подсказки. можно стАвить ударЕния большИми буквами.
в суно - это очень хорошо работает.
в елевенлабс - нужно играться. он может одно и то же слово в вух разных местах текста - по разному прочитать
@@LexEliseev Не существует программы, которая бы взяла текст - и расставила в нем правильно ударения. Я сейчас попробовал Гигачат Сбера и Яндекс GPT4 - ошибаются и они тоже. Нет программы. Нейронки бессильны.
так и люди ошибаются) я много с дикторской озвучкой работал. фамилии там, жаргонизмы и т.д. всегда надо посдказки расставлять и указывать, как правильно читается.
нет никого кто делает идеально с первого раза.
правки доработки - это нормально.
@@LexEliseev В омографах люди не ошибаются см. пример текста выше (бывает что говорят "звОнят" - Но это просто огрехи образования. )
Не работает с этим впн!
ничего страшного, попробуйте с любым другим) щас время такое, впн постоянно блокируют. приходится постоянно менять решения🤷🏻
Пользоваться нейросетью для озвучки можно только если автор физически не может говорить (болезнь, незнание языка). Во всех остальных случаях - не охота, некогда - это дикий зашквар и моветон. Нормальные люди такие полу-видео игнорируют.
Да область применения у инструмента - ограниченная)
Но тоже самое можно сказать про что угодно: пользоваться скальпелем можно только для хирургических операций, а вот резать шашлык - зашквар и моветон)))
Может быть область применения и ограничена, но бывают случаи, когда необходимо!
Между прочим мне это видео как раз очень вовремя попало сегодня под руку!
Я как раз был на церемонии награждения. У нас в городе на днях прошёл фестиваль мёда, я сделал два видео, а в эти видео вставил песни, написанные искусственным интеллектом.
Кто-то из "высокопоставленных" случайно увидели это и решили наградить за активное участие в фестивале. Они решили что эта песня может быть гимном фестиваля!
Правда здесь у нас есть одна особенность - мы в Узбекистане, и как-то на русском языке гимн не особенно зайдёт. Так что помимо награждения, они настоятельно попросили на следующий год создать такой же гимн на узбекском языке 🤦♂️
Вот теперь у меня непростая задача, узбекский язык я не знаю, и как-то нужно написать текст, или хотя бы перевести то что у меня уже есть с русского на узбекский. Но опять же прямой перевод может получиться ужасным 🤷♂️
Ну, а музыку снова повторить тоже пока не понимаю как, ведь ИИ генерирует каждый раз по-новому! Есть конечно extended, но там тоже наверное свои особенности, пишет по-частям...
Ну да ладно, я отвлёкся от главной сути!
Мне предложили церемонию награждения тоже показать. И я решил, что не я сам буду говорить: "Дамы и господа! За активное участие в фестивале........." и т.д.....
Дать проговорить это "другому голосу", желательно дикторскому! 😁
Эти нормальные люди с тобой в одной комнате? У озвученных нейронкой роликов миллионы просмотров, а используют ее не только если не могут говорить. Есть разный контент и масса причин ее использовать
Компьютеры изобретатели для сложных вычислений. Пользоваться ими в бытовых условиях никто не будет
@@johnnesch9189 хорошая шутка
Плохо работает с русским языком. Теряет слова, не правильная скорость речи И так далее..
Да не идеально, но я не нашёл ничего лучше. Если знаете - поделитесь, пожалуйста)
Лабс не работает в России!!!
именно про это я и говорю в первые же секунды видео. а потом включаю впн и спокойно работаю)