Как озвучить видео любым голосом

Поділитися
Вставка
  • Опубліковано 22 лис 2024
  • Делюсь своим опытом работы с нейросетями для озвучки видео. Рассказываю, как выбрать голос и как улучшить интонацию для естественного звучания. Работа в нейросети Elevenlabs
    Таймкоды:
    00:10 - Лучшая нейросеть для озвучки
    00:23 - Модель озвучки
    00:33 - Проблемы с интонацией и их решения
    00:48 - Как обойти ограничения доступа
    01:06 - Текст в речь: как это работает
    01:45 - Примеры и советы для использования
    02:56 - Возможности перевода голоса на другой язык
    Мой Telegram: t.me/lexel_cha...

КОМЕНТАРІ • 70

  • @Shultsgor
    @Shultsgor 2 дні тому

    Очень впечатляет. Даже лучше, чем оригинальный голос у некоторых блогеров я впечатлен этим обзором. Спасибо.

    • @LexEliseev
      @LexEliseev  2 дні тому

      Хорошо говорить - это отдельный навык, которому нужно учиться. Не у всех он сам по себе нарабатывается. А нейронку если на хорошем голосе обучить, то и результат будет более чем приличный)

  • @ИльмираСтрижиус
    @ИльмираСтрижиус 5 днів тому

    Супер! Так классно все обьяснили ! Спасибо.

  • @СеливанКлятый
    @СеливанКлятый 15 днів тому +1

    Обалденная подача! Я смотрел и понимал, что всё понимаю. Для меня это неожиданно😅
    Просто зашёл сюда, чтобы сказать.

  • @michaelgarr5234
    @michaelgarr5234 7 днів тому +1

    Спасибо! Замечательная информация! Теперь песни, сгенерированные в Suno, можно пропевать своим голосом. Кстати, я заметил, что Suno лучше понимает ударения в словах когда действительно стоят РЕАЛЬНЫЕ знаки ударения. Но опять же, это из моего опыта.

    • @LexEliseev
      @LexEliseev  6 днів тому

      в суно существует много разных подсказок для текста)
      можнО ударЕния большИми бУквами ставить. тоже работает.
      ну и про всякие [verse], [chorus] я надеюсь знаете)

    • @ИльмираСтрижиус
      @ИльмираСтрижиус 5 днів тому

      Suno - super !

  • @forestlong1
    @forestlong1 17 днів тому +3

    Уууу спасибо Алексей. Не было время разбираться с 11лабс, но вот ваш видос подвернулся.

    • @LexEliseev
      @LexEliseev  17 днів тому

      Уже записано видео по хейгену, и на очереди другие нейронки, которыми я активно пользуюсь в работе.
      Так что подписывайтесь, чтобы не пропустить!)

  • @Сказкиполуночи
    @Сказкиполуночи 17 днів тому +3

    Я как раз использую эту нейросеть для озвучки. Для работы с большими объёмами текста много косяков выходит, голос начинает пищать или говорить с сильным акцентом где-то через минуту, приходится озвучивать маленькими кусочками и делать правки в тексте, чтобы он читал хорошо. Для примера, он читал по буквам слов "идти", исправляешь на "ити" и тогда нормально продолжает. Для работы с русским текстом лучше всего подходят голоса Brian, Lily, George и Matilda, вот у них меньше таких проблем, но и результат звучит как более роботизированная версия. Нужно экспериментировать, подбирать голоса и менять текст, чтобы получить более менее приемлемую озвучку.

    • @LexEliseev
      @LexEliseev  16 днів тому +1

      большие тексты да. там есть настройка стабильности, но всё равно с интонациями на длинной дистанции - худо.
      произношение русских слов - тоже иногда хромает. но из всех нейронок, что я пробовал, здесь хромает меньше всех. соответсвенно и работы над косяками меньше.
      а вот про разницу письменного текста и устной речи - это вообще целая огромная тема))) то что выглядит как хороший текст - может быть ужасным на слух. и наоборот.

  • @Вячеслав-б8е9щ
    @Вячеслав-б8е9щ 17 днів тому +1

    душевно

  • @master_sw
    @master_sw 9 днів тому

    Приятель мне очень нравится твои записи, мне очень, очень, при очень интересно как ты делаешь запись экрана с вебкой, меня заинтересовало какой программой пользуешься, так как твоя запись экрана с тобой без фона, то есть запись очень интересна, подробней расскажи о ней жду записи, либо скинь ссылку если уже есть у тебя подобный ролик✨

    • @LexEliseev
      @LexEliseev  8 днів тому +1

      хорошо, подумаю как это оформить и рассказать)

  • @BazzilioSPb
    @BazzilioSPb 17 днів тому +1

    Я успел протестить сеть до того, как доступ из России был перекрыт. Да, мне с озвучиванием больших объёмов текста очень помогло бы. В качестве образца загрузил довольно длительный отрезок начитки с интонированием, протренировал озвучку на разных вариантах текста, остался доволен. Но увы, лавочку лабс прикрыли.

    • @LexEliseev
      @LexEliseev  17 днів тому +1

      Как видите закрыли, да не совсем) Я успешно использую в работе

    • @BazzilioSPb
      @BazzilioSPb 17 днів тому

      @@LexEliseev Да, без впн никуда, реалии. А как с оплатой нейронки?

  • @fintore
    @fintore 17 днів тому +19

    простите за духоту, но вам бы свой микрофон настроить для начала, фонит так, что невозможно слушать

    • @LexEliseev
      @LexEliseev  17 днів тому +3

      интересно)
      если ваш комментарий наберёт больше 10 лайков, то я пойму, что не только у вас возникло такое ощущение и буду думать, что можно сделать.

    • @domnk7
      @domnk7 17 днів тому +2

      @@LexEliseev я не заметил фонового звука, но я обычный пользователь, не звукорежиссер.

    • @kiralis21
      @kiralis21 17 днів тому +2

      Если бы не этот комментарий, я бы даже не прислушалась 😅

    • @DorianKodi
      @DorianKodi 17 днів тому +1

      Реально фонит

    • @Яндекс.Такси-партнёр
      @Яндекс.Такси-партнёр 16 днів тому

      я смотрел с телефона на маленькой громкости, как прибавил услышал фон от микрофона. даже на динамиках телефона микрофон фонит

  • @alexs9391
    @alexs9391 17 днів тому +6

    у меня не работает. пишет что подозрительная активность и бесплатные функции не дадим. ВПН включен, пробовал разные страны

    • @LexEliseev
      @LexEliseev  17 днів тому +1

      попробуйте зарегестрировать новый акк из под впн, и уже с ним заходить

    • @frostysummervlog
      @frostysummervlog 17 днів тому

      Чтобы скачивать готовые звуки, сколько стоит подписка на этом сайте?

    • @LexEliseev
      @LexEliseev  17 днів тому

      @frostysummervlog первый месяц заманушная цена 5$

  • @BroMotor
    @BroMotor 18 днів тому +1

    Полезненько 🤝

  • @artelfilm
    @artelfilm 16 днів тому +1

    Ну я короче с включенным гугл-акком вошел, и потом с выключенным получилось поработать, не переходя со страницы. как-то так

  • @ЕгорСеребровский-ф1ю

    Здравствуйте! Не знаете, есть ли что то подобное для стилизации голоса для установки локально , на компьютере?

    • @LexEliseev
      @LexEliseev  15 днів тому

      RVC знаю. игрался с ней полгода назад.
      с её помощью каверы раньше делали, как раз для клонирования голоса.

  • @NetworM74
    @NetworM74 17 днів тому

    Привет! Чьим сервисом пользуешься для оплаты?

    • @LexEliseev
      @LexEliseev  17 днів тому

      раньше юзал t.me/WantToPayBot?start=w17851188--H6FD18
      щас через знакомых)

  • @user-ykq3ihlU5k
    @user-ykq3ihlU5k 17 днів тому

    Спасибо за видео. Теперл мы видим, что любой Алеша может подделать чужой голос для мошенничества и пранка. Порог вхождения кардинально понижен.

    • @LexEliseev
      @LexEliseev  16 днів тому

      в следующем видео я ещё покажу как Алёша создаёт клонов, и не только аудио, но и видео смогут использовать мошенники)
      впрочем как и любую другую технологию плохие люди используют во вред

    • @Чобель
      @Чобель 16 днів тому

      Мошенники типа не знают этих технологий.

  • @UgolokEnota
    @UgolokEnota 18 днів тому +2

    добрый день, эту плашку ВПН в настройках плагина можно поменять расположение если в этом углу мешает.. и такой вопрос, что то не увидел про ценники этой нейронки, подскажите.

    • @LexEliseev
      @LexEliseev  18 днів тому +1

      блин, правда можно? я чё-то тыркался тыркался - так и не победил её)))
      по ценам:
      есть бесплатный тариф 10 000 кредитов. что равно 10 000 букв, которые он озвучит это примерно 10 минут аудио.
      11$ = 30 000 кредитов - 30 минут аудио
      22$ = 100 000 - 2 часа
      99$ = 500 000 - 10 часов

    • @UgolokEnota
      @UgolokEnota 18 днів тому +1

      @@LexEliseev спасибо

    • @UgolokEnota
      @UgolokEnota 18 днів тому +1

      @@LexEliseev на значке плагина нажимаешь, там внизу есть кнопка аккаунт, там есть настройка. и там почти вверху выбирается один из 4х углов.. может в другом углу удобней будет

    • @LexEliseev
      @LexEliseev  18 днів тому +1

      гениально!!! огромное спасибо))) меня реально очень это бесило

    • @UgolokEnota
      @UgolokEnota 18 днів тому +1

      @@LexEliseev но мне больше плагин BROWSEC понравился, так же подключение одним нажатием, рекламой особо не достаёт, бесплатный Нидерландовский сервер тоже есть. но конечно если его включить он сразу на всех вкладках действует, что не всегда полезно, ну зато никаких плашек))

  • @dezmond8416
    @dezmond8416 16 днів тому

    Я пишу бесплатную программу для всех для озвучивания книг (и любых текстов) на основе нейросетей. Могу сказать , что качество голоса - это не самая большая проблема. Самая большая и совершенно нерешенная проблема - это УДАРЕНИЯ ! (и конкретно омографы). Никто эту проблему так толком и не решил. При озвучке больших текстов - куча ошибок. Если кто-то знает решение по омографам - ну дайте мне знать, я нормальных вариантов так и не нашел.

    • @dezmond8416
      @dezmond8416 16 днів тому

      Вот вам пример для теста: "Мы подъехали к старому черному замку. Массивные ворота выглядели потрепанными, на них висел огромный странного вида замок. Ноги уже очень болели от долгого перехода, но другу, у которого вообще ноги не было , ему-то было еще хуже. А ведь предупреждали нас жены , что не стоит сюда приезжать. Впрочем, я забыл - у друга жены нет, и предупреждать некому. На башне стрелки, сверкая под солнцем, показывали полдень, а в кустах возле моста сидеть могли стрелки, которых мы не видим. " - тут проблемные омографы: замок, жены, ноги, стрелки.

    • @LexEliseev
      @LexEliseev  16 днів тому

      решение - дообучение модели. ну и подсказки. можно стАвить ударЕния большИми буквами.
      в суно - это очень хорошо работает.
      в елевенлабс - нужно играться. он может одно и то же слово в вух разных местах текста - по разному прочитать

    • @dezmond8416
      @dezmond8416 16 днів тому

      @@LexEliseev Не существует программы, которая бы взяла текст - и расставила в нем правильно ударения. Я сейчас попробовал Гигачат Сбера и Яндекс GPT4 - ошибаются и они тоже. Нет программы. Нейронки бессильны.

    • @LexEliseev
      @LexEliseev  16 днів тому

      так и люди ошибаются) я много с дикторской озвучкой работал. фамилии там, жаргонизмы и т.д. всегда надо посдказки расставлять и указывать, как правильно читается.
      нет никого кто делает идеально с первого раза.
      правки доработки - это нормально.

    • @dezmond8416
      @dezmond8416 16 днів тому

      @@LexEliseev В омографах люди не ошибаются см. пример текста выше (бывает что говорят "звОнят" - Но это просто огрехи образования. )

  • @babtistbarry2739
    @babtistbarry2739 15 днів тому

    Не работает с этим впн!

    • @LexEliseev
      @LexEliseev  15 днів тому

      ничего страшного, попробуйте с любым другим) щас время такое, впн постоянно блокируют. приходится постоянно менять решения🤷🏻

  • @EvilFilm1812
    @EvilFilm1812 17 днів тому +7

    Пользоваться нейросетью для озвучки можно только если автор физически не может говорить (болезнь, незнание языка). Во всех остальных случаях - не охота, некогда - это дикий зашквар и моветон. Нормальные люди такие полу-видео игнорируют.

    • @LexEliseev
      @LexEliseev  17 днів тому +3

      Да область применения у инструмента - ограниченная)
      Но тоже самое можно сказать про что угодно: пользоваться скальпелем можно только для хирургических операций, а вот резать шашлык - зашквар и моветон)))

    • @NamanganSegodnya
      @NamanganSegodnya 17 днів тому +1

      Может быть область применения и ограничена, но бывают случаи, когда необходимо!
      Между прочим мне это видео как раз очень вовремя попало сегодня под руку!
      Я как раз был на церемонии награждения. У нас в городе на днях прошёл фестиваль мёда, я сделал два видео, а в эти видео вставил песни, написанные искусственным интеллектом.
      Кто-то из "высокопоставленных" случайно увидели это и решили наградить за активное участие в фестивале. Они решили что эта песня может быть гимном фестиваля!
      Правда здесь у нас есть одна особенность - мы в Узбекистане, и как-то на русском языке гимн не особенно зайдёт. Так что помимо награждения, они настоятельно попросили на следующий год создать такой же гимн на узбекском языке 🤦‍♂️
      Вот теперь у меня непростая задача, узбекский язык я не знаю, и как-то нужно написать текст, или хотя бы перевести то что у меня уже есть с русского на узбекский. Но опять же прямой перевод может получиться ужасным 🤷‍♂️
      Ну, а музыку снова повторить тоже пока не понимаю как, ведь ИИ генерирует каждый раз по-новому! Есть конечно extended, но там тоже наверное свои особенности, пишет по-частям...
      Ну да ладно, я отвлёкся от главной сути!
      Мне предложили церемонию награждения тоже показать. И я решил, что не я сам буду говорить: "Дамы и господа! За активное участие в фестивале........." и т.д.....
      Дать проговорить это "другому голосу", желательно дикторскому! 😁

    • @karvalhokrsk
      @karvalhokrsk 17 днів тому +2

      Эти нормальные люди с тобой в одной комнате? У озвученных нейронкой роликов миллионы просмотров, а используют ее не только если не могут говорить. Есть разный контент и масса причин ее использовать

    • @johnnesch9189
      @johnnesch9189 17 днів тому

      Компьютеры изобретатели для сложных вычислений. Пользоваться ими в бытовых условиях никто не будет

    • @smaxinfo
      @smaxinfo 16 днів тому

      ​@@johnnesch9189 хорошая шутка

  • @quicksolphoto
    @quicksolphoto 14 днів тому

    Плохо работает с русским языком. Теряет слова, не правильная скорость речи И так далее..

    • @LexEliseev
      @LexEliseev  14 днів тому

      Да не идеально, но я не нашёл ничего лучше. Если знаете - поделитесь, пожалуйста)

  • @Composer-Dolgov
    @Composer-Dolgov 16 днів тому

    Лабс не работает в России!!!

    • @LexEliseev
      @LexEliseev  15 днів тому

      именно про это я и говорю в первые же секунды видео. а потом включаю впн и спокойно работаю)