Получаем тексты из видео и аудио (транскрибация) | Python, FFMPEG, Models vosk

Поділитися
Вставка
  • Опубліковано 17 лют 2024
  • Этот скрипт представляет собой комплексное решение для работы с видео и аудиофайлами, предназначенное для извлечения аудиодорожки из видео, её последующей обработки и конвертации в формат WAV с определёнными параметрами, а затем транскрибации полученного аудио в текст. Работа скрипта делится на несколько основных этапов, каждый из которых выполняет свою уникальную функцию.
    Установка путей для ffmpeg:
    setx /m PATH "C:\ffmpeg\bin;%PATH%"
    ffmpeg -version
    Установка зависимостей для Python:
    pip install -r requirements.txt
    ★ Подпишись на мой канал с бесплатными курсами программирования!
    ► моя IDE: www.jetbrains.com/pycharm/dow...
    ★ ССЫЛКИ ПО ТЕМЕ ★
    - github.com/Black-coffe/AudioE...
    - www.gyan.dev/ffmpeg/builds/#r...
    - alphacephei.com/vosk/models
    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
    ★ НАШЕ КОМЬЮНИТИ ★
    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
    ★ Телеграм (Front End): t.me/joinchat/FQXf-hN9LRuCosQ...
    ★ Discord (All): / discord
    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
    ★ Тайм-коды ★
    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
    00:01 - Что это будет...
    00:45 - Демонстрация финального результата
    02:00 - Установка кодека FFMPEG
    05:30 - Прописываем системные пути для кодека FFMPEG
    08:20 - Скачиваем языковые модели vosk для распознавания текста в аудио
    10:50 - Скачиваем бесплатную IDE (PyCharm Community)
    12:25 - Работа с кодом внутри IDE
    15:00 - Варианы импортирования зависимостей (библиотек)
    18:00 - Как подготовить видео файл
    21:40 - Как работать с файлом requirements.txt
    24:10 - Использование предобученныхмоделей vosk
    29:00 - Готовим скрипт для запуска
    30:30 - Работа с сырым текстом
    32:20 - Обработка текста в GPT-4 чате
    34:50 - Обработка текста в GPT-3 чате
    36:00 - Пишу с GPT дополнительный функционал скрипт по разбивке текста в блоки
    38:50 - Скармливаю части с текстом GPT3-5 для написания статьи
    Автор: Андриевский Андрей
    Раздел: Проекты на Python
    #Python #moviepy #pydub #vosk #Аудиообработка #РаспознаваниеРечи #ОбработкаВидео #ПреобразованиеАудио #ТранскрипцияАудио #Программирование #Python3 #Автоматизация #МашинноеОбучение #ОбработкаДанных #ГлубокоеОбучение #АудиоВТекст #ГрафическиеПриложения
    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
    ★ РЕКОМЕНДУЮ ВИДЕО ПО ТЕМЕ ★
    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
    ● [[ Курс Python 3 ]] : [[ • Курс Python 3 | Подгот... ]]
    ● [[ Базовый JavaScript ]] : [[ • Знакомство с JavaScrip... ]]
    ● [[ Курс HTML & CSS ]] : [[ • Знакомство с основным ... ]]
    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
    ★ ПОПУЛЯРНЫЕ ПЛЕЙЛИСТЫ ★
    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
    ● Курс HTML & CSS: • Знакомство с основным ...
    ● Базовый курс JavaScript: • Знакомство с JavaScrip...
    ● Базовый курс Python: • Курс Python 3 | Подгот...
    ● Базовый курс PHP7: • Установка и настройка ...
    ● Динамический сайт с нуля: • Установка сервера WAMP...
    распознавание речи, vosk, python, обработка аудио, обработка видео, pydub, moviepy, аудио в текст, извлечение аудио, конвертация аудио, конвертация видео, сохранение текста, обрезка аудио, wave, KaldiRecognizer, json, обработка текста, текстовые файлы, программирование, аудиодорожка, видеоролик, WAV, MP3, моно, частота дискретизации, видео в аудио, автоматическое распознавание речи, машинное обучение, AI, ИИ, алгоритмы распознавания, звуковой сигнал, текстовая транскрипция, обработка данных, анализ аудио, извлечение текста, аудиофайл, видеофайл, кодировка, разделение текста, скриптование, Python библиотеки, аудио анализ, видео анализ, data science, наука о данных, deep learning, глубокое обучение

КОМЕНТАРІ • 6

  • @user-mb8yx3xo4t
    @user-mb8yx3xo4t 2 місяці тому +2

    Великолепно!!!! Огромное спасибо за подробный разбор ❤

  • @user-ux6kd2qc5y
    @user-ux6kd2qc5y 5 місяців тому +3

    Уххх. Круто. Спасибо

  • @frvrlone1
    @frvrlone1 5 місяців тому +1

    Привет, меня заинтересовал твой канал, как с тобой связаться?

    • @andrievskii
      @andrievskii  5 місяців тому

      Привет, почти под каждым видео есть ссылка на телеграм группу!

  • @engineer_Pavlo
    @engineer_Pavlo 5 місяців тому +1

    А субтитры к видео не легче было вытянуть?

    • @andrievskii
      @andrievskii  5 місяців тому

      Начнем с того, что они не под всеми видео есть, далее не только с ютюба можно брать ролики, а любые вообще откуда угодно, хоть даже личное снятое на телефон.
      Ну и я не пробовал парсить субтитры, хотя вопрос о них уже задавали и не раз.