Получаем тексты из видео и аудио (транскрибация) | Python, FFMPEG, Models vosk
Вставка
- Опубліковано 17 лют 2024
- Этот скрипт представляет собой комплексное решение для работы с видео и аудиофайлами, предназначенное для извлечения аудиодорожки из видео, её последующей обработки и конвертации в формат WAV с определёнными параметрами, а затем транскрибации полученного аудио в текст. Работа скрипта делится на несколько основных этапов, каждый из которых выполняет свою уникальную функцию.
Установка путей для ffmpeg:
setx /m PATH "C:\ffmpeg\bin;%PATH%"
ffmpeg -version
Установка зависимостей для Python:
pip install -r requirements.txt
★ Подпишись на мой канал с бесплатными курсами программирования!
► моя IDE: www.jetbrains.com/pycharm/dow...
★ ССЫЛКИ ПО ТЕМЕ ★
- github.com/Black-coffe/AudioE...
- www.gyan.dev/ffmpeg/builds/#r...
- alphacephei.com/vosk/models
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ НАШЕ КОМЬЮНИТИ ★
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ Телеграм (Front End): t.me/joinchat/FQXf-hN9LRuCosQ...
★ Discord (All): / discord
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ Тайм-коды ★
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
00:01 - Что это будет...
00:45 - Демонстрация финального результата
02:00 - Установка кодека FFMPEG
05:30 - Прописываем системные пути для кодека FFMPEG
08:20 - Скачиваем языковые модели vosk для распознавания текста в аудио
10:50 - Скачиваем бесплатную IDE (PyCharm Community)
12:25 - Работа с кодом внутри IDE
15:00 - Варианы импортирования зависимостей (библиотек)
18:00 - Как подготовить видео файл
21:40 - Как работать с файлом requirements.txt
24:10 - Использование предобученныхмоделей vosk
29:00 - Готовим скрипт для запуска
30:30 - Работа с сырым текстом
32:20 - Обработка текста в GPT-4 чате
34:50 - Обработка текста в GPT-3 чате
36:00 - Пишу с GPT дополнительный функционал скрипт по разбивке текста в блоки
38:50 - Скармливаю части с текстом GPT3-5 для написания статьи
Автор: Андриевский Андрей
Раздел: Проекты на Python
#Python #moviepy #pydub #vosk #Аудиообработка #РаспознаваниеРечи #ОбработкаВидео #ПреобразованиеАудио #ТранскрипцияАудио #Программирование #Python3 #Автоматизация #МашинноеОбучение #ОбработкаДанных #ГлубокоеОбучение #АудиоВТекст #ГрафическиеПриложения
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ РЕКОМЕНДУЮ ВИДЕО ПО ТЕМЕ ★
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
● [[ Курс Python 3 ]] : [[ • Курс Python 3 | Подгот... ]]
● [[ Базовый JavaScript ]] : [[ • Знакомство с JavaScrip... ]]
● [[ Курс HTML & CSS ]] : [[ • Знакомство с основным ... ]]
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ ПОПУЛЯРНЫЕ ПЛЕЙЛИСТЫ ★
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
● Курс HTML & CSS: • Знакомство с основным ...
● Базовый курс JavaScript: • Знакомство с JavaScrip...
● Базовый курс Python: • Курс Python 3 | Подгот...
● Базовый курс PHP7: • Установка и настройка ...
● Динамический сайт с нуля: • Установка сервера WAMP...
распознавание речи, vosk, python, обработка аудио, обработка видео, pydub, moviepy, аудио в текст, извлечение аудио, конвертация аудио, конвертация видео, сохранение текста, обрезка аудио, wave, KaldiRecognizer, json, обработка текста, текстовые файлы, программирование, аудиодорожка, видеоролик, WAV, MP3, моно, частота дискретизации, видео в аудио, автоматическое распознавание речи, машинное обучение, AI, ИИ, алгоритмы распознавания, звуковой сигнал, текстовая транскрипция, обработка данных, анализ аудио, извлечение текста, аудиофайл, видеофайл, кодировка, разделение текста, скриптование, Python библиотеки, аудио анализ, видео анализ, data science, наука о данных, deep learning, глубокое обучение
Великолепно!!!! Огромное спасибо за подробный разбор ❤
Уххх. Круто. Спасибо
Привет, меня заинтересовал твой канал, как с тобой связаться?
Привет, почти под каждым видео есть ссылка на телеграм группу!
А субтитры к видео не легче было вытянуть?
Начнем с того, что они не под всеми видео есть, далее не только с ютюба можно брать ролики, а любые вообще откуда угодно, хоть даже личное снятое на телефон.
Ну и я не пробовал парсить субтитры, хотя вопрос о них уже задавали и не раз.