[편집X/대본X] 초보자를 위한 AI 자막생성툴 Whisper WebUI 설치법

Поділитися
Вставка
  • Опубліковано 10 лис 2024

КОМЕНТАРІ • 87

  • @tonicmusic-studio
    @tonicmusic-studio  Місяць тому

    최신 버전에서 dll 라이브러리가 없어서 뜨는 오류들이 있습니다. 이 경우 다음과 같이 조치해 주시면 대부분은 해결됩니다.
    github.com/Purfview/whisper-standalone-win/releases/tag/libs
    1) 위 링크에서 CUDA11/12 중 현재 인스톨된 버전으로 zip 파일을 다운 받아 압축을 풉니다.
    2) 파일들을 Faster-Whisper 실행 폴더 또는 윈도우 System32로 옮겨줍니다.
    3) 윈도우를 재부팅하고 다시 Whisper를 실행해보세요.

    • @김선범-s8r
      @김선범-s8r 11 днів тому

      혹시 해당방법으로 시도해봤는데도 해결이 안되는경우엔 어떻게 해야할지 알려주실 수 있으신가요...?

    • @김선범-s8r
      @김선범-s8r 11 днів тому

      ImportError: DLL load failed while importing onnx_cpp2py_export: DLL 초기화 루틴을 실행할 수 없습니다.
      라는 오류가 지속적으로 발생하며
      파이썬 3.10.6 / cuda 12.4 / 깃 모두 설치했고 windows11 , 9950x , 4070super 시스템 사용중입니다.

  • @비쥬얼맨
    @비쥬얼맨 2 місяці тому

    다른 방송에선 따라해도 안됐는데 이 방송보고 바로 성공했습니다. 감사합니다.

  • @SONJOGYO
    @SONJOGYO Місяць тому +1

    덕분에 쉽게 따라했습니다. 진심으로 감사드립니다.

  • @user-8669
    @user-8669 2 місяці тому

    전 다른방법으로 자막 만들기 찾았네요 이프로그램 입니다 Subtitle Edit 자막 쉽게 만들어 지네요

  • @oncelife7499
    @oncelife7499 6 місяців тому

    좋은 영상 잘 보고 갑니다
    설치하려다 깜박하고 사용하다가
    영상보고 잘 설치하였습니다
    감사합니다^^

  • @마참
    @마참 3 місяці тому

    Could not locate cudnn_cnn_infer64_8.dll. Please make sure it is in your library path!
    "launching the app"
    다른 오류들 거의 다 해결해서 웹까진 띄워지는데 이런 에러가 나오는데 어떻게 해결해야 하나요?

    • @tonicmusic-studio
      @tonicmusic-studio  3 місяці тому

      dll 라이브러리가 없어서 나는 오류 같습니다.
      github.com/Purfview/whisper-standalone-win/releases/tag/libs
      1) 위 링크에서 CUDA11/12 중 현재 인스톨된 버전으로 zip 파일을 다운 받아 압축을 풉니다.
      2) 파일들을 Faster-Whisper 실행 폴더 또는 윈도우 System32로 옮겨줍니다.
      3) 윈도우를 재부팅하고 다시 Whisper를 실행해보세요.

  • @king_mandoo
    @king_mandoo Місяць тому +1

    Traceback (most recent call last):
    File "C:\Whisper-WebUI\app.py", line 10, in
    from modules.whisper.whisper_factory import WhisperFactory
    File "C:\Whisper-WebUI\modules\whisper\whisper_factory.py", line 6, in
    from modules.whisper.faster_whisper_inference import FasterWhisperInference
    File "C:\Whisper-WebUI\modules\whisper\faster_whisper_inference.py", line 16, in
    from modules.whisper.whisper_base import WhisperBase
    File "C:\Whisper-WebUI\modules\whisper\whisper_base.py", line 13, in
    from modules.uvr.music_separator import MusicSeparator
    File "C:\Whisper-WebUI\modules\uvr\music_separator.py", line 11, in
    from uvr.models import MDX, Demucs, VrNetwork, MDXC
    File "C:\Whisper-WebUI\venv\lib\site-packages\uvr\models.py", line 9, in
    from .models_dir.mdx import mdx_interface as mdx_api
    File "C:\Whisper-WebUI\venv\lib\site-packages\uvr\models_dir\mdx\mdx_interface.py", line 10, in
    from onnx import load
    File "C:\Whisper-WebUI\venv\lib\site-packages\onnx\__init__.py", line 77, in
    from onnx.onnx_cpp2py_export import ONNX_ML
    ImportError: DLL load failed while importing onnx_cpp2py_export: DLL 초기화 루틴을 실행할 수 없습니다.
    "launching the app"
    계속하려면 아무 키나 누르십시오 . . . 무슨 문제인지 모르겠습니다ㅠ

    • @tonicmusic-studio
      @tonicmusic-studio  Місяць тому

      휘스퍼 깃허브 이슈란을 보니 최근 뜨는 오류같습니다.
      github.com/jhj0517/Whisper-WebUI/issues/285
      기존 설치했던 폴더는 전부 삭제해 주시고 다시 휘스퍼 리소스를 다운받습니다.
      휘스퍼 폴더에 requirements.txt 파일을 메모장으로 열어주고
      onnx==1.13.1
      onnxruntime-gpu==1.15.1
      이렇게 두 줄을 추가해주세요.그 다음 다시 install.bat으로 설치한 후 start-webui.bat을 실행해보시겠어요.

  • @rlrhkd
    @rlrhkd 3 місяці тому +1

    설치중에 위 오류가 뜨면서 설치가 안됩니다 Creating venv...
    Pythonchecked the venv folder. now installing requirements..
    지정된 경로를 찾을 수 없습니다.
    'pip'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
    배치 파일이 아닙니다.
    Requirements installation failed. please remove venv folder and run install.bat again.
    계속하려면 아무 키나 누르십시오 . . . 해결 방법이 없을까요??

    • @tonicmusic-studio
      @tonicmusic-studio  3 місяці тому +1

      파이썬이 제대로 안깔린 것 같은데 혹시 영상 6:04에 있는 Add Python 3.10 to PATH에 체크하고 인스톨하셨나요.

    • @rlrhkd
      @rlrhkd 3 місяці тому

      그 PATH는 이미 해놔서 체크를 안했는데 그거로도 이렇게 설치가 안되는건가요??

    • @tonicmusic-studio
      @tonicmusic-studio  3 місяці тому +1

      @@rlrhkd 이미 해놨다는 말씀이 어떤 뜻일까요? 이전에 설치를 해놓으셨을까요? 혹시 모르니 기존 파이썬 언인스톨하시고 새 파이썬깔 때 체크 후 다시 인스톨해보시겠어요.

    • @rlrhkd
      @rlrhkd 3 місяці тому

      @@tonicmusic-studio 아 네

  • @잠일세
    @잠일세 2 місяці тому

    오전에 열심히 타자했던 댓글이 사라졌네요.
    여러번 시도해보았습니다. 어쩌면 경로가 잘못된 건지는 모르겠는데
    start-webui 배치 파일 실행하면
    여러 글자가 나오고 결국은 지정된 모듈을 찾을 수 없다는 메시지가 뜨네요.
    어디서 잘못된걸까요?
    일단, 다시 설치를 위해서라도 whiper-webui 삭제를 하고 다시 깔고 싶기도 한데 삭제 방법을 모르겠네요.
    그냥 디렉토리 날리고 다시 설치를 해볼까요???

    • @tonicmusic-studio
      @tonicmusic-studio  2 місяці тому

      네 기존 폴더 지우시고 다시 재설치하시면 됩니다. 또 잘안되시면 오류 메시지 전체를 카피해 보여주세요.

    • @잠일세
      @잠일세 2 місяці тому

      @@tonicmusic-studio 네, 조금씩 발전은 한 거 같습니다. 이젠 설치되었고 webui 화면까지는 떴는데 실행과정에서 오류가 뜨네요.
      영상에서 보여주신대로 녹음하고서 그걸 자막 달기를 해도 오류가 뜨고 영상을 올려서 자막 작업을 해도 조금 지나면 오류가 뜹니다.
      용량의 문제일까 싶어 tiny로 실행해도 그러네요.
      프롬프트 화면의 오류 메시지는 이렇습니다.
      Error trnscribing file : Requested float 16 compute type, but the target device or backend do not support efficient float 16 computation.
      Traceback (most recent call last)
      File C:₩Whisper-WebUI-master₩venv₩lib₩site-packages₩gradio₩queueing. py" , line 527 , in process-events
      response = await route_utils,call_proecss_api(
      File C:₩Whisper-WebUI-master₩venv₩lib₩site-packages₩gradio₩route_utils. py" , line 270 , in call_process_api
      output = await app.get_blocks(), process_api(
      File C:₩Whisper-WebUI-master₩venv₩lib₩site-packages₩gradio₩blocks, py: , line 1856 , in process_api
      data = await self postprocess_data(fn_index, result["prediction"], state)

    • @잠일세
      @잠일세 2 місяці тому

      @@tonicmusic-studio 계속 이어갈께요. 저기 다음에
      File C:₩Whisper-WebUI-master₩venv₩lib₩site-packages₩gradio₩blocks, py" , line 1634, in postprocess_data
      self.validate_outputs(fn_index, predictions) # type: ignore
      File C:₩whisper-WebUI-master₩venv₩lib₩site-packages₩gradio₩blocks, py" , line 1610, in validate_outputs
      raise ValueError(
      Value Error: An event handler (transcribe_file) didn't receive enough output values (need: 2, received: 1)
      Wanted outputs:
      [ , ]
      Received outputs:
      [None]
      여기까지입니다.
      혹시 방법이 있을까요?

    • @잠일세
      @잠일세 2 місяці тому

      어렵게 타자했는데 사라지네요. ㅠㅠ
      다시 계속 이어서 타자할께요.
      File "C:₩Whisper-WebUI-master₩venv₩lib₩site-packages₩gradio₩blocks. py" , line 1634, in postprocess_data
      self. validate_outputs(fn_index, preditions) # type: ignore
      File "C:₩Whisper-webUI-master₩venv₩lib₩site-packages₩gradio₩blocks.py" , line 1610, in validate_outputs
      raise ValuError(

    • @잠일세
      @잠일세 2 місяці тому

      어렵게 타자했는데 사라지네요. ㅠㅠ
      다시 계속 이어서 타자할께요.
      File "C:₩Whisper-WebUI-master₩venv₩lib₩site-packages₩gradio₩blocks. py" , line 1634, in postprocess_data
      self. validate_outputs(fn_index, preditions) # type: ignore
      File "C:₩Whisper-webUI-master₩venv₩lib₩site-packages₩gradio₩blocks.py" , line 1610, in validate_outputs

  • @fragen-eg4po
    @fragen-eg4po 3 місяці тому

    설치영상 올려주셔서 감사합니다. 설치자체는 어찌해서 됬는데 번역이 좀 이상합니다. 예를 들어 1시간짜리 영화경우 20분정도는 자막번역이 잘되어있는데 그이후부터는 똑같은 일정 글자나 단어만 계속 출력되어 나옵니다. 혹시 이문제를 해결할 방법을 아시는지요?

    • @tonicmusic-studio
      @tonicmusic-studio  3 місяці тому

      말씀하신 증상을 위스퍼에서 오디오 무음을 감지할 때 나타나는 현상으로 Hallucination(환각) 현상이라고 합니다. 최신 버전 위스퍼에서 보시면 VAD 옵션이 있는데 Silero VAD를 체크해주고 생성해주면 위 증상이 줄어드는 것을 볼 수 있습니다. 위스퍼가 아직 완전한 프로그램은 아니라서 여러 변수가 있는 것 같습니다.

    • @fragen-eg4po
      @fragen-eg4po 3 місяці тому

      @@tonicmusic-studio VAD를 켜고 작동시켜보니 완벽하진 않지만 문제가 상당부분 해결되었네요. 정말 감사합니다. 혹시 위스퍼 자막생성작업중에 다른 음악이나 영상같은걸 동시틀고 작업하면 음성인식을 못한다던가, 해당작업에 영향이 가나요? 내부마이크로 인식하고 자막을 만드는것이니 혹시나 해서 질문드려봅니다.

    • @tonicmusic-studio
      @tonicmusic-studio  3 місяці тому

      @@fragen-eg4po 녹음된 오디오로 자막 생성 시 다른 오디오 작업을 해도 무관합니다. 다만, 영상의 경우는 그래픽 카드 리소스를 쓰기 때문에 추출 속도에 살짝 영향을 줄 순 있습니다.

  • @백종민-c7q
    @백종민-c7q Місяць тому

    계속 cmd 에서 막힙니다. C:\Windows\System32\git>git clone
    fatal: You must specify a repository to clone. 이렇게 뜨고 있는데 이것을 어떻게 해결해야 될지 모르겠네요.

    • @tonicmusic-studio
      @tonicmusic-studio  Місяць тому

      cmd에서 git clone github.com/jhj0517/Whisper-WebUI.git 이렇게 실행하셨을까요?

  • @sdjo224
    @sdjo224 6 місяців тому +1

    그대로 따라 헀는데 start-webui 배치 파일 실행했더니 아래와 같은 메시지가 뜨는데 업데이트 해야하나요?
    To create a public link, set `share=True` in `launch()`.
    IMPORTANT: You are using gradio version 4.14.0, however version 4.29.0 is available, please upgrade.

    • @tonicmusic-studio
      @tonicmusic-studio  6 місяців тому

      gradio 업글 안하고 구동하셔도 잘 작동합니다. 해보시고 안되면 댓글 주시겠어요.

  • @AaAq-n5p
    @AaAq-n5p 3 місяці тому

    안녕하세요 영상 너무 감사합니다 혹시 자막의 길이를 조절하는 설정값을 알 수 있을까요? 30자씩 출력되는 자막을 15자 이내로 만들고 싶습니다

    • @tonicmusic-studio
      @tonicmusic-studio  3 місяці тому

      안녕하세요. Whisper webUI내에 별도로 자막 길이를 조절하는 옵션은 없는 것으로 알고 있습니다. 대신, 최신 버전을 보시면 VAD(Voice Activity Detector) 옵션이 추가되었습니다. 여기서 Enable Silero VAD Filter를 체크해주시고 "Minimum Silence Duration(ms)"값을 줄이고 "Speech Padding(ms)" 값은 늘려줘 보시겠어요.

  • @조경목-l5y
    @조경목-l5y 2 місяці тому

    안녕하세요. 제가 컴퓨터 RTX3060i 인데 파이썬 버전 어느것을 다운로드 해야 되나요 윈도우 10입니다. 설치해도 에러뜨고 안되는데 어떻게 해야 작동되나요.

    • @tonicmusic-studio
      @tonicmusic-studio  2 місяці тому

      파이썬 버전은 3.8 ~ 3.10을 사용하시면 되는데 제 경우는 3.10.6을 주로 사용합니다. 파이썬 외에 CUDA 툴킷도 설치하셔야 하면 최근 버전은 일부 누락된 dll 파일을 카피해줘야 작동합니다. 에러 메시지 전체를 카피해 알려주세요.

  • @deliquo7688
    @deliquo7688 4 місяці тому

    영상파일에서 자막을 추출하는데 영상의 절반이상이 같은 문장으로 나오는데 왜그럴까요?;; large, large-v3 등으로 해봐도 같은증상입니다.

    • @tonicmusic-studio
      @tonicmusic-studio  4 місяці тому

      저도 가끔 그런 경우가 있는데 영어가 아닌 언어에서 그런 현상이 있다고 합니다. 보이스 레벨이 낮으면 그럴 수도 있다고 하니 음악을 줄여주거나 무음과 구분이 잘 되게 레벨을 올려줘 보시겠어요.

  • @KeepThe_Faith
    @KeepThe_Faith 2 місяці тому

    여기서 영상 잘보고 겨우 깔았는데요..
    자막이 전부다 느낌표 !!!!!!!!!!!!
    이렇게 나오는 이유가 뭘까요??
    다른 파일들로 몇번을 해봐도 같은 결과네요..
    뭐가 문제일까요???

    • @tonicmusic-studio
      @tonicmusic-studio  2 місяці тому

      저장된 오디오 포맷이 잘못됐을 경우 그런 현상이 날 수 있다고 합니다. 샘플 레이트를 16비트로 해서 해보시겠어요.

    • @KeepThe_Faith
      @KeepThe_Faith 2 місяці тому

      @@tonicmusic-studio 샘플레이트 수정은 어디서 해야되는건지요??? 시스템 - 소리에서 설정하는건 해봤습니다..
      그래도 계속 !!!! 만 나오네요..

    • @tonicmusic-studio
      @tonicmusic-studio  2 місяці тому

      @@KeepThe_Faith 작업에 사용하신 오디오 파일을 tonicz@empal.com 으로 보내줘 보시겠어요.

    • @KeepThe_Faith
      @KeepThe_Faith 2 місяці тому

      @@tonicmusic-studio 자세한 답변 정말 감사드리구요..
      어떤 음성파일이나 동영상 파일로 해봐도 계속 느낌표 파티만 하고 있네요..
      깐 프로그램 다 지우고 다시 한번 설치해 봐야겠네요..

    • @tonicmusic-studio
      @tonicmusic-studio  2 місяці тому

      @@KeepThe_Faith 별말씀을요.^^ 한 번 해보시고 알려주세요.

  • @NK-vy9fb
    @NK-vy9fb 4 дні тому

    이건 일본어는 인식 못하나요?

  • @user-8669
    @user-8669 2 місяці тому

    제컴사향 i5 9500 3.0 입니다 gtx1070 구매하면 가능할까요

    • @tonicmusic-studio
      @tonicmusic-studio  2 місяці тому

      gtx 시리즈는 구형이다 보니 지원하는지는 잘 모르겠습니다. 지원하더라도 속도가 느릴 수 있으므로 안전하게 rtx30 시리즈 이상을 추천합니다. 참고로 저는 rtx3070 8GB를 사용하고 있습니다만, AI 작업엔 비디오 카드 메모리가 넉넉한 것이 좋습니다. 여유가 되신다면 8GB보다는 12GB나 16GB를 지원하는 카드를 추천합니다.

  • @jtk5842
    @jtk5842 Місяць тому

    start web ui 실행하니 IP주소는 안나오고 트레이트백이라고 하면서 아무키나 누르라고 하니 꺼지네요

    • @tonicmusic-studio
      @tonicmusic-studio  Місяць тому

      커맨드 창에 뜨는 오류를 알려줘 보시겠어요.

    • @jtk5842
      @jtk5842 Місяць тому

      @@tonicmusic-studio
      FileNotFoundError: Could not find module 'C:\Users\Administrator\Downloads\Whisper-WebUI\venv\Lib\site-packages\torchaudio\lib\libtorchaudio.pyd' (or one of its dependencies). Try using the full path with constructor syntax.
      "launching the app"

    • @tonicmusic-studio
      @tonicmusic-studio  Місяць тому

      @@jtk5842 새 버전에서 dll 라이브러리가 없어서 뜨는 오류 같습니다.
      github.com/Purfview/whisper-standalone-win/releases/tag/libs
      1) 위 링크에서 CUDA11/12 중 현재 인스톨된 버전으로 zip 파일을 다운 받아 압축을 풉니다.
      2) 파일들을 Faster-Whisper 실행 폴더 또는 윈도우 System32로 옮겨줍니다.
      3) 윈도우를 재부팅하고 다시 Whisper를 실행해보세요.
      해보시고 안되면 얘기해주세요.

    • @jtk5842
      @jtk5842 Місяць тому

      @@tonicmusic-studio
      FileNotFoundError: Could not find module 'C:\Users\Administrator\Downloads\Whisper-WebUI\venv\Lib\site-packages\torchaudio\lib\libtorchaudio.pyd' (or one of its dependencies). Try using the full path with constructor syntax.
      "launching the app"
      다시 해봐도 그대로 나오네요 ㅠㅠ

    • @tonicmusic-studio
      @tonicmusic-studio  Місяць тому

      댓글로는 설명이 어려워 간단하게 영상으로 만들어 봤습니다. 이 방법으로 해보시고 안되면 알려주세요.
      ua-cam.com/video/Bh-3UDF-sj8/v-deo.html

  • @user-8669
    @user-8669 2 місяці тому

    cuda_12.6.0_560.76_windows 설치시 모니터프로세스 ID 2328 프로그램 설치가 안대요 그래픽 RX-570 8G입니다

    • @tonicmusic-studio
      @tonicmusic-studio  2 місяці тому

      Whisper Webui를 윈도우에서 사용하려면 엔비디아 그래픽 카드(구형은 안될 수도 있습니다)만 지원합니다. 리눅스를 쓰면 AMD 카드를 쓸 수 있다고는 하나 설치가 까다롭습니다. 사용하시려면 그래픽 카드를 바꾸셔야 합니다.

    • @호시노아이러버
      @호시노아이러버 2 місяці тому

      님이 쓰는 그래픽카드는 AMD 란 회사에서 제조한 것으로 호환이 불가합니다.

    • @user-8669
      @user-8669 2 місяці тому

      @@tonicmusic-studio 제컴사향 i5 9500 3.0 입니다 gtx1070 구매하면 가능할까요

  • @user-playmaker
    @user-playmaker 3 місяці тому

    To create a public link, set `share=True` in `launch()`.
    Error transcribing file: 'NoneType' object is not iterable
    Traceback (most recent call last):
    File "D:\Whisper-WebUI\venv\lib\site-packages\gradio\queueing.py", line 527, in process_events
    response = await route_utils.call_process_api(
    File "D:\Whisper-WebUI\venv\lib\site-packages\gradio
    oute_utils.py", line 270, in call_process_api
    output = await app.get_blocks().process_api(
    File "D:\Whisper-WebUI\venv\lib\site-packages\gradio\blocks.py", line 1847, in process_api
    result = await self.call_function(
    File "D:\Whisper-WebUI\venv\lib\site-packages\gradio\blocks.py", line 1433, in call_function
    prediction = await anyio.to_thread.run_sync(
    File "D:\Whisper-WebUI\venv\lib\site-packages\anyio\to_thread.py", line 56, in run_sync
    return await get_async_backend().run_sync_in_worker_thread(
    File "D:\Whisper-WebUI\venv\lib\site-packages\anyio\_backends\_asyncio.py", line 2177, in run_sync_in_worker_thread
    return await future
    File "D:\Whisper-WebUI\venv\lib\site-packages\anyio\_backends\_asyncio.py", line 859, in run
    result = context.run(func, *args)
    File "D:\Whisper-WebUI\venv\lib\site-packages\gradio\utils.py", line 805, in wrapper
    response = f(*args, **kwargs)
    File "D:\Whisper-WebUI\modules\whisper\whisper_base.py", line 214, in transcribe_file
    self.remove_input_files([file.name for file in files])
    TypeError: 'NoneType' object is not iterable
    이렇게 나옵니다 뭐가 문제일까요 ?ㅠ

    • @tonicmusic-studio
      @tonicmusic-studio  3 місяці тому

      혹시 용량이 큰 파일을 업로드 하셨나요. 그럴 경우 뜨는 에러라고 하는데 딱히 해결법이 있는거 같진 않습니다.
      github.com/jhj0517/Whisper-WebUI/issues/128

  • @박성진-q4v
    @박성진-q4v 10 днів тому

    토닉뮤직님
    Ai자막이 너무 필요해서 여기에라도 보실까 답글 남겨봅니다
    저번에 whisper ai에서 설명해주신대로 다 따라하고 설치까지 했는데 마지막에
    Use "faster-whisper" implementation
    Device "cuda" is detected
    정보: 제공된 패턴에 해당되는 파일을 찾지 못했습니다.
    * Running on local URL: 127.0.0.1:7860
    To create a public link, set `share=True` in `launch()`.
    이렇게 뜹니다.. ㅠㅠ
    제발 해결방법좀 알려주십쇼..

    • @tonicmusic-studio
      @tonicmusic-studio  9 днів тому

      안녕하세요. 최신 버전에서 보내주신 문구가 뜨는데 그냥 주소 누르시고 실행하시면 됩니다. 제 경우는 쿠다 메모리 에러도 뜨는데 번역은 문제없이 작동했습니다. 한번 실행해보시고 알려주세요.

    • @박성진-q4v
      @박성진-q4v 9 днів тому

      ​@@tonicmusic-studio넵넵!!

    • @박성진-q4v
      @박성진-q4v 9 днів тому

      ​@@tonicmusic-studio 방금 파일 넣고 해봤는데 결과물에 error 이라는 말만 뜨고 실행자체가 안됩니다.. ㅠㅠ

    • @박성진-q4v
      @박성진-q4v 9 днів тому

      ​@@tonicmusic-studioㅠㅠㅠ 어떻게 해야할까요..

    • @tonicmusic-studio
      @tonicmusic-studio  9 днів тому

      에러 메시지 전체를 카피해서 보여주세요.