使用 Faster Whisper 製作影音的字幕或逐字稿

Поділитися
Вставка
  • Опубліковано 7 лис 2023
  • 利用本影片中,放在 Google Colab 的 Python 程式,可以自動安裝 Faster Whisper ,並將指定的影片或聲音檔案進行自動語音辨識,轉換為文字後儲存為字幕檔案或是逐字稿後下載。
    工具的網址及簡單介紹在這個網址中:
    gsyan888.blogspot.com/2023/11...

КОМЕНТАРІ • 11

  • @mason3551
    @mason3551 6 місяців тому

    好用 推一個

  • @magician789
    @magician789 4 місяці тому

    感謝您分享好用的工具
    現在好像有出到large v3,更精準
    請問有辦法更新到這個版本嗎?

    • @gsyan888
      @gsyan888  4 місяці тому

      您好,
      本影片之前有人問過類似的問題,我有回覆過哦!請您往下找一下。

  • @hongweiwang781
    @hongweiwang781 8 місяців тому

    我一直在使用您的OpenAI-Whisper-語音辨識-製作字幕檔-v2.ipynb,请问怎么能使用Whisper large-v3模型?谢谢!

    • @gsyan888
      @gsyan888  8 місяців тому

      您好,
      建議您參考一下 OpenAI Whisper 專案這個原始碼:
      github.com/openai/whisper/blob/main/whisper/__init__.py
      看起來,現在可以在 model 的參數中使用 large-v3 來指定要使用 large-v3 的模型了。
      不過我放在 Colab 中的 Faster Whisper ,預設就是使用 large-v3 。
      另外,看了一下 large-v2 , large-v3 的比較圖,中文的辨識差異倒是不大。

    • @gsyan888
      @gsyan888  8 місяців тому

      我測試了一下,其實如果您用的是我的 v2.ipynb,它現在的 large 其實就是 large-v3,反而是想使用原來的 large-v2 要特別指定。
      好壞則是看需求,像我這支影片會被 v3 辨識為簡體字,得要加上 initial_prompt 的參數才能輸出為繁體字,然後「逐字稿」會被譯為「竹字稿」,「Colab」會被譯為「Corelab」,v2 的正確率反而比較高;所以可能要自己選擇合適的模型。

    • @hongweiwang781
      @hongweiwang781 8 місяців тому

      谢谢您的答疑!@@gsyan888

  • @raymondchanneltv
    @raymondchanneltv 6 місяців тому

    如果講廣東話可以转文字?

    • @gsyan888
      @gsyan888  6 місяців тому

      您好,
      抱歉,我不會講廣東話,無法測試。不過,像這種操作型的工具,能不能,可不可以?自己試試看,應該就知道答案了,歡迎試過後,告訴大家效果如何。 ^_^

  • @EdwardXu-e5x
    @EdwardXu-e5x 7 днів тому

    为什么您的网站打不开?

    • @gsyan888
      @gsyan888  7 днів тому

      您好,我這邊檢查過了,無論是 Blogger 或是 Google Colab 都是沒問題的哦!