使用 OpenAI Whisper 製作影音的字幕或逐字稿

Поділитися
Вставка
  • Опубліковано 6 вер 2024
  • 利用本影片中,放在 Google Colab 的 Python 程式,可以下載並安裝 OpenAI 的 Whisper ,以它來將影片或聲音檔案進行自動語音辨識,轉換為文字後儲存為字幕檔案或是逐字稿並下載。
    Blogger :
    gsyan888.blogs...
    Google Colab 筆記本的網址如下:
    * v.2 版增強了一些功能:
    tinyurl.com/gs...
    * 影片中的是舊版:
    tinyurl.com/gs...

КОМЕНТАРІ • 25

  • @timanddan30
    @timanddan30 Рік тому

    非常實用,感謝分享!

    • @gsyan888
      @gsyan888  Рік тому +1

      您好,
      很高興知道分享的工具對您有所助益。祝您的節目製作順暢,閱聽眾持續增長 ^_^

  • @zoeychang9805
    @zoeychang9805 Рік тому

    簡單好用!👏

  • @User-Saintan
    @User-Saintan 3 місяці тому

    謝謝版主黑皮,這幾天找了很久的影片,要使用wishper ai 結果只有您的最符合需求。
    這邊有幾個問題想請教:
    1.我上傳超過1G以上的影片至谷歌提供的暫存區,接著將完整檔名複製後,貼上您說的ul 區域,但卻無法把影片的語音轉譯成文字
    2.接著,我將影片上傳至yt ,再貼上yt 網址,就成功了。
    問題一:不知道我上面的1. 是出什麼問題?
    問題二:版主的文章有說,如果另存副本,那還是可以用,只是不會儲存,但好處是會使用到最新的語言模組,這裡我是想請問,版主是會固定更新這套模組供有緣人使用嗎?
    謝謝回答,感恩您

    • @gsyan888
      @gsyan888  3 місяці тому +1

      您好,關於您的問題
      Q一:
      因為不知您所謂的「完整檔名」指的是什麼,無法確定,建議是由左側欄暫存區的清單中,看到檔案名稱,按檔名右側的點點,會有複複路徑的選項。
      另外,如果檔案很大,在按下執行鈕前,得先確認檔案已經上載完畢哦! 不然,Whisper 抓到的可能是不完整的影音檔,就一定會失敗了。
      Q2:
      無論是有沒有建立副本,在 Python 的程序中,我都是讓它去抓取最新版的 OpenAI Whisper 專案來安裝使用;有差別的地方是,如果建立了您自己的副本,我寫的安裝、執行程序就只會停留在儲存副本那時刻的版本,如果我有再修改過 Colab 中的程序,副本就不會跟著更新,想用改過的程序,就必須重新由我提供的網址,再重新建立副本了。當然囉~ 除非有重大的問題,我不會隨意更動內容的(哈!沒那麼閒的!),但是有異動,我會在 Blogger 文章中記錄,也就是,歡迎有空到我的 Blogger 逛逛,看看有沒有寶可挖 ^_^

    • @User-Saintan
      @User-Saintan 3 місяці тому

      謝謝版主回覆
      問題已經解決
      目前只有遇到一個問題就是google 說我的使用量超過了,要我付費,哈哈

    • @gsyan888
      @gsyan888  3 місяці тому +1

      您好,
      因為 AI 的程式需要使用 GPU 才會快,而免費版一天最多只有12個小時可以使用,確定不再使用時,記得在上方主選單中按「執行階段」--> 「中斷連線並刪除執行階段」,再關掉瀏覽器的分頁,這樣子可以確保立即不使用 GPU 了;不然,有時會白浪費額度了。
      當然囉~ 如果使用量大、且常用,花一點小錢升級為 Pro 也是值得的。再不然,自己的電腦有 GPU,安裝在自己的電腦的執行是更好。

    • @User-Saintan
      @User-Saintan 3 місяці тому

      謝謝版主黑皮回覆,十分感謝。謝謝你上傳這麼好的軟體還回覆問題!
      祝你一生好運👍

  • @user-zp2nk5gb8v
    @user-zp2nk5gb8v Рік тому +1

    我試過雲端硬碟失敗.請問雲端硬碟如何做

  • @minachen4271
    @minachen4271 Рік тому

    您好,想請問一下您使用medium模型的心得,覺得轉換中文字幕的正確率高嗎? 以及費用高嗎 ?
    另外想再問問看您有沒有轉換過英文語音的文字檔呢~? 謝謝分享。

    • @gsyan888
      @gsyan888  Рік тому +1

      您好,
      使用資訊工具有個好處,期待什麼結果,能不能達到自己的期待,試過了便知道,何不自己試一下呢?
      照目前的設定,有啟用 Colab 的 GPU,即使用 larg,五分鐘的影音,頂多兩分鐘左右就能知道結果了。

    • @gsyan888
      @gsyan888  Рік тому +1

      對了,忘了回答費用的問題,使用影片中的這個,一毛錢都不用花哦~

  • @Thermal-3
    @Thermal-3 Рік тому

    @Gwo-Shyong Yan 新版的好像在獲取 URL 時出現了 Bug 想問大大可不可以修復這個問題?謝謝

    • @gsyan888
      @gsyan888  Рік тому +1

      您好,
      謝謝提醒,剛剛去看了一下,Whisper 的專案這兩天加了新的參數,以致語法上必須修正後才能使用。已經更新好了,請重新建立副本以後就可以正常使用。

    • @Thermal-3
      @Thermal-3 Рік тому

      @@gsyan888 太感謝您了!!

    • @leoeamon2220
      @leoeamon2220 Рік тому

      @@gsyan888 謝謝

  • @stockdisk
    @stockdisk Рік тому

    請問如果我一直上傳失敗,是因為檔案太大導致嗎?若是我掛載自己的雲端硬碟,然後上傳檔案到雲端硬碟上,在url 的地方,也是可以一樣只填檔名嗎?
    非常謝謝~

    • @gsyan888
      @gsyan888  Рік тому

      您好,個人只試過一個多小時的音檔,檔案大小大概70MB左右,沒測試過到底能上載多大的檔案。如果您的檔案已放在雲端硬碟,並且掛載好了,在 Colab 左邊側欄中有一個「檔案」,展開以後,像使用檔案總管一樣,一層層找到檔案,最後對準該影音檔的檔名旁的「三個點點」按一下,出現選單,再點選「複製路徑」來取得路徑,全整的路徑會類似「/content/gdrive/My Drive/......」一長串,而不是只有原始檔名。

    • @stockdisk
      @stockdisk Рік тому

      @@gsyan888 那是我判斷錯誤嗎?我上傳的檔案只有30MB,應該不大,但是上傳完,檔案後面會出現一個紅色圈圈⭕️,但是在檔案列表卻沒有看到,請問這樣算是上傳成功還是失敗?謝謝您🙏

    • @gsyan888
      @gsyan888  Рік тому

      如果您不介意的話,要不要檔案分享給我試試?
      我的 gmail 帳號與 UA-cam 的同名。

    • @gsyan888
      @gsyan888  Рік тому

      @stockdisk 您好,檔案測試過,可以正常上載並辨識,以 large 模式,不到12分鐘可辨識完。
      前面我都忘了問,您使用的是否為最新的程式?
      最近一次更新是 2023-06-11 的 v2,短網址如下:
      tinyurl.com/gsyan-whisper2
      相關的說明在我 Blogger 的文章中有:
      gsyan888.blogspot.com/2023/02/openai-whisper-ipynb.html

    • @stockdisk
      @stockdisk Рік тому

      @@gsyan888 感謝您的測試,我是用第二版沒錯,直接拖拉檔案最後就會失敗找不到檔案,後來改用掛載Google Drive的方式有成功開始辨識,造成您的麻煩,不好意思,也謝謝您~

  • @user-ef7gm4zs5n
    @user-ef7gm4zs5n Рік тому

    請問 這程式是Colab 付費產品 ?

    • @gsyan888
      @gsyan888  Рік тому

      您好,
      OpenAI 的 Whisper 是開源的免費專案,我只是利用 Colab 的環境,寫了個安裝的程序,搭配其它開源的工具,並提供一個簡易的輸入、輸出界面。它完全是免費的。詳細說明請展開這影片的完整資訊,裡面有我 Blogger 文章的連結。