使用 OpenAI Whisper 製作影音的字幕或逐字稿
Вставка
- Опубліковано 6 вер 2024
- 利用本影片中,放在 Google Colab 的 Python 程式,可以下載並安裝 OpenAI 的 Whisper ,以它來將影片或聲音檔案進行自動語音辨識,轉換為文字後儲存為字幕檔案或是逐字稿並下載。
Blogger :
gsyan888.blogs...
Google Colab 筆記本的網址如下:
* v.2 版增強了一些功能:
tinyurl.com/gs...
* 影片中的是舊版:
tinyurl.com/gs...
非常實用,感謝分享!
您好,
很高興知道分享的工具對您有所助益。祝您的節目製作順暢,閱聽眾持續增長 ^_^
簡單好用!👏
謝謝版主黑皮,這幾天找了很久的影片,要使用wishper ai 結果只有您的最符合需求。
這邊有幾個問題想請教:
1.我上傳超過1G以上的影片至谷歌提供的暫存區,接著將完整檔名複製後,貼上您說的ul 區域,但卻無法把影片的語音轉譯成文字
2.接著,我將影片上傳至yt ,再貼上yt 網址,就成功了。
問題一:不知道我上面的1. 是出什麼問題?
問題二:版主的文章有說,如果另存副本,那還是可以用,只是不會儲存,但好處是會使用到最新的語言模組,這裡我是想請問,版主是會固定更新這套模組供有緣人使用嗎?
謝謝回答,感恩您
您好,關於您的問題
Q一:
因為不知您所謂的「完整檔名」指的是什麼,無法確定,建議是由左側欄暫存區的清單中,看到檔案名稱,按檔名右側的點點,會有複複路徑的選項。
另外,如果檔案很大,在按下執行鈕前,得先確認檔案已經上載完畢哦! 不然,Whisper 抓到的可能是不完整的影音檔,就一定會失敗了。
Q2:
無論是有沒有建立副本,在 Python 的程序中,我都是讓它去抓取最新版的 OpenAI Whisper 專案來安裝使用;有差別的地方是,如果建立了您自己的副本,我寫的安裝、執行程序就只會停留在儲存副本那時刻的版本,如果我有再修改過 Colab 中的程序,副本就不會跟著更新,想用改過的程序,就必須重新由我提供的網址,再重新建立副本了。當然囉~ 除非有重大的問題,我不會隨意更動內容的(哈!沒那麼閒的!),但是有異動,我會在 Blogger 文章中記錄,也就是,歡迎有空到我的 Blogger 逛逛,看看有沒有寶可挖 ^_^
謝謝版主回覆
問題已經解決
目前只有遇到一個問題就是google 說我的使用量超過了,要我付費,哈哈
您好,
因為 AI 的程式需要使用 GPU 才會快,而免費版一天最多只有12個小時可以使用,確定不再使用時,記得在上方主選單中按「執行階段」--> 「中斷連線並刪除執行階段」,再關掉瀏覽器的分頁,這樣子可以確保立即不使用 GPU 了;不然,有時會白浪費額度了。
當然囉~ 如果使用量大、且常用,花一點小錢升級為 Pro 也是值得的。再不然,自己的電腦有 GPU,安裝在自己的電腦的執行是更好。
謝謝版主黑皮回覆,十分感謝。謝謝你上傳這麼好的軟體還回覆問題!
祝你一生好運👍
我試過雲端硬碟失敗.請問雲端硬碟如何做
您好,想請問一下您使用medium模型的心得,覺得轉換中文字幕的正確率高嗎? 以及費用高嗎 ?
另外想再問問看您有沒有轉換過英文語音的文字檔呢~? 謝謝分享。
您好,
使用資訊工具有個好處,期待什麼結果,能不能達到自己的期待,試過了便知道,何不自己試一下呢?
照目前的設定,有啟用 Colab 的 GPU,即使用 larg,五分鐘的影音,頂多兩分鐘左右就能知道結果了。
對了,忘了回答費用的問題,使用影片中的這個,一毛錢都不用花哦~
@Gwo-Shyong Yan 新版的好像在獲取 URL 時出現了 Bug 想問大大可不可以修復這個問題?謝謝
您好,
謝謝提醒,剛剛去看了一下,Whisper 的專案這兩天加了新的參數,以致語法上必須修正後才能使用。已經更新好了,請重新建立副本以後就可以正常使用。
@@gsyan888 太感謝您了!!
@@gsyan888 謝謝
請問如果我一直上傳失敗,是因為檔案太大導致嗎?若是我掛載自己的雲端硬碟,然後上傳檔案到雲端硬碟上,在url 的地方,也是可以一樣只填檔名嗎?
非常謝謝~
您好,個人只試過一個多小時的音檔,檔案大小大概70MB左右,沒測試過到底能上載多大的檔案。如果您的檔案已放在雲端硬碟,並且掛載好了,在 Colab 左邊側欄中有一個「檔案」,展開以後,像使用檔案總管一樣,一層層找到檔案,最後對準該影音檔的檔名旁的「三個點點」按一下,出現選單,再點選「複製路徑」來取得路徑,全整的路徑會類似「/content/gdrive/My Drive/......」一長串,而不是只有原始檔名。
@@gsyan888 那是我判斷錯誤嗎?我上傳的檔案只有30MB,應該不大,但是上傳完,檔案後面會出現一個紅色圈圈⭕️,但是在檔案列表卻沒有看到,請問這樣算是上傳成功還是失敗?謝謝您🙏
如果您不介意的話,要不要檔案分享給我試試?
我的 gmail 帳號與 UA-cam 的同名。
@stockdisk 您好,檔案測試過,可以正常上載並辨識,以 large 模式,不到12分鐘可辨識完。
前面我都忘了問,您使用的是否為最新的程式?
最近一次更新是 2023-06-11 的 v2,短網址如下:
tinyurl.com/gsyan-whisper2
相關的說明在我 Blogger 的文章中有:
gsyan888.blogspot.com/2023/02/openai-whisper-ipynb.html
@@gsyan888 感謝您的測試,我是用第二版沒錯,直接拖拉檔案最後就會失敗找不到檔案,後來改用掛載Google Drive的方式有成功開始辨識,造成您的麻煩,不好意思,也謝謝您~
請問 這程式是Colab 付費產品 ?
您好,
OpenAI 的 Whisper 是開源的免費專案,我只是利用 Colab 的環境,寫了個安裝的程序,搭配其它開源的工具,並提供一個簡易的輸入、輸出界面。它完全是免費的。詳細說明請展開這影片的完整資訊,裡面有我 Blogger 文章的連結。