使用 OpenAI Whisper 製作影音的字幕或逐字稿

Gwo-Shyong Yan

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 6 вер 2024
利用本影片中，放在 Google Colab 的 Python 程式，可以下載並安裝 OpenAI 的 Whisper ，以它來將影片或聲音檔案進行自動語音辨識，轉換為文字後儲存為字幕檔案或是逐字稿並下載。
Blogger :
gsyan888.blogs...
Google Colab 筆記本的網址如下：
* v.2 版增強了一些功能:
tinyurl.com/gs...
* 影片中的是舊版:
tinyurl.com/gs...

КОМЕНТАРІ • 25

@timanddan30 Рік тому
非常實用，感謝分享！
@gsyan888 Рік тому ⁺¹
您好，
很高興知道分享的工具對您有所助益。祝您的節目製作順暢，閱聽眾持續增長 ^_^
@zoeychang9805 Рік тому
簡單好用！👏
@User-Saintan 3 місяці тому
謝謝版主黑皮，這幾天找了很久的影片，要使用wishper ai 結果只有您的最符合需求。
這邊有幾個問題想請教：
1.我上傳超過1G以上的影片至谷歌提供的暫存區，接著將完整檔名複製後，貼上您說的ul 區域，但卻無法把影片的語音轉譯成文字
2.接著，我將影片上傳至yt ，再貼上yt 網址，就成功了。
問題一：不知道我上面的1. 是出什麼問題？
問題二：版主的文章有說，如果另存副本，那還是可以用，只是不會儲存，但好處是會使用到最新的語言模組，這裡我是想請問，版主是會固定更新這套模組供有緣人使用嗎？
謝謝回答，感恩您
@gsyan888 3 місяці тому ⁺¹
您好，關於您的問題
Q一:
因為不知您所謂的「完整檔名」指的是什麼，無法確定，建議是由左側欄暫存區的清單中，看到檔案名稱，按檔名右側的點點，會有複複路徑的選項。
另外，如果檔案很大，在按下執行鈕前，得先確認檔案已經上載完畢哦! 不然，Whisper 抓到的可能是不完整的影音檔，就一定會失敗了。
Q2:
無論是有沒有建立副本，在 Python 的程序中，我都是讓它去抓取最新版的 OpenAI Whisper 專案來安裝使用；有差別的地方是，如果建立了您自己的副本，我寫的安裝、執行程序就只會停留在儲存副本那時刻的版本，如果我有再修改過 Colab 中的程序，副本就不會跟著更新，想用改過的程序，就必須重新由我提供的網址，再重新建立副本了。當然囉~ 除非有重大的問題，我不會隨意更動內容的(哈！沒那麼閒的！)，但是有異動，我會在 Blogger 文章中記錄，也就是，歡迎有空到我的 Blogger 逛逛，看看有沒有寶可挖 ^_^
@User-Saintan 3 місяці тому
謝謝版主回覆
問題已經解決
目前只有遇到一個問題就是google 說我的使用量超過了，要我付費，哈哈
@gsyan888 3 місяці тому ⁺¹
您好，
因為 AI 的程式需要使用 GPU 才會快，而免費版一天最多只有12個小時可以使用，確定不再使用時，記得在上方主選單中按「執行階段」--> 「中斷連線並刪除執行階段」，再關掉瀏覽器的分頁，這樣子可以確保立即不使用 GPU 了；不然，有時會白浪費額度了。
當然囉~ 如果使用量大、且常用，花一點小錢升級為 Pro 也是值得的。再不然，自己的電腦有 GPU，安裝在自己的電腦的執行是更好。
@User-Saintan 3 місяці тому
謝謝版主黑皮回覆，十分感謝。謝謝你上傳這麼好的軟體還回覆問題！
祝你一生好運👍
@user-zp2nk5gb8v Рік тому ⁺¹
我試過雲端硬碟失敗.請問雲端硬碟如何做
@minachen4271 Рік тому
您好，想請問一下您使用medium模型的心得，覺得轉換中文字幕的正確率高嗎? 以及費用高嗎 ?
另外想再問問看您有沒有轉換過英文語音的文字檔呢~? 謝謝分享。
@gsyan888 Рік тому ⁺¹
您好，
使用資訊工具有個好處，期待什麼結果，能不能達到自己的期待，試過了便知道，何不自己試一下呢？
照目前的設定，有啟用 Colab 的 GPU，即使用 larg，五分鐘的影音，頂多兩分鐘左右就能知道結果了。
@gsyan888 Рік тому ⁺¹
對了，忘了回答費用的問題，使用影片中的這個，一毛錢都不用花哦~
@Thermal-3 Рік тому
@Gwo-Shyong Yan 新版的好像在獲取 URL 時出現了 Bug 想問大大可不可以修復這個問題？謝謝
@gsyan888 Рік тому ⁺¹
您好，
謝謝提醒，剛剛去看了一下，Whisper 的專案這兩天加了新的參數，以致語法上必須修正後才能使用。已經更新好了，請重新建立副本以後就可以正常使用。
@Thermal-3 Рік тому
@@gsyan888 太感謝您了!!
@leoeamon2220 Рік тому
@@gsyan888 謝謝
@stockdisk Рік тому
請問如果我一直上傳失敗，是因為檔案太大導致嗎？若是我掛載自己的雲端硬碟，然後上傳檔案到雲端硬碟上，在url 的地方，也是可以一樣只填檔名嗎？
非常謝謝～
@gsyan888 Рік тому
您好，個人只試過一個多小時的音檔，檔案大小大概70MB左右，沒測試過到底能上載多大的檔案。如果您的檔案已放在雲端硬碟，並且掛載好了，在 Colab 左邊側欄中有一個「檔案」，展開以後，像使用檔案總管一樣，一層層找到檔案，最後對準該影音檔的檔名旁的「三個點點」按一下，出現選單，再點選「複製路徑」來取得路徑，全整的路徑會類似「/content/gdrive/My Drive/......」一長串，而不是只有原始檔名。
@stockdisk Рік тому
@@gsyan888 那是我判斷錯誤嗎？我上傳的檔案只有30MB，應該不大，但是上傳完，檔案後面會出現一個紅色圈圈⭕️，但是在檔案列表卻沒有看到，請問這樣算是上傳成功還是失敗？謝謝您🙏
@gsyan888 Рік тому
如果您不介意的話，要不要檔案分享給我試試?
我的 gmail 帳號與 UA-cam 的同名。
@gsyan888 Рік тому
@stockdisk 您好，檔案測試過，可以正常上載並辨識，以 large 模式，不到12分鐘可辨識完。
前面我都忘了問，您使用的是否為最新的程式?
最近一次更新是 2023-06-11 的 v2，短網址如下:
tinyurl.com/gsyan-whisper2
相關的說明在我 Blogger 的文章中有:
gsyan888.blogspot.com/2023/02/openai-whisper-ipynb.html
@stockdisk Рік тому
@@gsyan888 感謝您的測試，我是用第二版沒錯，直接拖拉檔案最後就會失敗找不到檔案，後來改用掛載Google Drive的方式有成功開始辨識，造成您的麻煩，不好意思，也謝謝您～
@user-ef7gm4zs5n Рік тому
請問這程式是Colab 付費產品 ?
@gsyan888 Рік тому
您好，
OpenAI 的 Whisper 是開源的免費專案，我只是利用 Colab 的環境，寫了個安裝的程序，搭配其它開源的工具，並提供一個簡易的輸入、輸出界面。它完全是免費的。詳細說明請展開這影片的完整資訊，裡面有我 Blogger 文章的連結。

Наступне

Автоматичне відтворення

"How to give GPT my business knowledge?" - Knowledge embedding 101