【whisper】AI 語音轉文字神器|免費 精準 快速 | 字幕 上課 會議|mac

Поділитися
Вставка
  • Опубліковано 28 сер 2024
  • 幫助大家免費、精準,將錄音檔轉成文字
    可以運用在課堂錄音、會議記錄、影片上字幕
    *此影片是上一集影片的進階版,若希望翻譯的結果可以更精準,可以看此影片,利用python來進行翻譯;。
    若追求操作簡單、直覺,可以跟著本集影片下載軟體使用;若希望翻譯的結果可以更精準,可以到下集影片觀看喔~
    下集影片連結: • 【Whisper in Python】AI ...
    建議開啟CC字幕*

КОМЕНТАРІ • 43

  • @pinchiwu7142
    @pinchiwu7142 8 місяців тому +1

    太實用了!真的是紀錄人員的福音啊

  • @chia8695
    @chia8695 7 місяців тому +2

    好讚!謝謝分享💙

    • @DataCraftExplorers
      @DataCraftExplorers  7 місяців тому

      感謝您~~

    • @科技類產品找我
      @科技類產品找我 9 днів тому

      @@DataCraftExplorers 不一定是製作影片哦,還有一種合作方式很適合您的,最多耗時3分鐘。請問可以給個郵箱詳談嗎?

  • @user-ty5fp7hb9i
    @user-ty5fp7hb9i 8 місяців тому +1

    很實用!

  • @user-ok8ht2fs8y
    @user-ok8ht2fs8y 3 місяці тому +1

    謝謝妳

  • @PaulGaric
    @PaulGaric 5 місяців тому +1

    謝謝分享,請教如何在python設定分辯不同的人聲?我用python直接用whisper,但不知如何分辯人。

    • @DataCraftExplorers
      @DataCraftExplorers  5 місяців тому

      可以!我研究看看~

    • @DataCraftExplorers
      @DataCraftExplorers  5 місяців тому

      您是用這個github裡的方法嗎?github.com/MahmoudAshraf97/whisper-diarization
      我在做pip install -r requirements.txt時會報錯 ERROR: Could not find a version that satisfies the requirement triton (from nemo-toolkit) (from versions: none)
      ERROR: No matching distribution found for triton
      一直修不好,不知道您是不是跟我卡在同個地方QQ
      或著您是用別的方法,我可以來試試看~

  • @viviwuviviwu15
    @viviwuviviwu15 2 місяці тому

  • @mr2011vincent1
    @mr2011vincent1 Місяць тому

    如果內容是又中文又英文,或者其他語言,它輸出的字幕會不會不準確呢?

    • @DataCraftExplorers
      @DataCraftExplorers  Місяць тому

      我的實際使用情況覺得蠻準的,大部分是正確的,只有偶爾會有小錯誤~

  • @呂立中
    @呂立中 9 днів тому

    請問有Android(安卓版)的whisper嗎?
    謝謝

    • @DataCraftExplorers
      @DataCraftExplorers  8 днів тому

      可以參考我的頻道新發佈的【otterAI】那隻影片喔~
      功能差不多,可以在安卓系統使用~

  • @user-kz2he2dl9h
    @user-kz2he2dl9h 6 місяців тому

    仔細看了一下影片的時序 很多毫秒都是相同數值 還是常常不能精確斷時序出來

    • @DataCraftExplorers
      @DataCraftExplorers  6 місяців тому

      如果使用 Whisper Transcription 生成的 SRT 文件中存在毫秒级别相同的時序,這可能是因為 Whisper Transcription 在生成 SRT 文件時將時序進行了四捨五入,導致時序的精度丟失。要解決這個問題,你可以嘗試以下幾種方法:
      1. 付費升級:Whisper Transcription PRO
      2. 使用其他轉錄工具:Descript、Rev、Otter.ai、Happy Scribe
      3. 轉換時序格式:以下是一個使用 Python 的簡單示例,將 SRT 文件中的時序格式從「小時:分鐘:秒, 毫秒」轉換為「小時:分鐘:秒, 毫秒, 微秒」的範例(此段程式碼是在後面加上0)
      def convert_timestamp_format(input_file, output_file):
      with open(input_file, 'r') as f:
      lines = f.readlines()
      with open(output_file, 'w') as f:
      for line in lines:
      if ' --> ' in line:
      start, end = line.strip().split(' --> ')
      start_hms, start_ms = start.split(',')
      end_hms, end_ms = end.split(',')
      start += '000' # 添加三個零以表示微秒
      end += '000' # 添加三個零以表示微秒
      new_line = f"{start} --> {end}
      "
      f.write(new_line)
      else:
      f.write(line)
      input_file = 'input.srt'
      output_file = 'output.srt'
      convert_timestamp_format(input_file, output_file)

    • @DataCraftExplorers
      @DataCraftExplorers  5 місяців тому

      新影片出爐囉,可以更精準的辨識出毫秒數值,可以到資訊欄點連結觀看喔~
      新影片網址:ua-cam.com/video/23lS2NyZRCQ/v-deo.html

  • @ericchen5441
    @ericchen5441 5 місяців тому

    whisper transcription是否無法在Windows電腦系統中使用呢?

    • @DataCraftExplorers
      @DataCraftExplorers  5 місяців тому +1

      是的喔,在windows 可以下載WhisperDesktop這個軟體喔!
      未來也會出一集影片跟大家介紹~

  • @科技類產品找我
    @科技類產品找我 14 днів тому

    你好,可以給個郵箱嗎?想進行付費合作,推廣剪輯軟體

    • @DataCraftExplorers
      @DataCraftExplorers  9 днів тому

      謝謝您的支持!我最近時間原因,可能無法做出讓人滿意的影片,日後有機會期待與您合作~

  • @0926thomas
    @0926thomas 6 місяців тому +1

    這個影片的字幕應該也是用 AI 生成,而且也沒有校稿,錯誤非常之多.

    • @DataCraftExplorers
      @DataCraftExplorers  6 місяців тому

      是的!謝謝您的支持,認真的看了影片跟字幕!最近會努力生出時間校稿的🥹
      以訓練資料來看,Whisper目前還是翻譯英文比起其他語言更準確,加上受限於whisper transcription 軟體的限制,精準度還是有加強的空間。
      目前在研究直接使用OpenAI 提供的開源程式碼翻譯,期望可以產生更精準的翻譯結果,如果成功的話會再做一集影片跟大家分享喔!

    • @DataCraftExplorers
      @DataCraftExplorers  5 місяців тому

      新影片出爐囉,可以更精準的辨識影片字幕,可以到資訊欄點連結觀看喔~
      新影片網址:ua-cam.com/video/23lS2NyZRCQ/v-deo.html

  • @user-pd6lm6bm6u
    @user-pd6lm6bm6u 4 місяці тому +1

    能直接轉出中文繁體嗎?

    • @DataCraftExplorers
      @DataCraftExplorers  4 місяці тому

      新版程式碼有更新在GitHub 上面
      新增以下這段可以翻譯成繁體中文:
      prompt = '以下是普通話的句子' # 轉錄成繁體中文
      但實測結果有的時候某幾句話還是會混淆到簡體中文🥲

  • @user-gn8gd1zb1h
    @user-gn8gd1zb1h 2 місяці тому

    想請問,它變成簡體字,要怎麼變成繁體字

    • @DataCraftExplorers
      @DataCraftExplorers  2 місяці тому +1

      在5:47那個畫面左下角,上面的按鍵可以選擇語言喔!

  • @katsun2417
    @katsun2417 7 місяців тому

    可以翻译粤语嗎?

    • @DataCraftExplorers
      @DataCraftExplorers  7 місяців тому

      嗨嗨~目前whisper transcrtion沒有支援粵語功能。
      您可以考慮使用Google Cloud Speech-to-Text、Microsoft Azure Speech Service或IBM Watson Speech to Text等語音轉文字工具,這些服務支援粵語。

  • @tina4745
    @tina4745 7 місяців тому

    這必須在電腦版才能操作吧?

    • @DataCraftExplorers
      @DataCraftExplorers  7 місяців тому

      嗯嗯對喔~目前whisper transcription 這個軟體只適用Mac 系統

    • @Hervelee1011
      @Hervelee1011 5 місяців тому

      @@DataCraftExplorers 用iphone 手机可以吗?

    • @DataCraftExplorers
      @DataCraftExplorers  5 місяців тому +1

      @@Hervelee1011 whisper transcription這個軟體目前只適用Mac電腦。
      以下有一些可以支援手機的替代方案,您可以自行選擇適合您的喔~
      Dragon Anywhere:這是由Nuance Communications開發的專業語音轉文字應用程式,提供高準確率的轉錄功能。
      Otter Voice Notes:Otter 是一個智能語音錄製和轉文字應用程式,它可以即時將錄音轉換為文字並進行分類。
      Rev Voice Recorder:Rev 是一個專門用於錄製和轉換語音的應用程式,提供高品質的轉錄服務。

  • @aohhhh
    @aohhhh 3 місяці тому +1

    感謝教學 想請問 6:45那邊說的 使用更精確的版本 是怎麼使用的?不曉得從哪裡操作

    • @DataCraftExplorers
      @DataCraftExplorers  3 місяці тому +1

      在主畫面 (可以參考6:04 )左下角那邊有一個Quality 的選項,那邊可以選擇不同的精準度喔~

    • @aohhhh
      @aohhhh 3 місяці тому

      @@DataCraftExplorers 那就是不同模型嗎?就是直接使用更大的模型這樣嗎?需要升級成pro的

    • @DataCraftExplorers
      @DataCraftExplorers  3 місяці тому +1

      是的,免費版本最精準的模型是small,再上去就是要升級付費版了~
      看您的使用需求,若不想升級付費版但又想使用更精準的模型,可以參考我另一隻whisper in python 的影片喔~

  • @vinsung
    @vinsung 10 днів тому

    語無倫次,不知再說啥??????????