Розмір відео: 1280 X 720853 X 480640 X 360
Показувати елементи керування програвачем
Автоматичне відтворення
Автоповтор
今回の動画恐ろしく今の僕にぴったりな内容でした。今まさに会議時に人の声を聞き分けたり、会議の概要をまとめるアプリを作っています。assemblyaiは話者識別できるし精度も悪くないのでおすすめです!あと復活して嬉しいです!
ご視聴いただきありがとうございます!!assemblyaiというの初めてしりました✨✨ AIは色々なことができて本当便利ですよねー!!
Docker入門で知り、過去動画を見漁ってます素晴らしい解説動画をありがとうございます書籍も購入させていただきました!
ご視聴いただきありがとうございます!!書籍もご購入いただきありがたいです☺️動画でも書籍でも何かプログラミング学習のお役に立っていたら嬉しいです✨
先月からchatgpt使ってウィスパー作りました。職場でかなり重宝してます!
わー!!すごいです✨✨実際にお仕事でも使えるプログラムが作れると嬉しいですよね!!
おお!これ今日ちょうど使ったところです。パワーのないパソコンだとWhisperのロードに時間がかかるのが玉にキズですか、無料で上手い感じにテキスト化してくれるのは嬉しい!ですよね。僕はlargeモデルだけ使ってます。
おー!!私のPCではLargeモデル動かなかったので羨ましいです!!こんなに凄いのに無料なのが嬉しいですね☺️
pythonで音声解析できるなんて技術の進歩は素晴らしいですね(高校生)投稿された動画リスト見てきましが凄いですねこれ見ればpython丸わかりじゃないですかということで次は機械学習についてお願いします
AIすごいですよね!!機械学習については専門の方とのコラボとかを予定してるので楽しみにしていてください☺️
音声認識は以前SpeechRecognitionで作ったことがあるよそれよりも精度は上がってるんだろうなぁ🙄(ところでサプーちゃんは今日もかわいい😇)
SpeechRecognitionというのもあるんですね!!AIの進化はすごいですよね😳サプーの姿が可愛くてついつい大きく映してしまいます☺️
ありがとうございます!
super thanks 大変ありがたいです!!!
faster_whisperに変更して、ローカルのGPU(GTX1660)も使用するようにしたら、large-v3で実時間の23%で変換できました
おー!!速いですね!!faster_whisperは動かしたことが無かったので、どの程度速くなるか共有いただけてありがたいです☺️
8:09のあたりで$32と表示されていますが、GPU動かすとお金かかってしまいますか?
OpenAIから出たrealtimeAPIについて、使い方などを紹介した動画を作ってくださると嬉しいです。
realtimeAPIのリクエストありがとうございます!考えてみますね!
同音異義語や駄洒落観たいに人間でも錯覚するような言葉を試してみたくなります
確かに人間でも聞き間違えしやすい言葉もありますからね!!
ffmpegはどこで使われてるんだろう
Whisperの中のどの部分か?ということですかね?うーんどこでしょう🤔
@@pythonvtuber9917 オーディオファイルを読み込んでデコード、バッファーとして取り込んでndarrayとして扱えるようにする部分で使われてたはずです~
わーー!!そうなんですね!!教えていただきありがとうございます☺️
ビデオカード持ってる前提での方法でやって欲しいな
リクエストありがとうございます!
v3が発表されてからしばらく経つけど次は発表されないのだろうか🤔
キャプションにも書いたのですが先週にturboというモデルが追加されていましたね!
@@pythonvtuber9917ありがとうございます!※マーク見逃しておりました😅試しに使ってみたら比較にならない程早くなっていて驚きました!!!
今日のサプーちゃん、ほっぺがふっくらしている様に見える。
角度によって微妙に見え方が違いますよね!
今日は前半はすっごい簡単〜(^-^)vと思ったら、後半ついていけませんでした(T . T)引き続き修行します.リクエストですがLLM+RAGやろうと思うので解説動画あげていただけると嬉しいです。強化学習やファインチューニングとの違いを知りたいです
ご視聴ありがとうございます!!確かにGoogle Cloudに慣れていないと後半は難しいかもですね😵LLM+RAGのリクエストありがとうございます!考えてみますね!
この、「滑舌の問題で文字起こしが変」という要素は、何らかの認証に使えないかとちょっと考えました。それくらい、フェイクやなりすましを恐れる昨今です。この手のものは、まだマシンパワーに頼るところですよね。現実がSFを追い抜いたとわずかに思いつつも、まだSFのほうが先を行ってると実感すること多しです。スマホで大きなモデルが難なく動くとこまでが当面のゴールでしょうか。
確かに完璧じゃないほうが人間っぽい感じがありますよね!スマホで大きなモデルを動かすとなるとハードの方ももっと進化する必要があるかもですね🤔
감사합니다.이번에 tensorflow & OCR로 번호인식 프로젝트 하려고합니다. 이 영상으로 약간 도움됬네요
시청 해 주셔서 감사합니다
今回の動画恐ろしく今の僕にぴったりな内容でした。
今まさに会議時に人の声を聞き分けたり、会議の概要をまとめるアプリを作っています。assemblyaiは話者識別できるし精度も悪くないのでおすすめです!あと復活して嬉しいです!
ご視聴いただきありがとうございます!!
assemblyaiというの初めてしりました✨✨ AIは色々なことができて本当便利ですよねー!!
Docker入門で知り、過去動画を見漁ってます
素晴らしい解説動画をありがとうございます
書籍も購入させていただきました!
ご視聴いただきありがとうございます!!
書籍もご購入いただきありがたいです☺️
動画でも書籍でも何かプログラミング学習のお役に立っていたら嬉しいです✨
先月からchatgpt使ってウィスパー作りました。
職場でかなり重宝してます!
わー!!すごいです✨✨
実際にお仕事でも使えるプログラムが作れると嬉しいですよね!!
おお!これ今日ちょうど使ったところです。パワーのないパソコンだとWhisperのロードに時間がかかるのが玉にキズですか、無料で上手い感じにテキスト化してくれるのは嬉しい!ですよね。僕はlargeモデルだけ使ってます。
おー!!私のPCではLargeモデル動かなかったので羨ましいです!!
こんなに凄いのに無料なのが嬉しいですね☺️
pythonで音声解析できるなんて技術の進歩は素晴らしいですね(高校生)
投稿された動画リスト見てきましが凄いですねこれ見ればpython丸わかりじゃないですか
ということで次は機械学習についてお願いします
AIすごいですよね!!
機械学習については専門の方とのコラボとかを予定してるので楽しみにしていてください☺️
音声認識は以前SpeechRecognitionで作ったことがあるよ
それよりも精度は上がってるんだろうなぁ🙄
(ところでサプーちゃんは今日もかわいい😇)
SpeechRecognitionというのもあるんですね!!AIの進化はすごいですよね😳
サプーの姿が可愛くてついつい大きく映してしまいます☺️
ありがとうございます!
super thanks 大変ありがたいです!!!
faster_whisperに変更して、ローカルのGPU(GTX1660)も使用するようにしたら、large-v3で実時間の23%で変換できました
おー!!速いですね!!
faster_whisperは動かしたことが無かったので、どの程度速くなるか共有いただけてありがたいです☺️
8:09のあたりで$32と表示されていますが、GPU動かすとお金かかってしまいますか?
OpenAIから出たrealtimeAPIについて、使い方などを紹介した動画を作ってくださると嬉しいです。
realtimeAPIのリクエストありがとうございます!考えてみますね!
同音異義語や駄洒落観たいに人間でも錯覚するような言葉を試してみたくなります
確かに人間でも聞き間違えしやすい言葉もありますからね!!
ffmpegはどこで使われてるんだろう
Whisperの中のどの部分か?ということですかね?うーんどこでしょう🤔
@@pythonvtuber9917 オーディオファイルを読み込んでデコード、バッファーとして取り込んでndarrayとして扱えるようにする部分で使われてたはずです~
わーー!!そうなんですね!!
教えていただきありがとうございます☺️
ビデオカード持ってる前提での方法でやって欲しいな
リクエストありがとうございます!
v3が発表されてからしばらく経つけど次は発表されないのだろうか🤔
キャプションにも書いたのですが先週にturboというモデルが追加されていましたね!
@@pythonvtuber9917
ありがとうございます!
※マーク見逃しておりました😅
試しに使ってみたら比較にならない程早くなっていて驚きました!!!
今日のサプーちゃん、ほっぺがふっくらしている様に見える。
角度によって微妙に見え方が違いますよね!
今日は前半はすっごい簡単〜(^-^)vと思ったら、後半ついていけませんでした(T . T)
引き続き修行します.
リクエストですがLLM+RAGやろうと思うので解説動画あげていただけると嬉しいです。強化学習やファインチューニングとの違いを知りたいです
ご視聴ありがとうございます!!
確かにGoogle Cloudに慣れていないと後半は難しいかもですね😵
LLM+RAGのリクエストありがとうございます!考えてみますね!
この、「滑舌の問題で文字起こしが変」という要素は、何らかの認証に使えないかとちょっと考えました。それくらい、フェイクやなりすましを恐れる昨今です。
この手のものは、まだマシンパワーに頼るところですよね。現実がSFを追い抜いたとわずかに思いつつも、まだSFのほうが先を行ってると実感すること多しです。スマホで大きなモデルが難なく動くとこまでが当面のゴールでしょうか。
確かに完璧じゃないほうが人間っぽい感じがありますよね!
スマホで大きなモデルを動かすとなるとハードの方ももっと進化する必要があるかもですね🤔
감사합니다.
이번에 tensorflow & OCR로 번호인식 프로젝트 하려고합니다. 이 영상으로 약간 도움됬네요
시청 해 주셔서 감사합니다