- 63
- 425 660
だるまと赤べこ【AI解説】
Приєднався 5 жов 2022
AI関連の動画を投稿していきます。
ChatGPTゲーム制作シリーズを更新中。
Twitter: DarmaAkabeko
※このチャンネルはAmazonアソシエイト・プログラムに参加しています
ChatGPTゲーム制作シリーズを更新中。
Twitter: DarmaAkabeko
※このチャンネルはAmazonアソシエイト・プログラムに参加しています
低スペックPCでもローカルで動かせるChatGPT風アプリを作ったよ
そんなアプリを作りました。
※非ずんだもん注意
重要な追記: 初回起動時はモデルをダウンロードするためめっちゃ時間がかかります
使用するAI:
・Gemma2:2B
・Stable Diffusion 1.5
・nanoLLaVA
作ったアプリのリンク:
drive.google.com/file/d/1FbqxdSzYCPx8g1LNdFFtkg6jM_jlrrQy/view
BGM:
・かずち - 青空空港
X(Twitter): DarmaAkabeko
だるまと赤べこのサイト: www.darmabeko.com/
※非ずんだもん注意
重要な追記: 初回起動時はモデルをダウンロードするためめっちゃ時間がかかります
使用するAI:
・Gemma2:2B
・Stable Diffusion 1.5
・nanoLLaVA
作ったアプリのリンク:
drive.google.com/file/d/1FbqxdSzYCPx8g1LNdFFtkg6jM_jlrrQy/view
BGM:
・かずち - 青空空港
X(Twitter): DarmaAkabeko
だるまと赤べこのサイト: www.darmabeko.com/
Переглядів: 2 511
Відео
ChatGPTに追加された最新モデル「o1」がAGIの第一歩だった
Переглядів 8 тис.21 день тому
よりによってこのタイミング・・・ 使用するAI: ・o1 Preview BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
シンプル詐欺な自称最強LLM「Reflection 70B」の手口と真相
Переглядів 3,1 тис.21 день тому
騙された・・・ 使用するAI: ・Reflection 70B(???) BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
GPT-4oの新機能「Structured Output」が革命的すぎる(再投稿)
Переглядів 8 тис.Місяць тому
壊れた動画をアップロードしてしまったので再投稿・・・ Structured OutputとRPGの動画です。 使用するAI: ・GPT-4o ・Stable Diffusion 1.5 BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
最高レベルの画像生成AI「Flux.1」がオープンソースで公開
Переглядів 6 тис.Місяць тому
Black Forest Labsが公開した新たな画像生成AI「Flux.1」に触れてみます。 使用するAI: ・Flux.1[Dev] ・Flux.1[Schnell] ・Stable Diffusion 1.5 ・DALLE: 3 BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
Copilot+ PCって何?AI PCの誇大広告と正しい選び方を解説
Переглядів 2,2 тис.2 місяці тому
Microsoftが作ったPCの新規格「Copilot PC」について疑問を述べます。 動画で触れた記事: www.darmabeko.com/articles/PC要件まとめ BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko
GPT-4o超えのオープンモデル「llama 3.1」を解説&ローカルで使ってみた
Переглядів 6 тис.2 місяці тому
Metaの新たなLLM「llama 3.1」シリーズについて解説します。 使用するAI: ・llama 3.1 405b ・llama 3.1 70b BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
異次元の高効率モデル「GPT-4o mini」の登場と3.5 Turboは永遠の別れ
Переглядів 5 тис.2 місяці тому
OpenAIが新たに発表した軽量言語モデル「GPT-4o mini」について解説します。 使用するAI: ・GPT-4o mini ・GPT-4o だるまと赤べこのサイト: www.darmabeko.com/ BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko
人間らしく自然に会話できる音声チャットAIを作る
Переглядів 6 тис.2 місяці тому
GPT-4oの新Voice Modeが中々公開されないので自宅で再現を試みます。 前回: ua-cam.com/video/cd7rFszHD8E/v-deo.html 使用するAI: ・GPT-4o(OpenAI API) ・Speech-to-Text(Google Cloud) ・Gemini Flash(Gemini API) ・Gemma 2 8b ・Style-Bert-VITS2 だるまと赤べこのサイト: www.darmabeko.com/ BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko
Claudeの新機能「Artifacts」で全自動ゲーム制作させてみた
Переглядів 8 тис.3 місяці тому
Claude 3.5の新機能「Artifacts」を用いて、ゲームを全部作ってもらいました。すごい。ボムの使用はBキー。 使用するAI: ・Artifacts(Claude 3.5 Sonnet) だるまと赤べこのサイト: www.darmabeko.com/ 動画のゲーム: shooting-game.darmabeko.com/ BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko
Anthropicから早くもGPT-4o超え?「Claude 3.5 Sonnet」が発表
Переглядів 5 тис.3 місяці тому
Anthropicから早くもGPT-4o超え?「Claude 3.5 Sonnet」が発表
無料で誰でも使える動画生成AI「Dream Machine」がSoraのレベルだった
Переглядів 11 тис.3 місяці тому
無料で誰でも使える動画生成AI「Dream Machine」がSoraのレベルだった
Appleの最新AI「Apple Intelligence」が誤解されてるので解説
Переглядів 8 тис.3 місяці тому
Appleの最新AI「Apple Intelligence」が誤解されてるので解説
「未経験からのChatGPT×Pythonプログラミング」講座を発売しました
Переглядів 3,6 тис.4 місяці тому
「未経験からのChatGPT×Pythonプログラミング」講座を発売しました
Googleの最新発表からGeminiの進化やAI検索エンジンなど全部解説【Google I/O】
Переглядів 5 тис.4 місяці тому
Googleの最新発表からGeminiの進化やAI検索エンジンなど全部解説【Google I/O】
OpenAIの最新発表からGPT-4oや無料版をまとめて解説【Spring Update】
Переглядів 11 тис.4 місяці тому
OpenAIの最新発表からGPT-4oや無料版をまとめて解説【Spring Update】
Metaの最新LLM「Llama 3」が別方向でChatGPT超えてた
Переглядів 8 тис.5 місяців тому
Metaの最新LLM「Llama 3」が別方向でChatGPT超えてた
未経験からのChatGPT×Pythonプログラミング #4 if文
Переглядів 2,4 тис.5 місяців тому
未経験からのChatGPT×Pythonプログラミング #4 if文
未経験からのChatGPT×Pythonプログラミング#2 基本の仕組み
Переглядів 3,5 тис.5 місяців тому
未経験からのChatGPT×Pythonプログラミング#2 基本の仕組み
未経験からのChatGPT×Pythonプログラミング#1 環境構築と遊んでみる
Переглядів 8 тис.5 місяців тому
未経験からのChatGPT×Pythonプログラミング#1 環境構築と遊んでみる
未経験からのChatGPT×Pythonプログラミング講座を開講します
Переглядів 6 тис.5 місяців тому
未経験からのChatGPT×Pythonプログラミング講座を開講します
OpenAIの動画生成AI「Sora」のテクニカルレポートを読んでみる
Переглядів 3 тис.7 місяців тому
OpenAIの動画生成AI「Sora」のテクニカルレポートを読んでみる
Googleの最新AI「Gemini Ultra」はChatGPTを超えたのか?【超えてない】
Переглядів 4,6 тис.7 місяців тому
Googleの最新AI「Gemini Ultra」はChatGPTを超えたのか?【超えてない】
価格はどんどん下がっていくので、企業の目線だと性能がよければ導入検討対象になると思います。人件費は上がり続けるので
無事にAPI使えるようになりましたね しかし1分程度試しただけで40〜50円はかなり厳しい… リアルタイムAPIの公式ページによれば今後4o miniにも対応するみたいなんでそこでどれだけ安くなるかに期待ですね
4o-miniへの対応に期待ですね! テキストと同じくらいの価格差をつけてくれれば最高です!
speech to textはPixelがすごいなと思います。エッジデバイスのモデルを上げるのはこのチャンネルに属してないかもですがスマホレベルで日本語のあの読み取り性能はすごいなと感じてます。
Pixelですか!Gemini Nanoってやつでしょうか?実は気になってはいましたが...すごいんですね。 手元にあれば...
早くAPI使ってみたいですけど、値段がかなりネックですよね いずれデモのような画像や映像のリアルタイム処理に対応したらさらに高くなりそう…
映像までいくと、ホストやキャバクラで話すくらいの覚悟になりそうですね笑
開始 0:58
お腹から声出てないボソボソ音はキツイ。
これなら字幕のがいいよな
精進してまいります・・・
素晴らしい!
ですよねえ...
ImageFXは特に触れる予定ないですか?
機を逃したという感じで...
めちゃくちゃ笑いました。少しベクトルが違いますがコロナ時にオンライン飲み会が流行っていて、その時と同じ問題が起こっているように感じました。つまり音声ソースが複数ある時に人間みたいにマルチに処理するのが大変そうという
Whisperも話者判定が出来ないので、その弱点を引き継いでますね...ある意味想定シーンを絞ったんでしょうか?
他の方のコメントでもありますがデバイス2台設置したら無限対話いけたりしますか…?今度試そうかな
面白そうですねそれ笑笑 やってみたい!
ずんだもんの開発元は音声モデルを売り込めばいいと思う。 ずんだもんとか、ゆっくり、きりたんとかと話せるようにしてほしいな。 まあ、公式になくても、キャラの音声に変換する高性能なボイスチェンジャーもあるし、それを一枚かませれば、ずんだもん化するんのかもしれんが、公式が対応してくれるのが楽でいいと思う。
確かに、ずんだもんの人気ってもはやすごいですしね!
うーんまだ自分が求めているものと違う
特に日本語だと足りない部分も目立ちますね。
メモリに好きな声の雰囲気とかを覚えさせると、声のカスタマイズっぽいことができました。結構良かったです。
CIとメモリにロールプレイの設定を入れたらいけました。特定のキャラクターのロールプレイが無理と言っていたのは、声優さんとかの声を勝手に再現するのを規制するためでしょうか。
なるほど、そんなテクニックが笑笑 面白いです。試してみます!ありがとうございます
今更ながら購入しました✨ 頑張って色んなアプリやゲーム作りたいと思います💪
ありがとうございます!今見つけて買ってもらえるなんて感激です
音声というか、話し方というか、マインドが積極的すぎるのをなんとかしたいなぁ。「しゃべれよ!」って三村が突っ込むくらいのでもいい。ずっと聞いていて、「どう?」っていうと話し始めるとか。
確かに、音を認識する→100%返事っていうのはちょっと不便ですよね。 それくらいの方がいい!
2台あったら会話させられんかな
やりたくなりますね笑
すごすぎる‼️
ですね!!本当に
滑舌っていうより、マイクとの近さとかですかね?
マイク近すぎたかもしれません...ありがとうございます
今ダルって言ったw 言っちゃいましたね 笑えるw
まさか認めるとは笑
4oでも十分に人だったのに日本語でしかも方言までこのレベルに自然とは…
笑いや驚きなど、すごいですよね...
日本語の言語体系のむずさを体感できるいい機会(半年後にはずんだもん実装されてる)
英語のようにはいきませんね。日本法人に期待です...
開始1:23 配信設定など出直して参ります
これは本当にすごいな
感動ですね。
例えばLangChainのようなのを使ってファインチューニングして、このローカルAIを自分用の使い易いモデルに育てられたら、より面白そうです。
それ最高ですね・・・!このままデバイス性能が向上していけば、個人個人で当たり前にファインチューニングみたいなことも出来そうです
AGIとは全然仕組みが違うから、あんまり関係ないんじゃね? だっけ結局はあくまで生成AIの機能のままで、回答がそれっぽくなるように処理変えただけやん。
それを踏まえてAGIの第一歩だと思います!僕は
凄く広く捉えればまあそうか…
sakana AIが提唱している蒸留(高性能AIモデルに低性能AIをトレーニングさせること)ってテクニックを使っていけばもっと性能上がっていきそう!
Gemma 2 2b自体も蒸留を用いて作られたモデルではあるようです!sakana aiが何か効率化してくれたらまた良いですね
初回起動時にモデルをダウンロードするとあるのですが、 アンインストールする際はどこを削除すればいいでしょうか?
説明忘れていました、すみません! 「C:/User/Owner/.cache/huggingface」 内に格納されています!huggingfaceを使用していなければこのフォルダを削除すれば大丈夫です!
@@darmasama ありがとうございます!
2Bパラメータの4bit量子化モデルですよね? えええええ!ここまで性能出るんですか? すっげ、まじ驚きです。 会話推論と画像生成はどういうロジックでAIを切り替えているのですか? Gamma2がStableDiffusionにむけてプロンプトを吐いているの?
ありがとうございます!小型化の進歩も凄いですよね。 画像生成については、Gemma2がプロンプトを作成しています! Gemma2はGPT-4oよりも旧式stable diffusionのプロンプトに詳しかったです。
これ使うモデルをロードしなおす形にすればもうちょい減らせそう…? 画像生成のモデルがどうにもならない気配はありますが
ですね...現状複数モデルを同時にロードしているので、速度低下を受け入れればある程度は削減できるかもしれません。
すごい。私のPCもi5の16GBですが、ollamaもこんなに応答早くないですね。画像生成にもびっくりしました。ちょうどChatGPTの「自動」モードが出てきたので、ぜひだるまGPTにも採用してください。
ありがとうございます! o1…実装できるかな笑
ほんと制限多くて好きなように出来ないから、ちょっと触ってもういいやってなるんだよな。買い切りもないし ネット自体もそうだけど、サービスが生まれた直後のカオスな時が一番楽しいのに、生成AIはのっけから制限まみれでおもんない
そういう需要もありますよね...
無料ChatGptをかなり実用してるのですが制限が厳しくて困ってました。文章の解析等なので、このローカルのでも実用になるかもと思ったのですが、実行したらモデルのダウンロードで1時間以上かかったあげく、止まってしまいました。 無線回線で電波状態が悪く20Mbps位しか出ないからかもです。非常に残念です。 モデルは起動の度に毎回ダウンロードですかね(それとも初回起動でどこかにファイルができる?)。回線状態がもう少し良い時にもう一度試しますが、そのモデルのファイル?は保存されるのですか。 惜しいなあ😢 追伸 個人的な長年の趣味ですが、最近になってGptを社会的課題に対して応用する試行錯誤をしてみたら、使えそうな事が分かってきた所でした。 このローカル実行のアプリには個人的にとても可能性を感じてます。
もう一度試したら動きました! 最初の起動はかなり時間がかかりましたが、2度目からはそこまで遅くはなくなりました。ちょっと使ってみた感じは、モデルの知識量としては弱そうですが、主に分析や推論などで使いたいので、充分役立つ可能性があります。今後色々試してみようと思います。 このような素晴らしいものを提供いただきまして、ありがとうございました。今後の展開にも注目しております!
性能うんぬんより、こういうのを作れること自体が素晴らしい!
ありがとうございます!!
ファミコンみたいな見た目でかっこいい
レトロな外見が好きでして!
一般のpcでも動くんですね。驚きました。 こういったローカルで動くchataiは、記憶力はそのモデルに依存するのでしょうか。 claudeや、gptのメモリー機能のよう長文だったり過去の話を覚えてくれるaiの方が便利だと感じているので、その辺も自由にできたら良いと感じてます。
はい、今回のやつはモデルのコンテキストウィンドウだけを使用しています! その辺りの仕組みも作れたらとは思います
勉強になります。対話が成立するAIって、もっとずっとリソースを消費するものだと思っていました。このリソースでここまで出来るなら、SIRIやアレクサ程度の、言葉指示でパソコンが自動で動いてくれるOSは今後は簡単に作れそう(企業レベルなら)な気もしますね。IntelもAI処理専門の回路をCPUに搭載してきてますし。
ありがとうございます! もしかしたら2025年にもそんな状況がやってくるかもしれませんね。
落ち着いた声でかっこいいですね。
ありがとうございます笑
素晴らしい実験だと思います。ありがとうございます。 正しく学習させた重みデータを使えばCPUレベルでもここまで動くという事に驚きました。 因みにこれはCPU内臓のGPU UHD Graphics 770を活用しているのでしょうか?しなくてもCPUだけの演算でこんなにサクサク動くのでしょうか? これの作り方というか動かしかた(チャット、画像生成、画像認識)を単体で良いので動かす方法を動画にしていただけると嬉しいです。 ChatGPTが出た当初にノートPCでも動く生成AIをGIGAZINEで見かけて試したことがありますが回答が英語だけでイマイチわからなかったです。 自分のパソコンで動かしてみたいと思いました。出来ればコード生成も自分のPCで出来たら良いと思います。
ありがとうございます! CPUによる処理のみです。統合グラフィックスが無いCPUでも動作します。 作り方については、ある程度まとめられたら何らかの形で公開しようと思います!よろしくお願いします
コーディング能力も...そのうち
これはいいね。 オレモこういうの作りたいけど、今は時間がとれん。 N100でもうごくか試したい。
ありがとうございます! N100で是非試してみて欲しいです。
久しぶりの生の声 嬉しいです。
ありがとうございます!
天才ですか?
ありがとうございます! 切っちゃ貼りの天才かもしれません
言い忘れてた重要なこと: 初回起動時はモデルをダウンロードするためロード時間が長めです。
学習の地域格差無くなって最高やん
それは素晴らしいこと...本当に!
dbスペシャリストの資格試験の学習にo1ーpreviewを利用してみましたが、回答根拠も明確で非常にわかりやすい解説でした。 これはClaudeや4oと比較すると、とんでもない精度で「いよいよか」という印象です。 ちなみにdbスペシャリストにおいてはminiよりもはるかにpreviewでした。
一見STEMっぽいですがpreviewなんですね。miniは本当に論理に特化してる感じでしょうか
AI Scientist と組み合わせたらどうなるんだろう・・・わくわくしますね。
もうシンギュラリティ間近なのにほとんどの人が関心ないのが不気味で仕方ない
扱いに慣れた人しかまだ扱えないからかもしれませんね。 GPTの初期モデルを試したにわか民が、浅いところを見て、人間に機械が敵うわけないという思考停止をしたのが原因でしょう。 おそらくは、大資本から、バックエンドに取り込み始めて、いつの間にか、AIが使われていることすら気が付かずに浸透するでしょう
カンニングに使えちゃう?
ずんだもんは 頭いいなあ( ・∇・)
o1の次の世代のモデルはその性能を引き出せるだけのインブットをできる能力を持った人材育成が重要になる。育成というより地頭的な要素も大きい気がするが
そのうち、数学系youtuberがコイツと戦うとかの動画が投稿されるんでねと期待してしまう。 なお、数学は苦手なのでさっぱりわからん。