[Minesweeper] AI that made me smarter at once with a slight change in thinking

Experiment with PhysicsEngine

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 26 січ 2025

КОМЕНТАРІ • 229

@ko-ji 4 роки тому ⁺³³
前回の動画
ua-cam.com/video/lzsakrTMlNE/v-deo.html
@pointBall-cy2ru 4 роки тому ⁺¹³³
Game OverとGame Clear! の文字の色がわかりやすくなっててちょっと感動した
@tomoharuinoue717 4 роки тому ⁺²⁴⁴
最初のマスが広がる仕様なのは、最近のWindows（確かWin7以降）に入ってるやつですね。古い仕様だと、最初のマスは「爆弾じゃないことが確定」でした。
@ko-ji 4 роки тому ⁺³⁶
そうなんですね！
@iaexehaisin 4 роки тому ⁺¹⁰
WindowsVistaはそもそもなんにも教えてくれなかった（僕の）
@Justy-heart 4 роки тому ⁺⁸⁷
AIにはつい「ゼロから学習させること」に期待してしまいますが、
目的のものにチューニングさせたAIを用意した方が現時点では効率的ですね
@wani_yuri 4 роки тому ⁺¹⁰
あくまで今はだけど勝手に学習すると言うよりはこんなふうに成長するようにみたいなAIが主流ですからねー
@lovepis 4 роки тому ⁺⁵⁵
終わらないのもマイナス報酬だから、AIが時々当て感っぽい動きをしてるw
@アズール-h7u 4 роки тому ⁺⁴¹
マインスイーパーの世界記録やばいんだよね
@かつとん-m8z 4 роки тому ⁺⁵
どういう設定をするかってことが楽しいですね
こういうのって時間をあけるとすっと良い解決策が出てくるんよな
@renk1310 4 роки тому ⁺³
動画の「考え方を変えるだけで同じゲームでも上手くいったりいかなかったり「ってところで、チャールズ・M・シュルツさんの“If you're not having fun, you're playing the game wrong.”「もし楽しくなかったら、やり方が間違ってるのかも」という言葉を思い出しました
@NatureJapan3776 4 роки тому ⁺²
3:47のGAME OVERの図を見てみたが、本来であれば解ける配置。
まだ人間ほどではないですね。
@moo-moon3300 4 роки тому ⁺⁵
なんとなく将棋のAIが飛躍的に強くなった理由もロジックにあるんだなぁと
@AIAI-ji2wp 4 роки тому ⁺⁷³
シンギュラリティは来るのかなぁ？
タスクから、報酬と罰を自動で設定できるようになったら現実味おびてきそう
@cympfh 4 роки тому ⁺⁷
AI開発者がAIの仕組みを解説してみた逆強化学習という枠組みが正にそれをしますね
@hachigami 4 роки тому ⁺²²
将来絶対人間超えるな
@KOK_UMB 4 роки тому ⁺¹
記憶喪失ニキ
感情を手に入れた時AIは人間を越える
@白いベーコン 4 роки тому
鬼舞辻MUZAN 35秒前だと？
@sscp-____-j2847 4 роки тому ⁺³
白いベーコン〜前で草の流れが来そうだったので流れはここで止めておく
@Arashi_goro 4 роки тому
結果言うね。無理
@s._2650 4 роки тому ⁺¹⁰
マインスリーパーは難しいけどハマりますよね
@柚子胡椒-p6m 4 роки тому ⁺⁷
寝てるんですか？()
@bath_gamer 4 роки тому ⁺²
ですよね
@s._2650 4 роки тому ⁺³
セナルアックス改さっきまで寝てました(笑)
@小型みかん-c5o 4 роки тому ⁺⁵
6×11の爆弾9個を00:00でクリアしました。
学習のさせかたすごいです。
@小型みかん-c5o 4 роки тому ⁺¹
00:00はタイムです。
@池田眞樹 4 роки тому ⁺¹³⁰
詰将棋、チェス覚えさせたら面白そうです。
@うっちー-e3w 4 роки тому ⁺³
確かその系統で1番強いとも言われる人を倒したから、AIが1つに特化すれば人間を超えるってさ…
@dog4162 4 роки тому ⁺¹²
脱糞星人囲碁に特化したアルファゼロというAIはたったの24時間の学習で当時チェスの最強のAIを破ったそうですね
@googletnb8888 4 роки тому ⁺⁷
AI vs AIの戦いで面白そうな動画紹介してくれませんか？
@うっちー-e3w 4 роки тому ⁺²
@@dog4162
そういえばそうでしたね…その繰り返しすれば人間の知能を遥かに超える想像できない領域をいとも簡単にやってのけるんだろうな。
@bearoffline2887 4 роки тому ⁺³
囲碁界隈ではAIの打ち方を学ぶやり方が広がってきてますし、特化したAIは人間に利益をもたらすと思いますね。
@佐々木公彦-e5p 4 роки тому ⁺³
ＡＩに理解させるには人間も頭が良くないと駄目ってことだけは解った。
@nomaneko 4 роки тому ⁺³⁸
こういうパズルってAIよりアルゴリズムで解く方が簡単だよね
@renk1310 4 роки тому ⁺⁸
そりゃAIが0から学習するよりやり方知ってる人間が解くように作る方が速いでしょ
@YachiOVitheandnado 4 роки тому ⁺⁵
文字色への配慮は嬉しい。
やはり見る所と流れはシンプルな方が好いですよね。
高難度のフィールドが解ける日を待ってますよ！
@各駅超特急 4 роки тому ⁺¹⁰
次はAIに動画編集させよう
@deepmist655 4 роки тому ⁺⁸
低評価が多いとマイナス報酬与えてか
30万年後くらいにAIユーチューバーになってるかもね（ホジホジ
@wani_yuri 4 роки тому ⁺³
その次はAIに視聴者をさせよう(錯乱)
@あい-s7j7q Рік тому
盤面全部みて認識するんじゃなくて一定の範囲内で考えて判断する、言われてみれば確かにそう
人間って賢いな、おもろい
@AIAI-ji2wp 4 роки тому ⁺¹²
強化学習、面白いですね！
本格的にやってみようかなぁ
@Kame-k2k Рік тому ⁺²
この人ほどAIをいい使い方をしてる人を僕はまだ知らない
@potcharin 4 роки тому ⁺¹⁰
ターン数経過でマイナス報酬になるのは条件付けとして良いと思いましたが、2マス先までしか見ないというのは本来機械学習が自分から習得する/しないといけないものなのでは？
ある程度のメソッドを与えてしまうと、古典的な機械学習の趣が強いような気がしたのですが、新しい機械学習でも普通に人が方法をインプットしておくのは有りなんでしょうか？
@tn-vz7er 4 роки тому ⁺³
高いパフォーマンスが出せるAIを作るという目的ならば、わざわざ前提知識も無しで0の状態から学習させるというのは非効率的かつ計算資源の無駄になりますから、現実世界で作られるAIでもその方が少ないですよ。
@potcharin 4 роки тому ⁺¹
tn 870 確かにおっしゃる通りですね。勉強になります。
@オオカミ少年-g1e 4 роки тому ⁺¹
tn 870 こうすればクリアできると情報を入れる(学習させる)のであればわかりますが、選択の際の条件を絞ってしまうようなアルゴリズムの動作に近いもので機械学習といえるのでしょうか、機械的に問題を解くアルゴリズムとの差がなくなる気がします
@Arashi_goro 4 роки тому
するどいツッコミwルールのインプットのみにしないとおかしいよな。久々にマトモなコメントみた。
@Arashi_goro 4 роки тому
@@オオカミ少年-g1e
作ってるのユーチューバだからw
@osuguto76 4 роки тому
楽しみにしてました！
@ガーランド-m3m 4 роки тому ⁺²
Flashが終わる前にかつて諦めてきた脱衣マインスイーパー達をクリアしたいんだ。
完成を願っている。
@nekodesu.4649 4 роки тому ⁺³⁵
これ以上お膳立てしたらアルゴリズムなのでは
@yosshi--oq8et 3 роки тому
はっきりとしたAIの定義はないけど、
この人の動画に出てくるのはほとんどAIとは認識されないものばかりだからね
でも頭が悪い人にはその違いはわからないからしょうがない
@nekodesu.4649 3 роки тому
@@yosshi--oq8et 手順を与えずにがちゃがちゃやらせてなんか知らんけどうまくいくってのが自分の感覚に近いんだけど、GAっぽさが強い見せ方されるとショボく感じてしまう。
@シュタローン Рік тому ⁺¹
☺「サングラスをかけたい」
@みやけん3 4 роки тому ⁺²
上級になると対応できないのは意外でした。周囲が初級で学習しきれなかった盤面になっっていることが原因なら、上級で学習させるだけでももっと上手くなるかもしれませんね。
@senken2613 4 роки тому ⁺¹
2:48 なぜ2マスなんだ？1マス先だけでいいじゃんと思ったが
3:58 そういうことか
@Koucha. 3 роки тому ⁺¹
結局今回の動画の考え方が、普段人間がやってる"開きそうなところを順番にみていく"ということとおなじなんだなぁ～、たぶんだけど・・・・。
と思ってコメント見てたら、人工知能じゃない！意見がたくさんあって
みなさん思うところは一緒なのかと思いました。
@べんちあ 4 роки тому ⁺¹
ルールに合わせて人間が手ほどきしてたらそれはもう機械学習ではなくただの人間によって正解するように誘導されたクリックソフトなんだよプログラミングと変わらない
@mandarinorangemikan 4 роки тому ⁺¹
この学習方法を思い付く棒読みちゃんがすごいのでは？🤔
@sunny-bi9rl 4 роки тому ⁺¹
全部の選択肢を検討して、推定した安全な確率が最も大きいところから開いていく戦略とかよさげ
@アルト-b7w 4 роки тому
ん？マインスイーパは基本は運ゲーじゃないんだけど
@sunny-bi9rl 4 роки тому
@@アルト-b7w 強化学習では、推定した報酬の期待値として扱うんやで。だから、ネットワークの出力は確率になるんや
@アルト-b7w 4 роки тому
@@sunny-bi9rl それなら、もうやってるんじゃない？
逆にやらない選択肢ってあるの？
@sunny-bi9rl 4 роки тому
@@アルト-b7w 動画を見た感じ、左下からみていって、安全なとこは開けるっていってたからそう思ったけど、
実際はそうやってるのかな？
@tsuka414 4 роки тому
考え方を変えるだけで
劇的に進歩することがありますよね
@どっかの里 3 роки тому ⁺¹
3:17 俺に刺さる言葉
@vell4102 4 роки тому ⁺²
考え方っていうか、ここまで教え込んだら人工知能の意味が無いような。。。
@井口よしたか 4 роки тому ⁺¹
これだと学習よりアリゴリズムで解いてる感が、、、前編がうまくいかなかったのは開いているマスの隣の方が周りに何の情報のないマスより爆弾のある確率が高くなってしまっているのが原因ではないでしょうか？報酬を周囲の開封済みマスの個数で差をつけたりカリキュラム学習を爆弾の数ではなくマス目が少ないものからやっていけば違う結果になるのではないでしょうか？
@てぃけぃ-g4y 4 роки тому ⁺²
AIって聞くと、どうしても人間が思いもつかなかった方法で攻めてくるやつを期待しちゃうから、人間用の考え方を下敷きにしちゃうのは残念。
下敷きの部分を自分で改良していくアルゴリズムって無いんだろうか？
@本物で草-b6l 13 днів тому
マインスイーパってたまに遠くのマスから爆弾の位置を仮定して行かないと開かないマスとか出てくるから奥が深そう
@taroyamada5628 4 роки тому ⁺¹
局所解と全体解が必ず一致するゲームだからこその戦略ですね。
赤枠のサイズも学習対象に含めるとより汎化性能が向上するでしょうか？
@monitero 4 роки тому
分からないが続くとマイナスになっちゃうから、どうしても確定できない時は適当に開けちゃうんだろうね
@freddieforever4180 4 роки тому
天才AIねぇ
期待してますよ
@mnt____kzh9559 4 роки тому
この動画のおかげで自分でもできるようになりました！
@aaaa_kano 4 роки тому
こうやってAIに学習させていけばルールすら知らない人にマインスイーパのコツ教えるのも上手くなりそう
@がみ-u3m 4 роки тому ⁺⁶
覚えまくってやばいAIになりそう(語彙力)
@フイロン 4 роки тому ⁺⁸³
無関係な情報を大量に読み込んで中々成長できないの、発達障害に通ずるものがある気がします。
@tp6156 4 роки тому
プログラムとかカリキュラム学習の難しいことはよくわからないけど
1.マスに対して動画内の3分類をする
2.2×2以内に1の操作で結果が変化するところがあれば先に解く
3.2×2内への影響がなければ左下からの検証に戻る
見たいな感じにすれば解けそう
人間も繋げて考えていくし
@yuributasakka 3 роки тому
ただしこれを永遠に続けてもマインスイーパーに完全勝利する事は出来ない
@和頭しらす 4 роки тому
完全に運で二択のところ、ちょっと躊躇っててかわいい
@和頭しらす 4 роки тому ⁺¹
3:56
@アルト-b7w 4 роки тому
そこ運要素無いですよ
@tannak7572 2 роки тому ⁺¹
つまり、人間のプレイヤーが行っているのと同じロジックでAIにも解かせることにした、ということだね。最初から（ｒｙ　(笑)
@gamememo 4 роки тому ⁺³
大局観を一度捨てたら強くなった！？
@jeuxjeux11 4 роки тому ⁺¹
将棋のような大局観が必要なゲームじゃないからでしょうね
@Tawashi_0255 4 роки тому
上級だと学習時のローラー作戦が通用しなくなるから、そもそもどのマスを開けたらいいかではなく、数字の周り8マスに未開封のマスがあって、三つの判断をその数字を中心に2マス先までの数字を判断材料とさせればより人間の解き方に近くなると思う。
@lianggong630 4 роки тому
これって旗を置いた時点でゲームオーバーなので人間が練習するより効率よく情報が入っていくということでいいんでしょうか？
あと上級は情報のない5×5の部分が多いので「何もしないとマイナスの報酬→じゃあそれ嫌だからヒントないけど踏むね→爆発」ってのが原因でミスが多いんですかね、でも最後のミスはその真逆なミスですよねえ……
それに開いてるところの周りがもう分かるところがないからダメ元で開けることもよくありますし報酬の大きさもかなり重要なのかもしれませんね
@ちのみ-u5u 4 роки тому
めちゃくちゃおもしろくてしんだ
@アンチから言わせてもらうと 4 роки тому ⁺¹
AIというよりアルゴリズムっぽい動きですね
@AIAI-ji2wp 4 роки тому ⁺⁹
ベイズ的アプローチで判断の確信度を分析したらもってうまくいくのかな？
僕もやってみよ
@藤田光弘-s6s 3 роки тому ⁺¹
ギャンブル報酬を与えてみては如何でしょうか？
行き詰って50パーセントの確立でどちらか開けないといけない場合
１つは50パーセントで３つの安全エリアが取れる場合と
もう一つは50パーセントで６つの安全エリアが取れる場合は
期待値が違いますよね。
アウト　セーフは50パーセントでも、獲得できるエリアが多い方に重きを置く
結果　ギャンブルが少なくなってより確実に開けるのでは？
@もちもち-k5j 4 роки тому
数字の若いところから問題解決する…とかなら効率上がりそう
@CanonCampus Рік тому
エレコドの設定画面にみえました
カン要素もありますから難しいですねえ
@konens Рік тому
結局人間が考え方を考えてAIに教えている
@行平浩介 4 роки тому
なんでもコツがあるんですな。人間には中々掴めないコツが
@shikaishik 4 роки тому
AIにも哲学は必要みたいですね。但し、AIが哲学を学ぶと、人間よりもはるかに優れたことを考えそうです。
@masakiizawa5754 4 роки тому
数字が表示されているマスについて、
周りの8マスのうちまだ開いていないマスが少ないものから順に着目していきたくなるけど、
それだとアルゴリズムが複雑になったり、計算時間が嵩んだりするんだろうな。
@SYALIREA Рік тому
盤面がどんなにでかくなろうと観測計算するマスは５＊５で固定なのだからこの有限個の全パターンを学習させた方が早い気がする
@butterworld__ 4 роки тому ⁺⁵
最後のガーンでビビった俺氏()
@sakamig 4 роки тому ⁺¹
ゲームでも、上級になると不明の場所でも無理やり開けないとクリアできないときがあるから、AIでもオールクリアは難しいんじゃないかと思います。
@羽賀容 4 роки тому
AIにAIみたいなの作らせたい
@y_nene 2 роки тому
上級、いま使われてる強いAIだと勝率40％くらいらしいです（絶対に運ゲーになる局面が多々あるので）
各マスについて爆弾の確率を評価する、みたいな方法もよさそうですね
@take2853 4 роки тому ⁺⁴
こーじさんに光ファイバーについて解説してほしいです！
@take2853 4 роки тому
いえ違います
@gdgd_gd 4 роки тому ⁺³
でもこれはロジックを考えてあげているのでAIに解かせているとはいえないような？
@ぽよううさん 4 роки тому ⁺¹
マインスイーパーでAIVSAI で戦ったらおもろそう
@中田たくまない 4 роки тому
AI VS AIが何かわからんくてあいぶさいってなんだ？って一瞬思いました（粉ミカン）
@jackal6120 4 роки тому
近隣数マスを判断材料にしたら、広いマスで地続きしないときに判断できなくなるでしょうね。
というか結局こういうルール(アルゴリズム)をAIが編み出すのは難しいんですね
@ryoushisan9974 4 роки тому
横方向で一巡見て手詰まりになったら縦に見ていくとかで二次元的に捜索すればさらに成功率上がりそう。
ただ、上級は定石を知っていても解けない部分が出てくるから難しいかも？
@nylo7921 4 роки тому
開ける→チェックする→開ける　と交互に行動を挟んだりっていうのはダメなのかな
@Karakara104 4 роки тому
四角形だけじゃなくて、三叉路とかランダムな形でやったら凄くなりそう(語彙力)
@flowerflower3437 4 роки тому
情報無いマス開けてるなあと思ったらこーじさんもちゃんと気づいてた
@xyz-cw4do 4 роки тому ⁺⁶
21ゲームでAIを先行にしたら必勝法を編み出せるのか見てみたいです
@Sokka0 4 роки тому ⁺¹
こーじさん凄すぎ！
@アルト-b7w 4 роки тому ⁺³
多い盤面だと、ターン毎に与えていた微笑のマイナス報酬が悪さしている気がします。
何もないのに開けるのはそのためですかね。
改善方法は他の方がコメントされているのを参考にすればよいかと。
あと、初手中央を開けさせるのはプログラムしていい気がします。
@renk1310 14 днів тому
人間が何も忘れないとしたら、「こういう時、これが起こる」みたいな一般化ができないって話を思い出した。詳細を覚えすぎて、抽象化ができないかららしい。人間は詳細を忘れるから構造に注目して、同じ構造のものを似たものとしてまとめることができるらしい
@myui8197 4 роки тому
ガス昇降のイスの仕組みとか物理で解説つてできますか？
@user-Kazar 4 роки тому
..開いてない升目だけではなく数字の升目のときも周囲一升を観測させてペケをつけたりマスを開けられるようになったらサイキョーですね！(鬼難な気もしますが)
@zvs6711 4 роки тому
改良案としては周囲8マスが開いてないマスはそもそも考えずパスしていくとか
分からないとする判断にマイナス報酬を観測範囲で開いている+ピンしているマス数に比例して与えるとかですかね？
@user-ss8xo5bs2t 4 роки тому
なじみのあるゲームをAIがやるのはおもしろかった。面白かぅたぞー！
@tasami6559 4 роки тому
周囲2マスの範囲に空いているマスがひとつもない場所を開けたときマイナス報酬を与えるようにしたら、空いている場所の周囲だけ開けてくれるようになりそう。
@bakugen4579 4 роки тому
さすがです！AIってすげぇ…
@黒炭洋墨 4 роки тому ⁺²
電子データの記録というのを物理的にはどうやっているのかが知りたいです
(データ容量の容量って何？といった)
@もじゃろわかめ 4 роки тому ⁺¹
そうなると、水銀遅延線から再現してもらって・・・
@zvs6711 4 роки тому
自分の知る限りだと物理的な記録原理は、磁気を利用して極性でデータを保存したり(磁気テープ、HDD等)、フリップフロップ回路の自己保持性を利用したり(レジスタ等)、微小なコンデンサに電荷を溜めたりトンネル効果で絶縁体を飛び越させて電子を保持させたり(フラッシュメモリ等)、とかですかね。
@黒炭洋墨 4 роки тому
その辺りを再現するとなると色々な要素が混ざって大変なことになりますかね
@kouma7026 4 роки тому
最近のディープラーニングではもっぱらこういう学習方法をある程度していして、お膳立てしまくる方法ばかりで全くの0から学習というのはほぼほぼないんですよね。ディープラーニングはよく画像処理系でよく使われたりするんですが、人がコードをかける部分はソースコードを用意して、書けない部分だけ任せるというやり方がはやりです。任せる部分も人がチューニングしてネットワークの構造（ひとで例えると脳の構造）をいじって試行錯誤するしかないのが現状のようです。
もしかしたら今回の内容は畳み込みニューラルネットワークを使ってあげるとうまいこと言ってくれるのかもしれませんね。微妙に違いはあるのですが、プーリング層が今回の動画と同じような情報の圧縮ができるので...
@raden-friend 4 роки тому
アルゴリズム探索型の機械学習の話を思い出した
@chino20 4 роки тому
関係のないマス目の情報を考慮しAIが間違えたというよりは、どのマス目が関係するかどうかをAIが学習出来ていなかったという話ですよね
童画中でも触れているランダム要素が邪魔をしそうな気がしますね
@いやまなおじ 4 роки тому
AIにとっての報酬とは何なんでしょうか。
@ゆうのすけ氏 4 роки тому
前のだとAIからしたら爆弾の多い1の周りや2
の周りを押すよりも無地の何も情報もないところ開くもんな、
@bearoffline2887 4 роки тому
こういうゲームをAIでやる必要があるかという疑問はあるけど、「数式をアルゴリズムで解くよりも正確に解くニューラルネットワーク」という論文もあるみたいだし（かなり疑問視されてるけど）
直感に反するけどもしAIが計算方面でさえアルゴリズムを凌駕するとなると...恐ろしいな
@兜丸-z3z 4 роки тому
これからはAIと考えて行く時代になるのか？
@奥歯-c1s 4 роки тому
ぜひお絵かきロジックの強化学習を！
@ユニゾンシフト 4 роки тому
マインスイーパの攻略法かと思ったら違った
@one-lg6ti 4 роки тому
恐怖の30ってゲームをAIに学習させて必勝法にたどり着けるかやってみてほしいです！
@ninomiya-27 4 роки тому
あとは盤面的には90度回転とか反転をしても同じなのに、別物として扱われるのをなんとかするくらい？
@アルト-b7w 4 роки тому
それ何とかする意味あるの？
@yaaaamadataro 4 роки тому
数字だけに注目させればいいのではって思ったけど、周囲14マス見ないとダメかってなった。
盤面が増えれば左下から順じゃなくて数字のマス順になるのかな？
@アルト-b7w 4 роки тому
(周囲の発見の爆弾の数)/(周囲の未開封の爆弾の数)が小さかったり大きかったりするところですかね？
@goldmastervain 4 роки тому
ここいらで第一次、第二次AIブーム時のAIと今のAIの性能差を見てみたい。

Наступне

Автоматичне відтворення

compete with the trained AI and just makes a high-speed round trip in front of the goal