Розмір відео: 1280 X 720853 X 480640 X 360
Показувати елементи керування програвачем
Автоматичне відтворення
Автоповтор
前回の動画ua-cam.com/video/lzsakrTMlNE/v-deo.html
Game OverとGame Clear! の文字の色がわかりやすくなっててちょっと感動した
最初のマスが広がる仕様なのは、最近のWindows(確かWin7以降)に入ってるやつですね。古い仕様だと、最初のマスは「爆弾じゃないことが確定」でした。
そうなんですね!
WindowsVistaはそもそもなんにも教えてくれなかった(僕の)
AIにはつい「ゼロから学習させること」に期待してしまいますが、目的のものにチューニングさせたAIを用意した方が現時点では効率的ですね
あくまで今はだけど勝手に学習すると言うよりはこんなふうに成長するようにみたいなAIが主流ですからねー
終わらないのもマイナス報酬だから、AIが時々当て感っぽい動きをしてるw
マインスイーパーの世界記録やばいんだよね
どういう設定をするかってことが楽しいですねこういうのって時間をあけるとすっと良い解決策が出てくるんよな
動画の「考え方を変えるだけで同じゲームでも上手くいったりいかなかったり「ってところで、チャールズ・M・シュルツさんの“If you're not having fun, you're playing the game wrong.”「もし楽しくなかったら、やり方が間違ってるのかも」という言葉を思い出しました
3:47のGAME OVERの図を見てみたが、本来であれば解ける配置。まだ人間ほどではないですね。
なんとなく将棋のAIが飛躍的に強くなった理由もロジックにあるんだなぁと
シンギュラリティは来るのかなぁ?タスクから、報酬と罰を自動で設定できるようになったら現実味おびてきそう
AI開発者がAIの仕組みを解説してみた 逆強化学習という枠組みが正にそれをしますね
将来絶対人間超えるな
記憶喪失ニキ 感情を手に入れた時AIは人間を越える
鬼舞辻MUZAN 35秒前だと?
白いベーコン 〜前で草の流れが来そうだったので流れはここで止めておく
結果言うね。無理
マインスリーパーは難しいけどハマりますよね
寝てるんですか?()
ですよね
セナルアックス改 さっきまで寝てました(笑)
6×11の爆弾9個を00:00でクリアしました。学習のさせかたすごいです。
00:00はタイムです。
詰将棋、チェス覚えさせたら面白そうです。
確かその系統で1番強いとも言われる人を倒したから、AIが1つに特化すれば人間を超えるってさ…
脱糞星人 囲碁に特化したアルファゼロというAIはたったの24時間の学習で当時チェスの最強のAIを破ったそうですね
AI vs AIの戦いで面白そうな動画紹介してくれませんか?
@@dog4162 そういえばそうでしたね…その繰り返しすれば人間の知能を遥かに超える想像できない領域をいとも簡単にやってのけるんだろうな。
囲碁界隈ではAIの打ち方を学ぶやり方が広がってきてますし、特化したAIは人間に利益をもたらすと思いますね。
AIに理解させるには人間も頭が良くないと駄目ってことだけは解った。
こういうパズルってAIよりアルゴリズムで解く方が簡単だよね
そりゃAIが0から学習するよりやり方知ってる人間が解くように作る方が速いでしょ
文字色への配慮は嬉しい。やはり見る所と流れはシンプルな方が好いですよね。高難度のフィールドが解ける日を待ってますよ!
次はAIに動画編集させよう
低評価が多いとマイナス報酬与えてか30万年後くらいにAIユーチューバーになってるかもね(ホジホジ
その次はAIに視聴者をさせよう(錯乱)
盤面全部みて認識するんじゃなくて一定の範囲内で考えて判断する、言われてみれば確かにそう人間って賢いな、おもろい
強化学習、面白いですね!本格的にやってみようかなぁ
この人ほどAIをいい使い方をしてる人を僕はまだ知らない
ターン数経過でマイナス報酬になるのは条件付けとして良いと思いましたが、2マス先までしか見ないというのは本来機械学習が自分から習得する/しないといけないものなのでは?ある程度のメソッドを与えてしまうと、古典的な機械学習の趣が強いような気がしたのですが、新しい機械学習でも普通に人が方法をインプットしておくのは有りなんでしょうか?
高いパフォーマンスが出せるAIを作るという目的ならば、わざわざ前提知識も無しで0の状態から学習させるというのは非効率的かつ計算資源の無駄になりますから、現実世界で作られるAIでもその方が少ないですよ。
tn 870 確かにおっしゃる通りですね。勉強になります。
tn 870 こうすればクリアできると情報を入れる(学習させる)のであればわかりますが、選択の際の条件を絞ってしまうようなアルゴリズムの動作に近いもので機械学習といえるのでしょうか、機械的に問題を解くアルゴリズムとの差がなくなる気がします
するどいツッコミwルールのインプットのみにしないとおかしいよな。久々にマトモなコメントみた。
@@オオカミ少年-g1e 作ってるのユーチューバだからw
楽しみにしてました!
Flashが終わる前にかつて諦めてきた脱衣マインスイーパー達をクリアしたいんだ。完成を願っている。
これ以上お膳立てしたらアルゴリズムなのでは
はっきりとしたAIの定義はないけど、この人の動画に出てくるのはほとんどAIとは認識されないものばかりだからねでも頭が悪い人にはその違いはわからないからしょうがない
@@yosshi--oq8et 手順を与えずにがちゃがちゃやらせてなんか知らんけどうまくいくってのが自分の感覚に近いんだけど、GAっぽさが強い見せ方されるとショボく感じてしまう。
☺「サングラスをかけたい」
上級になると対応できないのは意外でした。周囲が初級で学習しきれなかった盤面になっっていることが原因なら、上級で学習させるだけでももっと上手くなるかもしれませんね。
2:48 なぜ2マスなんだ?1マス先だけでいいじゃんと思ったが3:58 そういうことか
結局今回の動画の考え方が、普段人間がやってる"開きそうなところを順番にみていく"ということとおなじなんだなぁ~、たぶんだけど・・・・。と思ってコメント見てたら、人工知能じゃない!意見がたくさんあってみなさん思うところは一緒なのかと思いました。
ルールに合わせて人間が手ほどきしてたら それはもう機械学習ではなく ただの人間によって正解するように誘導されたクリックソフトなんだよ プログラミングと変わらない
この学習方法を思い付く棒読みちゃんがすごいのでは?🤔
全部の選択肢を検討して、推定した安全な確率が最も大きいところから開いていく戦略とかよさげ
ん?マインスイーパは基本は運ゲーじゃないんだけど
@@アルト-b7w 強化学習では、推定した報酬の期待値として扱うんやで。だから、ネットワークの出力は確率になるんや
@@sunny-bi9rl それなら、もうやってるんじゃない?逆にやらない選択肢ってあるの?
@@アルト-b7w 動画を見た感じ、左下からみていって、安全なとこは開けるっていってたからそう思ったけど、実際はそうやってるのかな?
考え方を変えるだけで劇的に進歩することがありますよね
3:17 俺に刺さる言葉
考え方っていうか、ここまで教え込んだら人工知能の意味が無いような。。。
これだと学習よりアリゴリズムで解いてる感が、、、前編がうまくいかなかったのは開いているマスの隣の方が周りに何の情報のないマスより爆弾のある確率が高くなってしまっているのが原因ではないでしょうか?報酬を周囲の開封済みマスの個数で差をつけたりカリキュラム学習を爆弾の数ではなくマス目が少ないものからやっていけば違う結果になるのではないでしょうか?
AIって聞くと、どうしても人間が思いもつかなかった方法で攻めてくるやつを期待しちゃうから、人間用の考え方を下敷きにしちゃうのは残念。下敷きの部分を自分で改良していくアルゴリズムって無いんだろうか?
マインスイーパってたまに遠くのマスから爆弾の位置を仮定して行かないと開かないマスとか出てくるから奥が深そう
局所解と全体解が必ず一致するゲームだからこその戦略ですね。赤枠のサイズも学習対象に含めるとより汎化性能が向上するでしょうか?
分からないが続くとマイナスになっちゃうから、どうしても確定できない時は適当に開けちゃうんだろうね
天才AIねぇ期待してますよ
この動画のおかげで自分でもできるようになりました!
こうやってAIに学習させていけばルールすら知らない人にマインスイーパのコツ教えるのも上手くなりそう
覚えまくってやばいAIになりそう(語彙力)
無関係な情報を大量に読み込んで中々成長できないの、発達障害に通ずるものがある気がします。
プログラムとかカリキュラム学習の難しいことはよくわからないけど1.マスに対して動画内の3分類をする2.2×2以内に1の操作で結果が変化するところがあれば先に解く3.2×2内への影響がなければ左下からの検証に戻る見たいな感じにすれば解けそう人間も繋げて考えていくし
ただしこれを永遠に続けてもマインスイーパーに完全勝利する事は出来ない
完全に運で二択のところ、ちょっと躊躇っててかわいい
3:56
そこ運要素無いですよ
つまり、人間のプレイヤーが行っているのと同じロジックでAIにも解かせることにした、ということだね。最初から(ry (笑)
大局観を一度捨てたら強くなった!?
将棋のような大局観が必要なゲームじゃないからでしょうね
上級だと学習時のローラー作戦が通用しなくなるから、そもそもどのマスを開けたらいいかではなく、数字の周り8マスに未開封のマスがあって、三つの判断をその数字を中心に2マス先までの数字を判断材料とさせればより人間の解き方に近くなると思う。
これって旗を置いた時点でゲームオーバーなので人間が練習するより効率よく情報が入っていくということでいいんでしょうか?あと上級は情報のない5×5の部分が多いので「何もしないとマイナスの報酬→じゃあそれ嫌だからヒントないけど踏むね→爆発」ってのが原因でミスが多いんですかね、でも最後のミスはその真逆なミスですよねえ……それに開いてるところの周りがもう分かるところがないからダメ元で開けることもよくありますし報酬の大きさもかなり重要なのかもしれませんね
めちゃくちゃおもしろくてしんだ
AIというよりアルゴリズムっぽい動きですね
ベイズ的アプローチで判断の確信度を分析したらもってうまくいくのかな?僕もやってみよ
ギャンブル報酬を与えてみては如何でしょうか?行き詰って50パーセントの確立でどちらか開けないといけない場合1つは50パーセントで3つの安全エリアが取れる場合ともう一つは50パーセントで6つの安全エリアが取れる場合は期待値が違いますよね。アウト セーフは50パーセントでも、獲得できるエリアが多い方に重きを置く結果 ギャンブルが少なくなってより確実に開けるのでは?
数字の若いところから問題解決する…とかなら効率上がりそう
エレコドの設定画面にみえましたカン要素もありますから難しいですねえ
結局人間が考え方を考えてAIに教えている
なんでもコツがあるんですな。人間には中々掴めないコツが
AIにも哲学は必要みたいですね。但し、AIが哲学を学ぶと、人間よりもはるかに優れたことを考えそうです。
数字が表示されているマスについて、周りの8マスのうちまだ開いていないマスが少ないものから順に着目していきたくなるけど、それだとアルゴリズムが複雑になったり、計算時間が嵩んだりするんだろうな。
盤面がどんなにでかくなろうと観測計算するマスは5*5で固定なのだからこの有限個の全パターンを学習させた方が早い気がする
最後のガーンでビビった俺氏()
ゲームでも、上級になると不明の場所でも無理やり開けないとクリアできないときがあるから、AIでもオールクリアは難しいんじゃないかと思います。
AIにAIみたいなの作らせたい
上級、いま使われてる強いAIだと勝率40%くらいらしいです(絶対に運ゲーになる局面が多々あるので)各マスについて爆弾の確率を評価する、みたいな方法もよさそうですね
こーじさんに光ファイバーについて解説してほしいです!
いえ違います
でもこれはロジックを考えてあげているのでAIに解かせているとはいえないような?
マインスイーパーでAIVSAI で戦ったらおもろそう
AI VS AIが何かわからんくてあいぶさいってなんだ?って一瞬思いました(粉ミカン)
近隣数マスを判断材料にしたら、広いマスで地続きしないときに判断できなくなるでしょうね。というか結局こういうルール(アルゴリズム)をAIが編み出すのは難しいんですね
横方向で一巡見て手詰まりになったら縦に見ていくとかで二次元的に捜索すればさらに成功率上がりそう。ただ、上級は定石を知っていても解けない部分が出てくるから難しいかも?
開ける→チェックする→開ける と交互に行動を挟んだりっていうのはダメなのかな
四角形だけじゃなくて、三叉路とかランダムな形でやったら凄くなりそう(語彙力)
情報無いマス開けてるなあと思ったらこーじさんもちゃんと気づいてた
21ゲームでAIを先行にしたら必勝法を編み出せるのか見てみたいです
こーじさん凄すぎ!
多い盤面だと、ターン毎に与えていた微笑のマイナス報酬が悪さしている気がします。何もないのに開けるのはそのためですかね。改善方法は他の方がコメントされているのを参考にすればよいかと。あと、初手中央を開けさせるのはプログラムしていい気がします。
人間が何も忘れないとしたら、「こういう時、これが起こる」みたいな一般化ができないって話を思い出した。詳細を覚えすぎて、抽象化ができないかららしい。人間は詳細を忘れるから構造に注目して、同じ構造のものを似たものとしてまとめることができるらしい
ガス昇降のイスの仕組みとか物理で解説つてできますか?
..開いてない升目だけではなく数字の升目のときも周囲一升を観測させてペケをつけたりマスを開けられるようになったらサイキョーですね!(鬼難な気もしますが)
改良案としては周囲8マスが開いてないマスはそもそも考えずパスしていくとか分からないとする判断にマイナス報酬を観測範囲で開いている+ピンしているマス数に比例して与えるとかですかね?
なじみのあるゲームをAIがやるのはおもしろかった。面白かぅたぞー!
周囲2マスの範囲に空いているマスがひとつもない場所を開けたときマイナス報酬を与えるようにしたら、空いている場所の周囲だけ開けてくれるようになりそう。
さすがです!AIってすげぇ…
電子データの記録というのを物理的にはどうやっているのかが知りたいです(データ容量の容量って何?といった)
そうなると、水銀遅延線から再現してもらって・・・
自分の知る限りだと物理的な記録原理は、磁気を利用して極性でデータを保存したり(磁気テープ、HDD等)、フリップフロップ回路の自己保持性を利用したり(レジスタ等)、微小なコンデンサに電荷を溜めたりトンネル効果で絶縁体を飛び越させて電子を保持させたり(フラッシュメモリ等)、とかですかね。
その辺りを再現するとなると色々な要素が混ざって大変なことになりますかね
最近のディープラーニングではもっぱらこういう学習方法をある程度していして、お膳立てしまくる方法ばかりで全くの0から学習というのはほぼほぼないんですよね。ディープラーニングはよく画像処理系でよく使われたりするんですが、人がコードをかける部分はソースコードを用意して、書けない部分だけ任せるというやり方がはやりです。任せる部分も人がチューニングしてネットワークの構造(ひとで例えると脳の構造)をいじって試行錯誤するしかないのが現状のようです。もしかしたら今回の内容は畳み込みニューラルネットワークを使ってあげるとうまいこと言ってくれるのかもしれませんね。微妙に違いはあるのですが、プーリング層が今回の動画と同じような情報の圧縮ができるので...
アルゴリズム探索型の機械学習の話を思い出した
関係のないマス目の情報を考慮しAIが間違えたというよりは、どのマス目が関係するかどうかをAIが学習出来ていなかったという話ですよね童画中でも触れているランダム要素が邪魔をしそうな気がしますね
AIにとっての報酬とは何なんでしょうか。
前のだとAIからしたら爆弾の多い1の周りや2の周りを押すよりも無地の何も情報もないところ開くもんな、
こういうゲームをAIでやる必要があるかという疑問はあるけど、「数式をアルゴリズムで解くよりも正確に解くニューラルネットワーク」という論文もあるみたいだし(かなり疑問視されてるけど)直感に反するけどもしAIが計算方面でさえアルゴリズムを凌駕するとなると...恐ろしいな
これからはAIと考えて行く時代になるのか?
ぜひお絵かきロジックの強化学習を!
マインスイーパの攻略法かと思ったら違った
恐怖の30ってゲームをAIに学習させて必勝法にたどり着けるかやってみてほしいです!
あとは盤面的には90度回転とか反転をしても同じなのに、別物として扱われるのをなんとかするくらい?
それ何とかする意味あるの?
数字だけに注目させればいいのではって思ったけど、周囲14マス見ないとダメかってなった。盤面が増えれば左下から順じゃなくて数字のマス順になるのかな?
(周囲の発見の爆弾の数)/(周囲の未開封の爆弾の数)が小さかったり大きかったりするところですかね?
ここいらで第一次、第二次AIブーム時のAIと今のAIの性能差を見てみたい。
前回の動画
ua-cam.com/video/lzsakrTMlNE/v-deo.html
Game OverとGame Clear! の文字の色がわかりやすくなっててちょっと感動した
最初のマスが広がる仕様なのは、最近のWindows(確かWin7以降)に入ってるやつですね。古い仕様だと、最初のマスは「爆弾じゃないことが確定」でした。
そうなんですね!
WindowsVistaはそもそもなんにも教えてくれなかった(僕の)
AIにはつい「ゼロから学習させること」に期待してしまいますが、
目的のものにチューニングさせたAIを用意した方が現時点では効率的ですね
あくまで今はだけど勝手に学習すると言うよりはこんなふうに成長するようにみたいなAIが主流ですからねー
終わらないのもマイナス報酬だから、AIが時々当て感っぽい動きをしてるw
マインスイーパーの世界記録やばいんだよね
どういう設定をするかってことが楽しいですね
こういうのって時間をあけるとすっと良い解決策が出てくるんよな
動画の「考え方を変えるだけで同じゲームでも上手くいったりいかなかったり「ってところで、チャールズ・M・シュルツさんの“If you're not having fun, you're playing the game wrong.”「もし楽しくなかったら、やり方が間違ってるのかも」という言葉を思い出しました
3:47のGAME OVERの図を見てみたが、本来であれば解ける配置。
まだ人間ほどではないですね。
なんとなく将棋のAIが飛躍的に強くなった理由もロジックにあるんだなぁと
シンギュラリティは来るのかなぁ?
タスクから、報酬と罰を自動で設定できるようになったら現実味おびてきそう
AI開発者がAIの仕組みを解説してみた 逆強化学習という枠組みが正にそれをしますね
将来絶対人間超えるな
記憶喪失ニキ
感情を手に入れた時AIは人間を越える
鬼舞辻MUZAN 35秒前だと?
白いベーコン 〜前で草の流れが来そうだったので流れはここで止めておく
結果言うね。無理
マインスリーパーは難しいけどハマりますよね
寝てるんですか?()
ですよね
セナルアックス改 さっきまで寝てました(笑)
6×11の爆弾9個を00:00でクリアしました。
学習のさせかたすごいです。
00:00はタイムです。
詰将棋、チェス覚えさせたら面白そうです。
確かその系統で1番強いとも言われる人を倒したから、AIが1つに特化すれば人間を超えるってさ…
脱糞星人 囲碁に特化したアルファゼロというAIはたったの24時間の学習で当時チェスの最強のAIを破ったそうですね
AI vs AIの戦いで面白そうな動画紹介してくれませんか?
@@dog4162
そういえばそうでしたね…その繰り返しすれば人間の知能を遥かに超える想像できない領域をいとも簡単にやってのけるんだろうな。
囲碁界隈ではAIの打ち方を学ぶやり方が広がってきてますし、特化したAIは人間に利益をもたらすと思いますね。
AIに理解させるには人間も頭が良くないと駄目ってことだけは解った。
こういうパズルってAIよりアルゴリズムで解く方が簡単だよね
そりゃAIが0から学習するよりやり方知ってる人間が解くように作る方が速いでしょ
文字色への配慮は嬉しい。
やはり見る所と流れはシンプルな方が好いですよね。
高難度のフィールドが解ける日を待ってますよ!
次はAIに動画編集させよう
低評価が多いとマイナス報酬与えてか
30万年後くらいにAIユーチューバーになってるかもね(ホジホジ
その次はAIに視聴者をさせよう(錯乱)
盤面全部みて認識するんじゃなくて一定の範囲内で考えて判断する、言われてみれば確かにそう
人間って賢いな、おもろい
強化学習、面白いですね!
本格的にやってみようかなぁ
この人ほどAIをいい使い方をしてる人を僕はまだ知らない
ターン数経過でマイナス報酬になるのは条件付けとして良いと思いましたが、2マス先までしか見ないというのは本来機械学習が自分から習得する/しないといけないものなのでは?
ある程度のメソッドを与えてしまうと、古典的な機械学習の趣が強いような気がしたのですが、新しい機械学習でも普通に人が方法をインプットしておくのは有りなんでしょうか?
高いパフォーマンスが出せるAIを作るという目的ならば、わざわざ前提知識も無しで0の状態から学習させるというのは非効率的かつ計算資源の無駄になりますから、現実世界で作られるAIでもその方が少ないですよ。
tn 870 確かにおっしゃる通りですね。勉強になります。
tn 870 こうすればクリアできると情報を入れる(学習させる)のであればわかりますが、選択の際の条件を絞ってしまうようなアルゴリズムの動作に近いもので機械学習といえるのでしょうか、機械的に問題を解くアルゴリズムとの差がなくなる気がします
するどいツッコミwルールのインプットのみにしないとおかしいよな。久々にマトモなコメントみた。
@@オオカミ少年-g1e
作ってるのユーチューバだからw
楽しみにしてました!
Flashが終わる前にかつて諦めてきた脱衣マインスイーパー達をクリアしたいんだ。
完成を願っている。
これ以上お膳立てしたらアルゴリズムなのでは
はっきりとしたAIの定義はないけど、
この人の動画に出てくるのはほとんどAIとは認識されないものばかりだからね
でも頭が悪い人にはその違いはわからないからしょうがない
@@yosshi--oq8et 手順を与えずにがちゃがちゃやらせてなんか知らんけどうまくいくってのが自分の感覚に近いんだけど、GAっぽさが強い見せ方されるとショボく感じてしまう。
☺「サングラスをかけたい」
上級になると対応できないのは意外でした。周囲が初級で学習しきれなかった盤面になっっていることが原因なら、上級で学習させるだけでももっと上手くなるかもしれませんね。
2:48 なぜ2マスなんだ?1マス先だけでいいじゃんと思ったが
3:58 そういうことか
結局今回の動画の考え方が、普段人間がやってる"開きそうなところを順番にみていく"ということとおなじなんだなぁ~、たぶんだけど・・・・。
と思ってコメント見てたら、人工知能じゃない!意見がたくさんあって
みなさん思うところは一緒なのかと思いました。
ルールに合わせて人間が手ほどきしてたら それはもう機械学習ではなく ただの人間によって正解するように誘導されたクリックソフトなんだよ プログラミングと変わらない
この学習方法を思い付く棒読みちゃんがすごいのでは?🤔
全部の選択肢を検討して、推定した安全な確率が最も大きいところから開いていく戦略とかよさげ
ん?マインスイーパは基本は運ゲーじゃないんだけど
@@アルト-b7w 強化学習では、推定した報酬の期待値として扱うんやで。だから、ネットワークの出力は確率になるんや
@@sunny-bi9rl それなら、もうやってるんじゃない?
逆にやらない選択肢ってあるの?
@@アルト-b7w 動画を見た感じ、左下からみていって、安全なとこは開けるっていってたからそう思ったけど、
実際はそうやってるのかな?
考え方を変えるだけで
劇的に進歩することがありますよね
3:17 俺に刺さる言葉
考え方っていうか、ここまで教え込んだら人工知能の意味が無いような。。。
これだと学習よりアリゴリズムで解いてる感が、、、前編がうまくいかなかったのは開いているマスの隣の方が周りに何の情報のないマスより爆弾のある確率が高くなってしまっているのが原因ではないでしょうか?報酬を周囲の開封済みマスの個数で差をつけたりカリキュラム学習を爆弾の数ではなくマス目が少ないものからやっていけば違う結果になるのではないでしょうか?
AIって聞くと、どうしても人間が思いもつかなかった方法で攻めてくるやつを期待しちゃうから、人間用の考え方を下敷きにしちゃうのは残念。
下敷きの部分を自分で改良していくアルゴリズムって無いんだろうか?
マインスイーパってたまに遠くのマスから爆弾の位置を仮定して行かないと開かないマスとか出てくるから奥が深そう
局所解と全体解が必ず一致するゲームだからこその戦略ですね。
赤枠のサイズも学習対象に含めるとより汎化性能が向上するでしょうか?
分からないが続くとマイナスになっちゃうから、どうしても確定できない時は適当に開けちゃうんだろうね
天才AIねぇ
期待してますよ
この動画のおかげで自分でもできるようになりました!
こうやってAIに学習させていけばルールすら知らない人にマインスイーパのコツ教えるのも上手くなりそう
覚えまくってやばいAIになりそう(語彙力)
無関係な情報を大量に読み込んで中々成長できないの、発達障害に通ずるものがある気がします。
プログラムとかカリキュラム学習の難しいことはよくわからないけど
1.マスに対して動画内の3分類をする
2.2×2以内に1の操作で結果が変化するところがあれば先に解く
3.2×2内への影響がなければ左下からの検証に戻る
見たいな感じにすれば解けそう
人間も繋げて考えていくし
ただしこれを永遠に続けてもマインスイーパーに完全勝利する事は出来ない
完全に運で二択のところ、ちょっと躊躇っててかわいい
3:56
そこ運要素無いですよ
つまり、人間のプレイヤーが行っているのと同じロジックでAIにも解かせることにした、ということだね。最初から(ry (笑)
大局観を一度捨てたら強くなった!?
将棋のような大局観が必要なゲームじゃないからでしょうね
上級だと学習時のローラー作戦が通用しなくなるから、そもそもどのマスを開けたらいいかではなく、数字の周り8マスに未開封のマスがあって、三つの判断をその数字を中心に2マス先までの数字を判断材料とさせればより人間の解き方に近くなると思う。
これって旗を置いた時点でゲームオーバーなので人間が練習するより効率よく情報が入っていくということでいいんでしょうか?
あと上級は情報のない5×5の部分が多いので「何もしないとマイナスの報酬→じゃあそれ嫌だからヒントないけど踏むね→爆発」ってのが原因でミスが多いんですかね、でも最後のミスはその真逆なミスですよねえ……
それに開いてるところの周りがもう分かるところがないからダメ元で開けることもよくありますし報酬の大きさもかなり重要なのかもしれませんね
めちゃくちゃおもしろくてしんだ
AIというよりアルゴリズムっぽい動きですね
ベイズ的アプローチで判断の確信度を分析したらもってうまくいくのかな?
僕もやってみよ
ギャンブル報酬を与えてみては如何でしょうか?
行き詰って50パーセントの確立でどちらか開けないといけない場合
1つは50パーセントで3つの安全エリアが取れる場合と
もう一つは50パーセントで6つの安全エリアが取れる場合は
期待値が違いますよね。
アウト セーフは50パーセントでも、獲得できるエリアが多い方に重きを置く
結果 ギャンブルが少なくなってより確実に開けるのでは?
数字の若いところから問題解決する…とかなら効率上がりそう
エレコドの設定画面にみえました
カン要素もありますから難しいですねえ
結局人間が考え方を考えてAIに教えている
なんでもコツがあるんですな。人間には中々掴めないコツが
AIにも哲学は必要みたいですね。但し、AIが哲学を学ぶと、人間よりもはるかに優れたことを考えそうです。
数字が表示されているマスについて、
周りの8マスのうちまだ開いていないマスが少ないものから順に着目していきたくなるけど、
それだとアルゴリズムが複雑になったり、計算時間が嵩んだりするんだろうな。
盤面がどんなにでかくなろうと観測計算するマスは5*5で固定なのだからこの有限個の全パターンを学習させた方が早い気がする
最後のガーンでビビった俺氏()
ゲームでも、上級になると不明の場所でも無理やり開けないとクリアできないときがあるから、AIでもオールクリアは難しいんじゃないかと思います。
AIにAIみたいなの作らせたい
上級、いま使われてる強いAIだと勝率40%くらいらしいです(絶対に運ゲーになる局面が多々あるので)
各マスについて爆弾の確率を評価する、みたいな方法もよさそうですね
こーじさんに光ファイバーについて解説してほしいです!
いえ違います
でもこれはロジックを考えてあげているのでAIに解かせているとはいえないような?
マインスイーパーでAIVSAI で戦ったらおもろそう
AI VS AIが何かわからんくてあいぶさいってなんだ?って一瞬思いました(粉ミカン)
近隣数マスを判断材料にしたら、広いマスで地続きしないときに判断できなくなるでしょうね。
というか結局こういうルール(アルゴリズム)をAIが編み出すのは難しいんですね
横方向で一巡見て手詰まりになったら縦に見ていくとかで二次元的に捜索すればさらに成功率上がりそう。
ただ、上級は定石を知っていても解けない部分が出てくるから難しいかも?
開ける→チェックする→開ける と交互に行動を挟んだりっていうのはダメなのかな
四角形だけじゃなくて、三叉路とかランダムな形でやったら凄くなりそう(語彙力)
情報無いマス開けてるなあと思ったらこーじさんもちゃんと気づいてた
21ゲームでAIを先行にしたら必勝法を編み出せるのか見てみたいです
こーじさん凄すぎ!
多い盤面だと、ターン毎に与えていた微笑のマイナス報酬が悪さしている気がします。
何もないのに開けるのはそのためですかね。
改善方法は他の方がコメントされているのを参考にすればよいかと。
あと、初手中央を開けさせるのはプログラムしていい気がします。
人間が何も忘れないとしたら、「こういう時、これが起こる」みたいな一般化ができないって話を思い出した。詳細を覚えすぎて、抽象化ができないかららしい。人間は詳細を忘れるから構造に注目して、同じ構造のものを似たものとしてまとめることができるらしい
ガス昇降のイスの仕組みとか物理で解説つてできますか?
..開いてない升目だけではなく数字の升目のときも周囲一升を観測させてペケをつけたりマスを開けられるようになったらサイキョーですね!(鬼難な気もしますが)
改良案としては周囲8マスが開いてないマスはそもそも考えずパスしていくとか
分からないとする判断にマイナス報酬を観測範囲で開いている+ピンしているマス数に比例して与えるとかですかね?
なじみのあるゲームをAIがやるのはおもしろかった。面白かぅたぞー!
周囲2マスの範囲に空いているマスがひとつもない場所を開けたときマイナス報酬を与えるようにしたら、空いている場所の周囲だけ開けてくれるようになりそう。
さすがです!AIってすげぇ…
電子データの記録というのを物理的にはどうやっているのかが知りたいです
(データ容量の容量って何?といった)
そうなると、水銀遅延線から再現してもらって・・・
自分の知る限りだと物理的な記録原理は、磁気を利用して極性でデータを保存したり(磁気テープ、HDD等)、フリップフロップ回路の自己保持性を利用したり(レジスタ等)、微小なコンデンサに電荷を溜めたりトンネル効果で絶縁体を飛び越させて電子を保持させたり(フラッシュメモリ等)、とかですかね。
その辺りを再現するとなると色々な要素が混ざって大変なことになりますかね
最近のディープラーニングではもっぱらこういう学習方法をある程度していして、お膳立てしまくる方法ばかりで全くの0から学習というのはほぼほぼないんですよね。ディープラーニングはよく画像処理系でよく使われたりするんですが、人がコードをかける部分はソースコードを用意して、書けない部分だけ任せるというやり方がはやりです。任せる部分も人がチューニングしてネットワークの構造(ひとで例えると脳の構造)をいじって試行錯誤するしかないのが現状のようです。
もしかしたら今回の内容は畳み込みニューラルネットワークを使ってあげるとうまいこと言ってくれるのかもしれませんね。微妙に違いはあるのですが、プーリング層が今回の動画と同じような情報の圧縮ができるので...
アルゴリズム探索型の機械学習の話を思い出した
関係のないマス目の情報を考慮しAIが間違えたというよりは、どのマス目が関係するかどうかをAIが学習出来ていなかったという話ですよね
童画中でも触れているランダム要素が邪魔をしそうな気がしますね
AIにとっての報酬とは何なんでしょうか。
前のだとAIからしたら爆弾の多い1の周りや2
の周りを押すよりも無地の何も情報もないところ開くもんな、
こういうゲームをAIでやる必要があるかという疑問はあるけど、「数式をアルゴリズムで解くよりも正確に解くニューラルネットワーク」という論文もあるみたいだし(かなり疑問視されてるけど)
直感に反するけどもしAIが計算方面でさえアルゴリズムを凌駕するとなると...恐ろしいな
これからはAIと考えて行く時代になるのか?
ぜひお絵かきロジックの強化学習を!
マインスイーパの攻略法かと思ったら違った
恐怖の30ってゲームをAIに学習させて必勝法にたどり着けるかやってみてほしいです!
あとは盤面的には90度回転とか反転をしても同じなのに、別物として扱われるのをなんとかするくらい?
それ何とかする意味あるの?
数字だけに注目させればいいのではって思ったけど、周囲14マス見ないとダメかってなった。
盤面が増えれば左下から順じゃなくて数字のマス順になるのかな?
(周囲の発見の爆弾の数)/(周囲の未開封の爆弾の数)が小さかったり大きかったりするところですかね?
ここいらで第一次、第二次AIブーム時のAIと今のAIの性能差を見てみたい。