Розмір відео: 1280 X 720853 X 480640 X 360
Показувати елементи керування програвачем
Автоматичне відтворення
Автоповтор
前回の動画ua-cam.com/video/lzsakrTMlNE/v-deo.html
☺「サングラスをかけたい」
考え方っていうか、ここまで教え込んだら人工知能の意味が無いような。。。
つまり、人間のプレイヤーが行っているのと同じロジックでAIにも解かせることにした、ということだね。最初から(ry (笑)
エレコドの設定画面にみえましたカン要素もありますから難しいですねえ
AIって聞くと、どうしても人間が思いもつかなかった方法で攻めてくるやつを期待しちゃうから、人間用の考え方を下敷きにしちゃうのは残念。下敷きの部分を自分で改良していくアルゴリズムって無いんだろうか?
結局今回の動画の考え方が、普段人間がやってる"開きそうなところを順番にみていく"ということとおなじなんだなぁ~、たぶんだけど・・・・。と思ってコメント見てたら、人工知能じゃない!意見がたくさんあってみなさん思うところは一緒なのかと思いました。
ギャンブル報酬を与えてみては如何でしょうか?行き詰って50パーセントの確立でどちらか開けないといけない場合1つは50パーセントで3つの安全エリアが取れる場合ともう一つは50パーセントで6つの安全エリアが取れる場合は期待値が違いますよね。アウト セーフは50パーセントでも、獲得できるエリアが多い方に重きを置く結果 ギャンブルが少なくなってより確実に開けるのでは?
ルールに合わせて人間が手ほどきしてたら それはもう機械学習ではなく ただの人間によって正解するように誘導されたクリックソフトなんだよ プログラミングと変わらない
結局人間が考え方を考えてAIに教えている
これだと学習よりアリゴリズムで解いてる感が、、、前編がうまくいかなかったのは開いているマスの隣の方が周りに何の情報のないマスより爆弾のある確率が高くなってしまっているのが原因ではないでしょうか?報酬を周囲の開封済みマスの個数で差をつけたりカリキュラム学習を爆弾の数ではなくマス目が少ないものからやっていけば違う結果になるのではないでしょうか?
AIというよりアルゴリズムっぽい動きですね
でもこれはロジックを考えてあげているのでAIに解かせているとはいえないような?
これって旗を置いた時点でゲームオーバーなので人間が練習するより効率よく情報が入っていくということでいいんでしょうか?あと上級は情報のない5×5の部分が多いので「何もしないとマイナスの報酬→じゃあそれ嫌だからヒントないけど踏むね→爆発」ってのが原因でミスが多いんですかね、でも最後のミスはその真逆なミスですよねえ……それに開いてるところの周りがもう分かるところがないからダメ元で開けることもよくありますし報酬の大きさもかなり重要なのかもしれませんね
情報がないマスを開く時はマイナス報酬を与える、とかどうかねー
評価低いマインスイーパネタで入れたら初手爆弾が有り得るタイプで言葉通り初見殺しだったの思い出した
盤面全部みて認識するんじゃなくて一定の範囲内で考えて判断する、言われてみれば確かにそう人間って賢いな、おもろい
全部の選択肢を検討して、推定した安全な確率が最も大きいところから開いていく戦略とかよさげ
ん?マインスイーパは基本は運ゲーじゃないんだけど
@@アルト-b7w 強化学習では、推定した報酬の期待値として扱うんやで。だから、ネットワークの出力は確率になるんや
@@sunny-bi9rl それなら、もうやってるんじゃない?逆にやらない選択肢ってあるの?
@@アルト-b7w 動画を見た感じ、左下からみていって、安全なとこは開けるっていってたからそう思ったけど、実際はそうやってるのかな?
3:47のGAME OVERの図を見てみたが、本来であれば解ける配置。まだ人間ほどではないですね。
めちゃくちゃおもしろくてしんだ
こういうゲームをAIでやる必要があるかという疑問はあるけど、「数式をアルゴリズムで解くよりも正確に解くニューラルネットワーク」という論文もあるみたいだし(かなり疑問視されてるけど)直感に反するけどもしAIが計算方面でさえアルゴリズムを凌駕するとなると...恐ろしいな
ただしこれを永遠に続けてもマインスイーパーに完全勝利する事は出来ない
Game OverとGame Clear! の文字の色がわかりやすくなっててちょっと感動した
3:17 俺に刺さる言葉
この人ほどAIをいい使い方をしてる人を僕はまだ知らない
AIにはつい「ゼロから学習させること」に期待してしまいますが、目的のものにチューニングさせたAIを用意した方が現時点では効率的ですね
あくまで今はだけど勝手に学習すると言うよりはこんなふうに成長するようにみたいなAIが主流ですからねー
分からないが続くとマイナスになっちゃうから、どうしても確定できない時は適当に開けちゃうんだろうね
なんでもコツがあるんですな。人間には中々掴めないコツが
オセロは出来そうですね。
関係のないマス目の情報を考慮しAIが間違えたというよりは、どのマス目が関係するかどうかをAIが学習出来ていなかったという話ですよね童画中でも触れているランダム要素が邪魔をしそうな気がしますね
最初のマスが広がる仕様なのは、最近のWindows(確かWin7以降)に入ってるやつですね。古い仕様だと、最初のマスは「爆弾じゃないことが確定」でした。
そうなんですね!
WindowsVistaはそもそもなんにも教えてくれなかった(僕の)
2:48 なぜ2マスなんだ?1マス先だけでいいじゃんと思ったが3:58 そういうことか
盤面がどんなにでかくなろうと観測計算するマスは5*5で固定なのだからこの有限個の全パターンを学習させた方が早い気がする
マインスイーパの攻略法かと思ったら違った
sony社のNNCのAffineとConvolutionを見ている気分になった
マインスイーパーでAIVSAI で戦ったらおもろそう
AI VS AIが何かわからんくてあいぶさいってなんだ?って一瞬思いました(粉ミカン)
数字だけに注目させればいいのではって思ったけど、周囲14マス見ないとダメかってなった。盤面が増えれば左下から順じゃなくて数字のマス順になるのかな?
(周囲の発見の爆弾の数)/(周囲の未開封の爆弾の数)が小さかったり大きかったりするところですかね?
改良案としては周囲8マスが開いてないマスはそもそも考えずパスしていくとか分からないとする判断にマイナス報酬を観測範囲で開いている+ピンしているマス数に比例して与えるとかですかね?
AIにとっての報酬とは何なんでしょうか。
そんな難しいゲームでも無いのに強化学習させるのにここまで苦労するなんて…なんで人間は勝手に学習していけるんだろう
人間が思い付けないゲームは習得するのにかなり苦労すると思うよ
探索範囲がまだ広すぎるのでは?25マスである意味は?9マスでいいのでは?
流石にそれは狭い。そこまで単純なゲームじゃ無かったはず
AIにも哲学は必要みたいですね。但し、AIが哲学を学ぶと、人間よりもはるかに優れたことを考えそうです。
AIにAIみたいなの作らせたい
アルゴリズム探索型の機械学習の話を思い出した
初手爆弾だったことがある気がするがosが古い時代の仕様か?まぁ完全に無慈悲なものより面白い
AIおバカさんじゃん!
最近のディープラーニングではもっぱらこういう学習方法をある程度していして、お膳立てしまくる方法ばかりで全くの0から学習というのはほぼほぼないんですよね。ディープラーニングはよく画像処理系でよく使われたりするんですが、人がコードをかける部分はソースコードを用意して、書けない部分だけ任せるというやり方がはやりです。任せる部分も人がチューニングしてネットワークの構造(ひとで例えると脳の構造)をいじって試行錯誤するしかないのが現状のようです。もしかしたら今回の内容は畳み込みニューラルネットワークを使ってあげるとうまいこと言ってくれるのかもしれませんね。微妙に違いはあるのですが、プーリング層が今回の動画と同じような情報の圧縮ができるので...
完全に運で二択のところ、ちょっと躊躇っててかわいい
3:56
そこ運要素無いですよ
遺伝的アルゴリズムぅ
開ける→チェックする→開ける と交互に行動を挟んだりっていうのはダメなのかな
こうやってみると、ゲームを解くアルゴリズムとAIって何が違うんだろう?
人間が攻略法を考えてプログラムに落とし込む→アルゴリズムコンピューターが自分で攻略法を考えて実践する→AIって感じじゃないですかね? 今回「左下から順に見ていけ」と具体的な指示をしてしまったのはAI的にはちょっとズルかも
数字の若いところから問題解決する…とかなら効率上がりそう
終わらないのもマイナス報酬だから、AIが時々当て感っぽい動きをしてるw
あとは盤面的には90度回転とか反転をしても同じなのに、別物として扱われるのをなんとかするくらい?
それ何とかする意味あるの?
動画の「考え方を変えるだけで同じゲームでも上手くいったりいかなかったり「ってところで、チャールズ・M・シュルツさんの“If you're not having fun, you're playing the game wrong.”「もし楽しくなかったら、やり方が間違ってるのかも」という言葉を思い出しました
AIに理解させるには人間も頭が良くないと駄目ってことだけは解った。
クリアできるようになった代わりに人間味がなくなりましたね。 人間っぽい思考パターンを作るのは難しいのですね
上級だと学習時のローラー作戦が通用しなくなるから、そもそもどのマスを開けたらいいかではなく、数字の周り8マスに未開封のマスがあって、三つの判断をその数字を中心に2マス先までの数字を判断材料とさせればより人間の解き方に近くなると思う。
数字が表示されているマスについて、周りの8マスのうちまだ開いていないマスが少ないものから順に着目していきたくなるけど、それだとアルゴリズムが複雑になったり、計算時間が嵩んだりするんだろうな。
前のだとAIからしたら爆弾の多い1の周りや2の周りを押すよりも無地の何も情報もないところ開くもんな、
マインスイーパー上級は運ゲー要素が強すぎて面白くないからなぁ。ともあれ、マインスイーパはマス目ごとにYes、NotYesを判断させる→YESマスを全部つぶす→新たに判明したYesをつぶしてゆく、といった「人間的な」方法が最適かもしれませんね。運試しの状況での対処はわからないけれども。個人的には、スパーダ―ソリティアの勝率最大化をAIで実現してほしいです!! やり直しアリの条件で。10年くらい前にはまった時にはぜいぜい勝率20パーセント程度だったので。
この動画のおかげで自分でもできるようになりました!
マインスリーパーは難しいけどハマりますよね
寝てるんですか?()
ですよね
セナルアックス改 さっきまで寝てました(笑)
最初のマスにそんな設定あったか?それなりの確率で初手爆弾や1マスしかあかないとか普通だったと思ったけどロボットに物を取れと命令すると天井からその物体への距離を測定しだしたなんて話も聞いたことがあります。そういう取捨選択まで学習させようとなると膨大な学習とスペックが必要になるんでしょうね。
古いバージョンは1マスだけとかあったらしいです。「新しいゲーム」ではなく「やり直し」の方を選択してないですか?
お、フラグを建てるという案が採用されたか?ただの自意識過剰か
なんだか大学の准教授あたりが論文にして発表してそうな内容
プログラムとかカリキュラム学習の難しいことはよくわからないけど1.マスに対して動画内の3分類をする2.2×2以内に1の操作で結果が変化するところがあれば先に解く3.2×2内への影響がなければ左下からの検証に戻る見たいな感じにすれば解けそう人間も繋げて考えていくし
考え方を変えるだけで劇的に進歩することがありますよね
上級、いま使われてる強いAIだと勝率40%くらいらしいです(絶対に運ゲーになる局面が多々あるので)各マスについて爆弾の確率を評価する、みたいな方法もよさそうですね
6×11の爆弾9個を00:00でクリアしました。学習のさせかたすごいです。
00:00はタイムです。
どういう設定をするかってことが楽しいですねこういうのって時間をあけるとすっと良い解決策が出てくるんよな
ガス昇降のイスの仕組みとか物理で解説つてできますか?
ターン数経過でマイナス報酬になるのは条件付けとして良いと思いましたが、2マス先までしか見ないというのは本来機械学習が自分から習得する/しないといけないものなのでは?ある程度のメソッドを与えてしまうと、古典的な機械学習の趣が強いような気がしたのですが、新しい機械学習でも普通に人が方法をインプットしておくのは有りなんでしょうか?
高いパフォーマンスが出せるAIを作るという目的ならば、わざわざ前提知識も無しで0の状態から学習させるというのは非効率的かつ計算資源の無駄になりますから、現実世界で作られるAIでもその方が少ないですよ。
tn 870 確かにおっしゃる通りですね。勉強になります。
tn 870 こうすればクリアできると情報を入れる(学習させる)のであればわかりますが、選択の際の条件を絞ってしまうようなアルゴリズムの動作に近いもので機械学習といえるのでしょうか、機械的に問題を解くアルゴリズムとの差がなくなる気がします
するどいツッコミwルールのインプットのみにしないとおかしいよな。久々にマトモなコメントみた。
@@オオカミ少年-g1e 作ってるのユーチューバだからw
1:25左のやつおかしくない?
1 1💣1無 11 1 1無 💣 2なら成立するんじゃない?
全部爆弾にしたらAIはやらなくなるんかな・・・
将来絶対人間超えるな
記憶喪失ニキ 感情を手に入れた時AIは人間を越える
鬼舞辻MUZAN 35秒前だと?
白いベーコン 〜前で草の流れが来そうだったので流れはここで止めておく
結果言うね。無理
上級になると対応できないのは意外でした。周囲が初級で学習しきれなかった盤面になっっていることが原因なら、上級で学習させるだけでももっと上手くなるかもしれませんね。
なんとなく将棋のAIが飛躍的に強くなった理由もロジックにあるんだなぁと
マインスイーパーの世界記録やばいんだよね
横方向で一巡見て手詰まりになったら縦に見ていくとかで二次元的に捜索すればさらに成功率上がりそう。ただ、上級は定石を知っていても解けない部分が出てくるから難しいかも?
まあ、普通ならこう考えるよねー強化学習使うんじゃなくて、パターンマッチングでいける気がするけど
これからはAIと考えて行く時代になるのか?
ゲームでも、上級になると不明の場所でも無理やり開けないとクリアできないときがあるから、AIでもオールクリアは難しいんじゃないかと思います。
子供のぼくにわ分からないやだけども面白い!
Flashが終わる前にかつて諦めてきた脱衣マインスイーパー達をクリアしたいんだ。完成を願っている。
そりゃあ、セオリーの1つを教えてる訳だから上手くなるわw
昔、マインスイーパで67個の爆弾の運ゲやってた人がいたので、それをAIにやらせてみてください
追記その動画しらべたら、十年前でした。時間が経つのは早いなぁ
恐怖の30ってゲームをAIに学習させて必勝法にたどり着けるかやってみてほしいです!
無関係な情報を大量に読み込んで中々成長できないの、発達障害に通ずるものがある気がします。
近隣数マスを判断材料にしたら、広いマスで地続きしないときに判断できなくなるでしょうね。というか結局こういうルール(アルゴリズム)をAIが編み出すのは難しいんですね
四角形だけじゃなくて、三叉路とかランダムな形でやったら凄くなりそう(語彙力)
周囲2マスの範囲に空いているマスがひとつもない場所を開けたときマイナス報酬を与えるようにしたら、空いている場所の周囲だけ開けてくれるようになりそう。
この学習方法を思い付く棒読みちゃんがすごいのでは?🤔
なじみのあるゲームをAIがやるのはおもしろかった。面白かぅたぞー!
局所解と全体解が必ず一致するゲームだからこその戦略ですね。赤枠のサイズも学習対象に含めるとより汎化性能が向上するでしょうか?
電子データの記録というのを物理的にはどうやっているのかが知りたいです(データ容量の容量って何?といった)
そうなると、水銀遅延線から再現してもらって・・・
自分の知る限りだと物理的な記録原理は、磁気を利用して極性でデータを保存したり(磁気テープ、HDD等)、フリップフロップ回路の自己保持性を利用したり(レジスタ等)、微小なコンデンサに電荷を溜めたりトンネル効果で絶縁体を飛び越させて電子を保持させたり(フラッシュメモリ等)、とかですかね。
その辺りを再現するとなると色々な要素が混ざって大変なことになりますかね
ぶっちゃけルールベースで出来るんだし、あえて機械学習するならその再現を試みた方が早そう未確定マスの判断をするより数字から見てどこにあるか考える方が良いと思うけどなそれともルールに寄りすぎるから避けたのかな
なんかAIくんかわいい
こうやってAIに学習させていけばルールすら知らない人にマインスイーパのコツ教えるのも上手くなりそう
一か八かで開けて成功したら大量の報酬与えるように教育したら、ギャンブル依存症のAIになったりしないのかね?
前回の動画
ua-cam.com/video/lzsakrTMlNE/v-deo.html
☺「サングラスをかけたい」
考え方っていうか、ここまで教え込んだら人工知能の意味が無いような。。。
つまり、人間のプレイヤーが行っているのと同じロジックでAIにも解かせることにした、ということだね。最初から(ry (笑)
エレコドの設定画面にみえました
カン要素もありますから難しいですねえ
AIって聞くと、どうしても人間が思いもつかなかった方法で攻めてくるやつを期待しちゃうから、人間用の考え方を下敷きにしちゃうのは残念。
下敷きの部分を自分で改良していくアルゴリズムって無いんだろうか?
結局今回の動画の考え方が、普段人間がやってる"開きそうなところを順番にみていく"ということとおなじなんだなぁ~、たぶんだけど・・・・。
と思ってコメント見てたら、人工知能じゃない!意見がたくさんあって
みなさん思うところは一緒なのかと思いました。
ギャンブル報酬を与えてみては如何でしょうか?
行き詰って50パーセントの確立でどちらか開けないといけない場合
1つは50パーセントで3つの安全エリアが取れる場合と
もう一つは50パーセントで6つの安全エリアが取れる場合は
期待値が違いますよね。
アウト セーフは50パーセントでも、獲得できるエリアが多い方に重きを置く
結果 ギャンブルが少なくなってより確実に開けるのでは?
ルールに合わせて人間が手ほどきしてたら それはもう機械学習ではなく ただの人間によって正解するように誘導されたクリックソフトなんだよ プログラミングと変わらない
結局人間が考え方を考えてAIに教えている
これだと学習よりアリゴリズムで解いてる感が、、、前編がうまくいかなかったのは開いているマスの隣の方が周りに何の情報のないマスより爆弾のある確率が高くなってしまっているのが原因ではないでしょうか?報酬を周囲の開封済みマスの個数で差をつけたりカリキュラム学習を爆弾の数ではなくマス目が少ないものからやっていけば違う結果になるのではないでしょうか?
AIというよりアルゴリズムっぽい動きですね
でもこれはロジックを考えてあげているのでAIに解かせているとはいえないような?
これって旗を置いた時点でゲームオーバーなので人間が練習するより効率よく情報が入っていくということでいいんでしょうか?
あと上級は情報のない5×5の部分が多いので「何もしないとマイナスの報酬→じゃあそれ嫌だからヒントないけど踏むね→爆発」ってのが原因でミスが多いんですかね、でも最後のミスはその真逆なミスですよねえ……
それに開いてるところの周りがもう分かるところがないからダメ元で開けることもよくありますし報酬の大きさもかなり重要なのかもしれませんね
情報がないマスを開く時はマイナス報酬を与える、とかどうかねー
評価低いマインスイーパネタで入れたら初手爆弾が有り得るタイプで言葉通り初見殺しだったの思い出した
盤面全部みて認識するんじゃなくて一定の範囲内で考えて判断する、言われてみれば確かにそう
人間って賢いな、おもろい
全部の選択肢を検討して、推定した安全な確率が最も大きいところから開いていく戦略とかよさげ
ん?マインスイーパは基本は運ゲーじゃないんだけど
@@アルト-b7w 強化学習では、推定した報酬の期待値として扱うんやで。だから、ネットワークの出力は確率になるんや
@@sunny-bi9rl それなら、もうやってるんじゃない?
逆にやらない選択肢ってあるの?
@@アルト-b7w 動画を見た感じ、左下からみていって、安全なとこは開けるっていってたからそう思ったけど、
実際はそうやってるのかな?
3:47のGAME OVERの図を見てみたが、本来であれば解ける配置。
まだ人間ほどではないですね。
めちゃくちゃおもしろくてしんだ
こういうゲームをAIでやる必要があるかという疑問はあるけど、「数式をアルゴリズムで解くよりも正確に解くニューラルネットワーク」という論文もあるみたいだし(かなり疑問視されてるけど)
直感に反するけどもしAIが計算方面でさえアルゴリズムを凌駕するとなると...恐ろしいな
ただしこれを永遠に続けてもマインスイーパーに完全勝利する事は出来ない
Game OverとGame Clear! の文字の色がわかりやすくなっててちょっと感動した
3:17 俺に刺さる言葉
この人ほどAIをいい使い方をしてる人を僕はまだ知らない
AIにはつい「ゼロから学習させること」に期待してしまいますが、
目的のものにチューニングさせたAIを用意した方が現時点では効率的ですね
あくまで今はだけど勝手に学習すると言うよりはこんなふうに成長するようにみたいなAIが主流ですからねー
分からないが続くとマイナスになっちゃうから、どうしても確定できない時は適当に開けちゃうんだろうね
なんでもコツがあるんですな。人間には中々掴めないコツが
オセロは出来そうですね。
関係のないマス目の情報を考慮しAIが間違えたというよりは、どのマス目が関係するかどうかをAIが学習出来ていなかったという話ですよね
童画中でも触れているランダム要素が邪魔をしそうな気がしますね
最初のマスが広がる仕様なのは、最近のWindows(確かWin7以降)に入ってるやつですね。古い仕様だと、最初のマスは「爆弾じゃないことが確定」でした。
そうなんですね!
WindowsVistaはそもそもなんにも教えてくれなかった(僕の)
2:48 なぜ2マスなんだ?1マス先だけでいいじゃんと思ったが
3:58 そういうことか
盤面がどんなにでかくなろうと観測計算するマスは5*5で固定なのだからこの有限個の全パターンを学習させた方が早い気がする
マインスイーパの攻略法かと思ったら違った
sony社のNNCのAffineとConvolutionを見ている気分になった
マインスイーパーでAIVSAI で戦ったらおもろそう
AI VS AIが何かわからんくてあいぶさいってなんだ?って一瞬思いました(粉ミカン)
数字だけに注目させればいいのではって思ったけど、周囲14マス見ないとダメかってなった。
盤面が増えれば左下から順じゃなくて数字のマス順になるのかな?
(周囲の発見の爆弾の数)/(周囲の未開封の爆弾の数)が小さかったり大きかったりするところですかね?
改良案としては周囲8マスが開いてないマスはそもそも考えずパスしていくとか
分からないとする判断にマイナス報酬を観測範囲で開いている+ピンしているマス数に比例して与えるとかですかね?
AIにとっての報酬とは何なんでしょうか。
そんな難しいゲームでも無いのに強化学習させるのにここまで苦労するなんて…
なんで人間は勝手に学習していけるんだろう
人間が思い付けないゲームは習得するのにかなり苦労すると思うよ
探索範囲がまだ広すぎるのでは?25マスである意味は?9マスでいいのでは?
流石にそれは狭い。
そこまで単純なゲームじゃ無かったはず
AIにも哲学は必要みたいですね。但し、AIが哲学を学ぶと、人間よりもはるかに優れたことを考えそうです。
AIにAIみたいなの作らせたい
アルゴリズム探索型の機械学習の話を思い出した
初手爆弾だったことがある気がするがosが古い時代の仕様か?まぁ完全に無慈悲なものより面白い
AIおバカさんじゃん!
最近のディープラーニングではもっぱらこういう学習方法をある程度していして、お膳立てしまくる方法ばかりで全くの0から学習というのはほぼほぼないんですよね。ディープラーニングはよく画像処理系でよく使われたりするんですが、人がコードをかける部分はソースコードを用意して、書けない部分だけ任せるというやり方がはやりです。任せる部分も人がチューニングしてネットワークの構造(ひとで例えると脳の構造)をいじって試行錯誤するしかないのが現状のようです。
もしかしたら今回の内容は畳み込みニューラルネットワークを使ってあげるとうまいこと言ってくれるのかもしれませんね。微妙に違いはあるのですが、プーリング層が今回の動画と同じような情報の圧縮ができるので...
完全に運で二択のところ、ちょっと躊躇っててかわいい
3:56
そこ運要素無いですよ
遺伝的アルゴリズムぅ
開ける→チェックする→開ける と交互に行動を挟んだりっていうのはダメなのかな
こうやってみると、ゲームを解くアルゴリズムとAIって何が違うんだろう?
人間が攻略法を考えてプログラムに落とし込む→アルゴリズム
コンピューターが自分で攻略法を考えて実践する→AI
って感じじゃないですかね? 今回「左下から順に見ていけ」と
具体的な指示をしてしまったのはAI的にはちょっとズルかも
数字の若いところから問題解決する…とかなら効率上がりそう
終わらないのもマイナス報酬だから、AIが時々当て感っぽい動きをしてるw
あとは盤面的には90度回転とか反転をしても同じなのに、別物として扱われるのをなんとかするくらい?
それ何とかする意味あるの?
動画の「考え方を変えるだけで同じゲームでも上手くいったりいかなかったり「ってところで、チャールズ・M・シュルツさんの“If you're not having fun, you're playing the game wrong.”「もし楽しくなかったら、やり方が間違ってるのかも」という言葉を思い出しました
AIに理解させるには人間も頭が良くないと駄目ってことだけは解った。
クリアできるようになった代わりに人間味がなくなりましたね。 人間っぽい思考パターンを作るのは難しいのですね
上級だと学習時のローラー作戦が通用しなくなるから、そもそもどのマスを開けたらいいかではなく、数字の周り8マスに未開封のマスがあって、三つの判断をその数字を中心に2マス先までの数字を判断材料とさせればより人間の解き方に近くなると思う。
数字が表示されているマスについて、
周りの8マスのうちまだ開いていないマスが少ないものから順に着目していきたくなるけど、
それだとアルゴリズムが複雑になったり、計算時間が嵩んだりするんだろうな。
前のだとAIからしたら爆弾の多い1の周りや2
の周りを押すよりも無地の何も情報もないところ開くもんな、
マインスイーパー上級は運ゲー要素が強すぎて面白くないからなぁ。
ともあれ、マインスイーパはマス目ごとにYes、NotYesを判断させる→YESマスを全部つぶす→新たに判明したYesをつぶしてゆく、といった「人間的な」方法が最適かもしれませんね。運試しの状況での対処はわからないけれども。
個人的には、スパーダ―ソリティアの勝率最大化をAIで実現してほしいです!! やり直しアリの条件で。
10年くらい前にはまった時にはぜいぜい勝率20パーセント程度だったので。
この動画のおかげで自分でもできるようになりました!
マインスリーパーは難しいけどハマりますよね
寝てるんですか?()
ですよね
セナルアックス改 さっきまで寝てました(笑)
最初のマスにそんな設定あったか?
それなりの確率で初手爆弾や1マスしかあかないとか普通だったと思ったけど
ロボットに物を取れと命令すると天井からその物体への距離を測定しだしたなんて話も聞いたことがあります。
そういう取捨選択まで学習させようとなると膨大な学習とスペックが必要になるんでしょうね。
古いバージョンは1マスだけとかあったらしいです。
「新しいゲーム」ではなく「やり直し」の方を選択してないですか?
お、フラグを建てるという案が採用されたか?ただの自意識過剰か
なんだか大学の准教授あたりが論文にして発表してそうな内容
プログラムとかカリキュラム学習の難しいことはよくわからないけど
1.マスに対して動画内の3分類をする
2.2×2以内に1の操作で結果が変化するところがあれば先に解く
3.2×2内への影響がなければ左下からの検証に戻る
見たいな感じにすれば解けそう
人間も繋げて考えていくし
考え方を変えるだけで
劇的に進歩することがありますよね
上級、いま使われてる強いAIだと勝率40%くらいらしいです(絶対に運ゲーになる局面が多々あるので)
各マスについて爆弾の確率を評価する、みたいな方法もよさそうですね
6×11の爆弾9個を00:00でクリアしました。
学習のさせかたすごいです。
00:00はタイムです。
どういう設定をするかってことが楽しいですね
こういうのって時間をあけるとすっと良い解決策が出てくるんよな
ガス昇降のイスの仕組みとか物理で解説つてできますか?
ターン数経過でマイナス報酬になるのは条件付けとして良いと思いましたが、2マス先までしか見ないというのは本来機械学習が自分から習得する/しないといけないものなのでは?
ある程度のメソッドを与えてしまうと、古典的な機械学習の趣が強いような気がしたのですが、新しい機械学習でも普通に人が方法をインプットしておくのは有りなんでしょうか?
高いパフォーマンスが出せるAIを作るという目的ならば、わざわざ前提知識も無しで0の状態から学習させるというのは非効率的かつ計算資源の無駄になりますから、現実世界で作られるAIでもその方が少ないですよ。
tn 870 確かにおっしゃる通りですね。勉強になります。
tn 870 こうすればクリアできると情報を入れる(学習させる)のであればわかりますが、選択の際の条件を絞ってしまうようなアルゴリズムの動作に近いもので機械学習といえるのでしょうか、機械的に問題を解くアルゴリズムとの差がなくなる気がします
するどいツッコミwルールのインプットのみにしないとおかしいよな。久々にマトモなコメントみた。
@@オオカミ少年-g1e
作ってるのユーチューバだからw
1:25左のやつおかしくない?
1 1
💣1
無 1
1 1 1
無 💣 2
なら成立するんじゃない?
全部爆弾にしたらAIはやらなくなるんかな・・・
将来絶対人間超えるな
記憶喪失ニキ
感情を手に入れた時AIは人間を越える
鬼舞辻MUZAN 35秒前だと?
白いベーコン 〜前で草の流れが来そうだったので流れはここで止めておく
結果言うね。無理
上級になると対応できないのは意外でした。周囲が初級で学習しきれなかった盤面になっっていることが原因なら、上級で学習させるだけでももっと上手くなるかもしれませんね。
なんとなく将棋のAIが飛躍的に強くなった理由もロジックにあるんだなぁと
マインスイーパーの世界記録やばいんだよね
横方向で一巡見て手詰まりになったら縦に見ていくとかで二次元的に捜索すればさらに成功率上がりそう。
ただ、上級は定石を知っていても解けない部分が出てくるから難しいかも?
まあ、普通ならこう考えるよねー
強化学習使うんじゃなくて、パターンマッチングでいける気がするけど
これからはAIと考えて行く時代になるのか?
ゲームでも、上級になると不明の場所でも無理やり開けないとクリアできないときがあるから、AIでもオールクリアは難しいんじゃないかと思います。
子供のぼくにわ分からないや
だけども面白い!
Flashが終わる前にかつて諦めてきた脱衣マインスイーパー達をクリアしたいんだ。
完成を願っている。
そりゃあ、セオリーの1つを教えてる訳だから上手くなるわw
昔、マインスイーパで67個の爆弾の運ゲやってた人がいたので、それをAIにやらせてみてください
追記
その動画しらべたら、十年前でした。時間が経つのは早いなぁ
恐怖の30ってゲームをAIに学習させて必勝法にたどり着けるかやってみてほしいです!
無関係な情報を大量に読み込んで中々成長できないの、発達障害に通ずるものがある気がします。
近隣数マスを判断材料にしたら、広いマスで地続きしないときに判断できなくなるでしょうね。
というか結局こういうルール(アルゴリズム)をAIが編み出すのは難しいんですね
四角形だけじゃなくて、三叉路とかランダムな形でやったら凄くなりそう(語彙力)
周囲2マスの範囲に空いているマスがひとつもない場所を開けたときマイナス報酬を与えるようにしたら、空いている場所の周囲だけ開けてくれるようになりそう。
この学習方法を思い付く棒読みちゃんがすごいのでは?🤔
なじみのあるゲームをAIがやるのはおもしろかった。面白かぅたぞー!
局所解と全体解が必ず一致するゲームだからこその戦略ですね。
赤枠のサイズも学習対象に含めるとより汎化性能が向上するでしょうか?
電子データの記録というのを物理的にはどうやっているのかが知りたいです
(データ容量の容量って何?といった)
そうなると、水銀遅延線から再現してもらって・・・
自分の知る限りだと物理的な記録原理は、磁気を利用して極性でデータを保存したり(磁気テープ、HDD等)、フリップフロップ回路の自己保持性を利用したり(レジスタ等)、微小なコンデンサに電荷を溜めたりトンネル効果で絶縁体を飛び越させて電子を保持させたり(フラッシュメモリ等)、とかですかね。
その辺りを再現するとなると色々な要素が混ざって大変なことになりますかね
ぶっちゃけルールベースで出来るんだし、あえて機械学習するならその再現を試みた方が早そう
未確定マスの判断をするより数字から見てどこにあるか考える方が良いと思うけどな
それともルールに寄りすぎるから避けたのかな
なんかAIくんかわいい
こうやってAIに学習させていけばルールすら知らない人にマインスイーパのコツ教えるのも上手くなりそう
一か八かで開けて成功したら大量の報酬与えるように教育したら、ギャンブル依存症のAIになったりしないのかね?