It was too amazing to let AI learn Super Mario Bros. 1-2【Reinforcement Learning】

Поділитися
Вставка
  • Опубліковано 8 лис 2024

КОМЕНТАРІ • 457

  • @豆腐の神-p6e
    @豆腐の神-p6e 3 роки тому +108

    2:58 しょぼんのアクションしたあとのマリオ

  • @ナベシ-v9b
    @ナベシ-v9b 3 роки тому +320

    観察するような感覚でゲームを見れる唯一のチャンネル

  • @レプレインゴット
    @レプレインゴット 3 роки тому +109

    500万ステップ学習後とかの動き、若干TAS感があって好き

  • @JIRO1979
    @JIRO1979 3 роки тому +341

    1-2からワープするのが当たり前になりすぎて、1-3が思い出せない件。

    • @Shika_no_channel
      @Shika_no_channel 3 роки тому +45

      そして最近のマリオの感覚で木の地面を下から上に行けると思ってしまって落っこちるところまで経験済み

    • @drr5959
      @drr5959 3 роки тому +7

      キノコ足場の空でリフトが左右上下に動いてマリオメーカー3DSで収録されたステージ

  • @dma1010
    @dma1010 3 роки тому +32

    学習が進むごとに明らかに効率的になってて見てて気持ちいい

  • @もち-c4k
    @もち-c4k 3 роки тому +84

    6:32 辺りの無駄なジャンプが人間らしくて面白い

  • @Amaguri1229
    @Amaguri1229 3 роки тому +38

    しっかりと点を取るために敵同時撃破してるの最高

  • @nabe5071
    @nabe5071 3 роки тому +14

    本家と同じく得点の概念も入れてほしい!
    ・ブロックを壊して得点
    ・敵を踏んで得点→連続で踏んだら得点が倍
    ・ポールの上にタッチするほど高得点
    ・残りタイムで加点
    この条件で何点でクリアできるようになるのかが見てみたいです!

  • @user-fn5lq3go2n
    @user-fn5lq3go2n 3 роки тому +67

    人工知能って自分で判断して学習するのもすごいけど、そうなるように作った人も相当すごい!
    これから色んな場面でAIが活躍するんだろうな

  • @たっきぃ-b4s
    @たっきぃ-b4s 3 роки тому +231

    超魔界村で学習させるのも面白そう!

    • @いくら-c4x
      @いくら-c4x 3 роки тому +11

      やってほしいw

    • @XD-lj5ze
      @XD-lj5ze 3 роки тому +11

      700万回くらいいるんやない?()
      お前を消す方法思い出した

    • @nakawa2088
      @nakawa2088 3 роки тому +7

      ロックマンでボス倒せるか見てみたい

    • @Tsubac-
      @Tsubac- 3 роки тому +1

      これは見たい!笑

    • @あせまねメグ
      @あせまねメグ 3 роки тому +10

      超魔界村を再現させるのがすごく大変そう。

  • @ひさぁ
    @ひさぁ 3 роки тому +62

    3:41
    そのうちすり抜けそう(小並感)

  • @masshi20
    @masshi20 3 роки тому +6

    敵を踏んだ反動でジャンプできるってところもしっかり学習してるのやべぇ

  • @yakki-691
    @yakki-691 3 роки тому +21

    土管を飛び越える所辺りスピード感があって3段ジャンプみたいだった

  • @chokominto83
    @chokominto83 3 роки тому +5

    お久しぶりです!AIの強化学習好きです

  • @soarsmama7636
    @soarsmama7636 Рік тому +1

    5:21 嬉しそう

  • @imacosmo713
    @imacosmo713 3 роки тому +45

    この学習方法で1-1またやってみてほしい

  • @性名-m5f
    @性名-m5f 3 роки тому +63

    ブロック破壊をするたびに、負の報酬(極微小)を与えると「破壊活動が収まり敵を待ってから動く」のか「気にせず破壊してスピードクリアする」のか気になります。
    個人的には、両方試してから「こっちが多く報酬がもらえる」とaiが考察してほしい

    • @JR-ev4ui
      @JR-ev4ui 3 роки тому +21

      そのブロック破壊した時の負の報酬の量によって決まりそう

  • @えうろぱ-p3n
    @えうろぱ-p3n 3 роки тому +19

    シューティングゲーム系はすごいのが出来そう

  • @強者傲慢
    @強者傲慢 3 роки тому +15

    強化学習型のテトリスAIも見てみたいです

  • @iam2480
    @iam2480 3 роки тому +24

    常人にはクリア不可能みたいなゲームを強化学習でクリアしてるのを見たいなw

  • @夜桜さん
    @夜桜さん 2 роки тому +2

    土管の間の敵をわざわざ踏んで進むところ好き

  • @fridericusgauss
    @fridericusgauss 3 роки тому +1

    今回は画像情報(恐らくCNNベースを使ってる?)にしたんですね。
    恐らくレーザーで認知する方法だと、エージェントが認識する範囲が局所的過ぎるのに、移動に伴って激しく情報が変化するので、その場その場で反応してピクピク動くのだと想像します。
    一方、画像全体だと、行動の後の穴や敵の位置など、広い範囲で認識できるので、より賢い動作に見えるようになったのだと思います。
    また、画像認識は強化学習同様にかなり進歩してるので、大変良い組合せだと思います。

  • @ko-ji
    @ko-ji  3 роки тому +5

    1-1面の動画はこちら
    ua-cam.com/video/M3-vIh4h-7I/v-deo.html

  • @mandarinorangemikan
    @mandarinorangemikan 3 роки тому +12

    ついに、配管工も AI に取って代わる職業になってしまったんですね
    これも時代ですかね...

  • @ハウルの動かない城
    @ハウルの動かない城 3 роки тому +1

    途中からTASのRTAみたいな動きになるの好き。

  • @奥野春樹
    @奥野春樹 3 роки тому +33

    ジャンプ回数やブロック破壊回数が少ないほど報酬が多くなれば
    スムーズな攻略するようになるのかな?

    • @hayami_maguro
      @hayami_maguro 3 роки тому +2

      3:11 無駄なジャンプを減らすようにジャンプしたら微小の罰が設定されていますが確かにもう少し値が大きくてもいいかもしれませんね

  • @ぴっぴどん
    @ぴっぴどん 3 роки тому +99

    3:12 敵を倒した時の報酬を無くせば最速クリアしようとするんですかね…?

    • @MK-nw7jy
      @MK-nw7jy 3 роки тому +26

      1フレーム毎の罰を増やしても良いかと思いますね。

    • @故郷-r5c
      @故郷-r5c 3 роки тому +6

      早くクリアすればするほど報酬...とか?

    • @ぴっぴどん
      @ぴっぴどん 3 роки тому +7

      @@故郷-r5c 上から4行目見てみ

    • @りんと-e7v
      @りんと-e7v 3 роки тому +3

      無駄なジャンプ減らせるように、ジャンプしたら罰/ブロック壊せたら報酬/敵を踏んだら報酬とかも面白そうだな

    • @Akita_ken2236
      @Akita_ken2236 3 роки тому +7

      @@りんと-e7v そしたら初期段階で困惑し始めるのでは?ジャンプは必須動作なので

  • @あい-s7j7q
    @あい-s7j7q 3 роки тому +1

    7:12位からの別視点カメラのこーじ、頭ポヨポヨしててジワる

  • @NS-tb6dy
    @NS-tb6dy 3 роки тому +15

    この学習をしたものを別のステージで適用したらどのくらいのもんなのか気になります。

  • @one2832
    @one2832 2 роки тому

    画面の画像から学習できるとかすごく人間に近づいてる

  • @ZeraroraSan
    @ZeraroraSan 3 роки тому +23

    次はクッパ戦ですね!(鬼畜)

    • @ray00000
      @ray00000 3 роки тому +1

      それは草

    • @ちゅーぴっぴか
      @ちゅーぴっぴか 3 роки тому +5

      まずクッパ作るのがむずそうw

    • @NT-zf8dx
      @NT-zf8dx 3 роки тому

      @@ちゅーぴっぴか 棒読みちゃんでいいのでは

    • @いくら-c4x
      @いくら-c4x 3 роки тому +5

      @@NT-zf8dx システム面の話では?

  • @とりはっ-v8f
    @とりはっ-v8f 3 роки тому +7

    格闘ゲームをAIで強化学習したら
    各キャラに対応して挙動が変わるのかなぁ

  • @のん-v1p8c
    @のん-v1p8c 3 роки тому +2

    東方みたいな避ける系のシューティングゲームでできたら見応えありそう

  • @ぴっぴーs
    @ぴっぴーs 3 роки тому +5

    ツムツムとかテトリスとかのパズルゲーム学習させるの面白そう!

  • @mk.mercury
    @mk.mercury 3 роки тому +1

    凄いですね!
    カメラ画像での学習でも、戻ったり少しまったり、ジャンプの微調整したりもするようになるんですね。
    こういう報酬にしたら上手くいかなかった、とか、センサーでやると上手くいかなかった、みたいな話はいろんなアプローチが知れるので失敗も話して貰えるのは楽しいな、って思います!

  • @susiexgood
    @susiexgood 3 роки тому +2

    この時を待っていたぞこーずぃ

  • @foreverboys1453
    @foreverboys1453 3 роки тому +1

    待ってました!!

  • @finkfiction
    @finkfiction 3 роки тому +2

    色んなステージで学習させたAIが全く新しいステージをクリアできるのかとか面白そうですね

  • @水玉銀之丞
    @水玉銀之丞 3 роки тому +17

    初代ロックマンのイエローデビルの攻撃(分離→合体)を、AIがどのように成長してかわすのか見てみたいです🤗

  • @ザウルス-i7c
    @ザウルス-i7c 3 роки тому

    かなりするのは難しいでしょうけどダクソの強化学習を見れたら最高ですね

  • @いちびり-t9t
    @いちびり-t9t 3 роки тому

    す、すごい!アクションゲームを学習しているっ!!
    まったくのノーヒントから一つ一つ積み上げての学習だから
    人間のプレイヤーがやるような推測と飛躍がないかわりに途方もない回数の試行を繰り返してクリアしている!
    移動、移動量の調整、ルート選定、タイミングを計り、回避、踏みつけ……
    これだけの要素があるというのに、それぞれを理解しているわけでもなく最適化されているっ!
    こんな面白い事があるんだ!強化学習ってすんごい!

  • @SH-UK030
    @SH-UK030 8 місяців тому

    素晴らしい研究

  • @homu7369
    @homu7369 3 роки тому +5

    最初クリアできるかも怪しいのに最後RTAみたいな動きしてるの草
    TAの理想ルート取りをこうやって探す時代も遠くなさそう

  • @ku5187
    @ku5187 3 роки тому +1

    クッパステージの正解とおらないと進めないステージとかって学習で何とかできるんですかね?

  • @accel.6384
    @accel.6384 2 роки тому

    3:25で「何人かで一緒に学習して知見を共有したり」ってあるんですけどどうやって共有してるんですかー
    いまこーじさんの影響で機械学習を勉強しているので教えていただけるとうれしいです

  • @tmkz-x1e
    @tmkz-x1e 3 роки тому +1

    1ジャンプ2キルしてる辺り
    そこそこゲームが上手い人がプレイしてる様に錯覚した
    しかも多分あんまり操作性良くない中でこれは凄い

  • @ゆうspl
    @ゆうspl 3 роки тому +1

    学習した個体で何面まで進めるかやってみて欲しいです。残機付けちゃうと無理そうなのでとりあえず今回と同じルールで何回もくりかえせる形にした方が良さそうですかね

  • @かいなんのかぜ
    @かいなんのかぜ 3 роки тому +1

    ストリートファイターみたいな2D格ゲーでAI同士で戦わせてみて欲しい

  • @ihsubad69
    @ihsubad69 3 роки тому

    AIを学習させる方法を学習していく主の成長が一番の伸び代。

  • @GkakuYouTube
    @GkakuYouTube 3 роки тому +1

    量子コンピュータとかが普及したらAIの学習速度も上がるんだろうなぁ

  • @setunakuonn
    @setunakuonn 3 роки тому

    しょぼんのアクションみたいに最適解の動きをすると確定でトラップが仕掛けてある場合はどんな反応するか

  • @鴨-y5d
    @鴨-y5d 3 роки тому +5

    【リクエスト】8-4もクリアさせてみてほしいです。(ファイアーバーの攻略方法が気になるため)

  • @今週の一位はルビーの指環です

    スーパーキノコやフラワー、テンコインブロック等ケチをつければキリがないけどこれは素晴らしいです

  • @arm7221
    @arm7221 3 роки тому

    ばりばり壁破壊しながら進むの面白かった。もっと難しいアクションのも見てみたい。
    アクションじゃないけどアモングアスとかもAIにできるのかな

  • @meisekiyu8
    @meisekiyu8 2 роки тому

    今回学習したAIは1-2専用って訳じゃなくてそのまま使ってほかの面をやらせても穴や壁を認識してある程度進んでくれるものなのかな

    • @ああ-m7e7x
      @ああ-m7e7x Рік тому

      強化学習なので、他の面でもしっかり動くはずです!

  • @宇都宮餃子-f8g
    @宇都宮餃子-f8g 3 роки тому

    こういうのがこーじって感じして好き

  • @TheNerukohasodatsu
    @TheNerukohasodatsu 3 роки тому +1

    マリオメーカーにもこのAI機能搭載してほしい

  • @kiyu-kiyu
    @kiyu-kiyu 3 роки тому

    学習するって凄いな

  • @野乃ののの福
    @野乃ののの福 3 роки тому

    ロードランナーとかドアドアとか面白そう

  • @GO-yb3fi
    @GO-yb3fi 3 роки тому

    天才ですね

  • @user-fi1mp6bo5p
    @user-fi1mp6bo5p 3 роки тому +7

    これ天井のブロックも破壊できるようにしたら天井駆け抜けるように学習したりするんだろうか?

    • @yusei527
      @yusei527 3 роки тому +2

      それも試してみたいですね!
      強化学習では、エージェント(アフロの方)が探索とそれによる経験に基づいて報酬が最大化されるような行動をとるので、まず少なくとも一度上に上がってみる必要がありますね。
      そのルートの方が下で敵を倒して進む(ちょっと報酬がもらえる)より報酬が高くなるなら、すぐさま上に上がって一直線に進むようになりますよね笑

  • @Zenius-I-vanisher
    @Zenius-I-vanisher 3 роки тому

    2ブロック同時に破壊するAI凄すぎ

  • @鉛澤葉獅
    @鉛澤葉獅 3 роки тому +3

    アフロじゃなかったら死んでそう

  • @アイオライト-u1x
    @アイオライト-u1x 3 роки тому

    フレームごとの罰、ジャンプの罰、敵を倒した報酬辺りの比重は変えたら挙動が大きく違いそうですね

  • @影夜-g7g
    @影夜-g7g 3 роки тому +1

    レースゲームの学習を見たいな。
    実際の自動運転と違う所が有るなら、違う所の解説とかも聞きたい。

  • @n-yoshi
    @n-yoshi 3 роки тому +8

    次の機会があれば、ゴールポールの高いところほど報酬がデカい、を入れて欲しいですね。

  • @000じゅこう
    @000じゅこう 3 роки тому

    今回も楽しませていただきました。次回はエキサイトバイクとか見てみたいす。

  • @lonestar930
    @lonestar930 2 роки тому

    階段から敵が降りてくるところすごすぎ。
    マリオは人でもrtaできちゃうくらい最適化されてるので、超人になれるやつ見たいなー。ぷよぷよとか?

  • @bjnes97
    @bjnes97 3 роки тому

    タワーディフェンス系のゲームで最適解を教えてくれるAIが見てみたい。

  • @いくら-c4x
    @いくら-c4x 3 роки тому

    現実世界に近いルールを作ってAIぶち込んで観察したい

  • @Shigure_Mayu
    @Shigure_Mayu 3 роки тому

    音ゲーをIA学習でフルコンまで持っていくの面白そう

  • @nikomi-888miso
    @nikomi-888miso 2 роки тому

    シューティングゲームとか楽しそう

  • @宇野リッシュ
    @宇野リッシュ 3 роки тому

    FCテニスとかゴルフ(マリオゴルフ含む)みたいなのも楽しそうですね。今でも遊びたい一品。

  • @tt-lg3ck
    @tt-lg3ck 3 роки тому

    強化学習大好きだなw
    いつか生成モデルも試してほしい

  • @tagudogjpn
    @tagudogjpn 3 роки тому +1

    実際のサーキットで何万回AIに走らせたら、正しい(あるいは最速の)レコードラインを走れるようになるのか見てみたい

  • @chun37
    @chun37 3 роки тому +1

    強化学習のやり方とか解説して欲しいです!

  • @れいれい-z6z
    @れいれい-z6z 3 роки тому

    普通に歩くより飛びながら進む方が移動距離が長いから常に飛んで移動してるね

  • @yoshikana1882
    @yoshikana1882 3 роки тому

    横シュー(STG)みたいな、敵の弾を避けつつ倒す様なゲームを学習させてみて欲しいです
    弾幕ゲーとかも面白そうですね

  • @墓石N
    @墓石N 3 роки тому +3

    昔本物でやってた動画を見た気がしますが、再現ステージでやる理由とかってあったりするのでしょうか

    • @gasumoru5037
      @gasumoru5037 3 роки тому

      土管とかあるからちゃう?

    • @凛-b7w
      @凛-b7w 3 роки тому +2

      動画の途中で出てくる効率化のために同時進行させるためかな〜とか思った

  • @enikaita_mochi
    @enikaita_mochi 3 роки тому

    是非、8-4を学習するところを見てみたいです。
    あの、迷路のような構造をどうやってクリアしていくかが見てみたい。

  • @hertway
    @hertway 3 роки тому

    最後の旗に触る時、1番上に触る時高得点だからそれにも報酬を設定して再現して欲しかったです。
    爽快感が違うと思いますw

  • @かのん-i7f
    @かのん-i7f 3 роки тому

    こーじさんはどうやってAIに学習させてるんでしょうか?
    Python等のプログラミングでやってる?それともプログラムの知識がなくとも学習させることができるツールがある?

  • @やっさん-s2i
    @やっさん-s2i 3 роки тому

    頭突きでブロック壊すの凄いな

  • @Skyla1207
    @Skyla1207 2 роки тому

    ロックマンのステージ攻略してみて欲しいなぁ。消えたりするブロックとか動く足場を突破出来るのか気になる

  • @akasan0717
    @akasan0717 3 роки тому +1

    シリーズ化してほしい!
    ファミコン版マリオ全ステージ!

  • @icebo08
    @icebo08 3 роки тому +1

    パックマンの強化学習気になります….!

  • @kazutohagura4976
    @kazutohagura4976 3 роки тому

    すごーい!
    このやり方で1-1再挑戦
    からの比較って、
    動画に出来ませんか?

  • @yuukanmuri1358
    @yuukanmuri1358 3 роки тому

    ひたすらにブロック壊してスペース作りしてたのでブロック破壊を最小限に抑えてクリアする姿もみてみたいです!

  • @karimori0041
    @karimori0041 3 роки тому

    fpsシューティングのゲームとか覚えさせても面白そう。

  • @bekey-gh1ds
    @bekey-gh1ds 3 роки тому

    AIの研究してプログラミングを作っている人凄い!

  • @ブルーモンスター-n2m
    @ブルーモンスター-n2m 3 роки тому

    ミサカネットワークを何故か思い出した

  • @natsukazuify
    @natsukazuify 3 роки тому

    I wanna be the guyみたいなタヒにゲークリアできるようになったらものすごい動きしそう

  • @Yamaka-yc7kc
    @Yamaka-yc7kc 3 роки тому

    これコイン配置してコイン取ったら報酬みたいな感じにしたらさらに面白くなりそう

  • @kom846
    @kom846 3 роки тому +2

    今度ダッシュも入れて欲しいです!笑

  • @skyouya.8998
    @skyouya.8998 3 роки тому

    うぽつ
    動画面白かったです

  • @西野菊地
    @西野菊地 2 роки тому

    こりゃあ色々職業が奪われそうだわ笑

  • @akitainu19
    @akitainu19 3 роки тому

    ゴールの高さで報酬の数を変えるのも面白そう

  • @大盛半チャーハン
    @大盛半チャーハン 3 роки тому

    魔界村やJump King、壺男みたいに人間にも難しいゲームとか強化学習の凄さがより分かる気がします

  • @ボイルソーセージ
    @ボイルソーセージ 3 роки тому

    複数プレイヤーがいて踏んだら倒せるとかの環境で学習してレースとかさせたらどうなるんだろうと思った
    おもしろい!

  • @渡邊裕樹-m9j
    @渡邊裕樹-m9j 3 роки тому +1

    4-1だとかのパイポ(&ジュゲム)とか、プクプクだとかの飛来物系が気になる……