GPT-4o|ChatGPT最新モデルは何が凄いのか?

Поділитися
Вставка
  • Опубліковано 15 лис 2024

КОМЕНТАРІ • 15

  • @hannyabal2
    @hannyabal2 6 місяців тому +6

    他の類似動画より内容が深いのでためになります

    • @mathbullet
      @mathbullet  6 місяців тому +1

      とても嬉しいコメントありがとうございます!

  • @youtube4study
    @youtube4study 5 місяців тому +2

    他のai系の発信者は不思議とメカニズムや背景理論の話をしたがらず、
    効率化がスゴいヤバいしか話さないので
    実は彼らもgpt2あたりでつくられたai動画botなのかと不安でしたが
    人間に見える発信者に久々に出会えました!
    youtubeと大衆のバグでチャンネル登録者が1/100になっていますが
    いつかバグは修正されるとおもうので応援しています

    • @mathbullet
      @mathbullet  5 місяців тому

      そう言っていただけるとほんとに嬉しいです!コメントありがとうございます!

  • @goisesan
    @goisesan 6 місяців тому +2

    要点まとまってるし分かりやすい!助かります

    • @mathbullet
      @mathbullet  6 місяців тому

      めちゃ嬉しいです!ありがとうございます!

  • @urushi73
    @urushi73 5 місяців тому +1

    でもテキストも画像も音声も同じモデルで扱うって前々から将来そうすると言ってたよ。これ以上は論文とか4oのモデルを扱った記事で知るしかないか。

  • @minoru61
    @minoru61 6 місяців тому +3

    以前に、動物の実験で、言葉を司る脳を画像を司る脳に置き換えても言葉を認識した、という記事を見たことがあります。
    なので、一つのNNで全てを扱うというのは論露的には可能ではないかと思います。
    ただそうするとかなりの計算が必要になるので、今、あるハードウェアでは答えが出るのに時間がかかるんじゃないかと思ってしまいます。
    GPT-4oのパラメータ数ってどれくらいなんでしょうかね。

    • @mathbullet
      @mathbullet  6 місяців тому +3

      興味深い事例のご紹介ありがとうございます!
      言語と画像の情報をひとつのNNで学習すること自体は、人工のNNでも実現されています(CLIPなどがよく知られています)。
      とはいえ、例えば画像を生成するタスクと、文章を生成するタスクをどちらも行うことができるNNが実現可能かというのは自明ではないと思います。これまで提案されてきた各種手法では、タスクごとにNNの構造そのものが異なっているというのがその背景です。
      画像を生成する場合、文章を生成する場合、音声を生成する場合のそれぞれでNNの後段を分岐させる形であればそこまでトリッキーではなく、もしそうでないとしたらかなり革新的なのでは、というのがこの動画の趣旨です。
      gpt4oのパラメータは公開されていませんが、数千億から数兆スケールではあると思います。

  • @hiroyukinumaguchi1984
    @hiroyukinumaguchi1984 6 місяців тому +1

    Thank you!

  • @マシンガンダンディ
    @マシンガンダンディ 6 місяців тому +2

    凄いのは分かるけどお試しでやってみたら、全然使える、ボリュームで無かった。

  • @kane495
    @kane495 6 місяців тому

    javanese

  • @Arii_1253
    @Arii_1253 6 місяців тому +1

    わかりやすかったです!!!知人におすすめします