現代のAIは24時間体制の「子守り」が必要? 開発者の泥臭い努力を聞く回【大規模言語モデル3】

Поділитися
Вставка
  • Опубліковано 4 гру 2024

КОМЕНТАРІ • 225

  • @yurucom
    @yurucom  5 місяців тому +18

    【ことラボ】
    ◯Twitter → x.com/KotoLaboRyo
    ◯UA-cam → www.youtube.com/@kotolabo
    【参考文献】
    ◯大規模言語モデル入門
    amzn.to/3VKqed7
    ◯大規模言語モデル開発における日本語 Web 文書のフィルタリング手法の検証(榎本 et al., 言語処理学会 2024)
    www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/P8-6.pdf
    →動画内で紹介した「意味がありそうでない文字列」はここから。
    ◯ONE PIECE
    amzn.to/3VDysCl
    ◯ichikara-instruction LLMのための日本語インストラクションデータの作成
    www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/A6-3.pdf
    ◯ゲンロン戦記
    amzn.to/4ch6xPU
    【サポーターコミュニティへの加入はこちらから!】
    yurugengo.com/support
    【おたよりフォーム】
    forms.gle/BLEZpLcdEPmoZTH4A
    ※皆様からの楽しいおたよりをお待ちしています!

  • @ychitter
    @ychitter 5 місяців тому +463

    堀元さん、ウィーアーのキー:+5でした。さすがです。

    • @悲しきマグロ
      @悲しきマグロ 5 місяців тому +42

      出た!キー牛だ?!

    • @Plasma_Cluster
      @Plasma_Cluster 5 місяців тому +80

      これ多分麦わらの一味ver.と同じですよね
      自分のことを麦わらの一味だと思っているのかもしれません

    • @mash23456
      @mash23456 5 місяців тому +5

      いやEだから原曲と同じキーでしょ

    • @glikovsky
      @glikovsky 5 місяців тому +27

      マジレスすると 堀元さんのキーはA♭で、原曲のキーはE♭なので カラオケ的な表現で言えば +5で合っているかと思います
      (麦わらの一味ver. というのは寡聞にして存じ上げず…)

    • @ychitter
      @ychitter 5 місяців тому +6

      @@Plasma_Cluster ワンピース詳しくないので、今聴きました。このキーのバージョンもあるんですね。勉強になりました。

  • @wararyo
    @wararyo 5 місяців тому +201

    0:28 りょーさんが「ダダン ダダン」って真顔で合いの手を入れてるの面白すぎる

  • @musicdm7644
    @musicdm7644 5 місяців тому +99

    ギター講師です。堀元さんの歌、キー+5の最高音Dかつ発声がミックスボックス。
    Mrs.GREEN APPLE歌いたい生徒の見本にさせていただきます。

  • @おさかな-d4s
    @おさかな-d4s 5 місяців тому +100

    導入の10秒くらいの歌で
    キーの高さ、りょーさんの合いの手、終わってる符割りの大規模言語モデル
    の3波襲ってきた

  • @Mtrong-Sgang-Mra
    @Mtrong-Sgang-Mra 5 місяців тому +32

    物理学徒として研究をし始めた頃、アルミの板をひたすら削ってる時期があって嫌気がさしてたのですが、ふと読んだ伝記に、かのガリレオが望遠鏡を開発するためにひたすらレンズを研磨し続けていたことを知り、「あのガリレオですら地道な作業を怠らなかったのに自分ごときが何を偉そうに」と思うようになり、地道な作業をやり続ける勇気を得たことがありました。

    • @たぬら-r3j
      @たぬら-r3j 3 місяці тому +2

      馬上枕上厠上とあるようにアイデアはぼーっとしてる時間から生まれやすいので、研究者が単純作業をするというのは理にかなっているとも思います

  • @きりなま-h1w
    @きりなま-h1w 5 місяців тому +73

    堀元さんのウィーアー!もなんだけど、ナレーションからのパーカスまでこなすりょーさんがあまりにもツボ

  • @ぴちゃ-e1e
    @ぴちゃ-e1e 5 місяців тому +68

    普段は敬語を使ったり、さん付けして呼び合ってるのに、「お前」とか「~なわけねぇだろ」とかたまに言葉が雑になるの本当に好き
    普段は大人な距離をそれなりに保ってるけど、ふとした瞬間に距離がガン詰まりしているの見るとなんだか聞いてて楽しくなります。
    とか思ってたけど、この人たち布団くっ付けて朝まで寝っ転がって話してるの、全然大人の距離感とか関係なかった。ずっと仲良くしてくれ。

  • @ladrey127
    @ladrey127 5 місяців тому +100

    大規模言語モデルのところだけ譜割り終わりすぎてて好き

  • @ladrey127
    @ladrey127 5 місяців тому +62

    16:00
    Excelでは,〇年◯月◯日の形式で入力すると自動的に文字列から日付データに変換されるので,
    「8桁の数値ではなく日付データにして下さい」が伝わらない知性がない人に,できるだけわかりやすくしてほしい処理を伝えてるのに,逆に知性がない人が変な指示をしてきた認定されるかわいそうな人

    • @HitYoutube
      @HitYoutube 5 місяців тому

      いや英語表記のJan,Febのほうが、なんで文字型入るねん!だったり。
      まあ日本語でも年号入ってると、平成31年 令和元年問題もありますがw

  • @Mike_nm7
    @Mike_nm7 5 місяців тому +81

    動画はちゃんと全部観てから評価を押すようにしてるのですが、この動画に関しては開始30秒で高評価ボタン押しました

  • @蒲公英-g8h
    @蒲公英-g8h 5 місяців тому +60

    堀元さんこんな良い高音出るのか……

  • @ayame_mb
    @ayame_mb 5 місяців тому +37

    ちょっと導入が面白すぎる

  • @tamarind_kingdom
    @tamarind_kingdom 5 місяців тому +62

    この3人お笑いトリオとして完璧では??

  • @HK-fo3rk
    @HK-fo3rk 5 місяців тому +22

    13:02 「SEO対策で単語羅列してある文章を弾くために、名詞が9割以上の文章はブロックする」っていう話ですが、「これだとジョジョ6部に出てくるプッチ神父の14の言葉も弾かれちゃうんだなぁ」とか考えてたら動画が終わってました。

    • @人生パラドックス
      @人生パラドックス 5 місяців тому +6

      ちなみに、SEO対策としての単語の数は、3つ位が、良いとされている。
      多く設定すると、Googleクローラーは、スパムと判断されて、ランクが下がる。

  • @MY03318
    @MY03318 5 місяців тому +80

    開始30秒でくっそ笑った

  • @OPPEKE7
    @OPPEKE7 5 місяців тому +31

    オープニングの超高音で鼓膜が破れそうになりましたw

  • @ゴブリン-r5q
    @ゴブリン-r5q 5 місяців тому +49

    まだ導入しか見てないけど腹ちぎれるくらい笑った

  • @ni1015
    @ni1015 5 місяців тому +26

    6:45 「オセアニアじゃあ常識なんだよ!」思い出した

  • @mudaso-heavy-user
    @mudaso-heavy-user 5 місяців тому +29

    楽しみに待ってました

  • @user-xg3lk5dt8z
    @user-xg3lk5dt8z 5 місяців тому +4

    22:50
    水野さんのツボを突く瞬間好き

  • @doridoriization
    @doridoriization 5 місяців тому +55

    開始一分のつかみで全部持ってかれた。

  • @タニゴメ
    @タニゴメ 5 місяців тому +11

    オープニングから先に進めない、流石に面白すぎる

  • @zudah228
    @zudah228 5 місяців тому +100

    ウィーアーのキークソ高くて笑った

  • @renk1310
    @renk1310 5 місяців тому +8

    6:42 パプリカの発狂シーンで草。あれ好きなんだよな。パプリカは主述が対応してて文法的には正しいけど、自然って判定されるのかな?
    パプリカの発狂シーン
    ua-cam.com/video/-HLRjWNC5iA/v-deo.htmlsi=xdhxQ92kVfit1wVP

  • @Mesubutamia
    @Mesubutamia 5 місяців тому +20

    某大物歌手が使用しているものと同じと鳴り物入りで導入されたマイクニキも、ナスから繰り出される超高音ウィーアーには思わずにっこりしていることと存じます。

  • @gasyano936
    @gasyano936 5 місяців тому +8

    ワンピースのアマゾンリンクが説明文にあんのマジ面白い
    デカいものにはちょい絡みでも全力で乗っていくスタイル好き

  • @Morino-kumasaxn
    @Morino-kumasaxn 5 місяців тому +19

    12:45
    『らせん階段』…!『カブト虫』!『廃墟の街』!『イチジクのタルト』!『カブト虫』!……『ドロローサへの道』!『カブト虫』!『特異点』!『ジョット』!『天使(エンジェル)』!『紫陽花』!『カブト虫』!『特異点』!『秘密の皇帝』!!

    • @geromosa
      @geromosa 5 місяців тому +1

      同じコピペ貼ろうとしてたが念のためコメントみておいてよかった……

    • @inazuchi500
      @inazuchi500 3 місяці тому

      ランボー怒りのC-MOON

  • @ゴブリン-r5q
    @ゴブリン-r5q 5 місяців тому +44

    「らせん階段、カブト虫、廃墟の街、イチジクのタルト、カブト虫、ドロローサへの道、カブト虫、特異点、ジョット、天使(エンジェル)、紫陽花、カブト虫、特異点、秘密の皇帝」
    りょ「お、無駄な文やん弾いたろ!」

    • @k1730789
      @k1730789 5 місяців тому +10

      弾いて正解やろw

  • @いずも-g9n
    @いずも-g9n 5 місяців тому +8

    おうた動画たすかる

  • @taku_tsuchida_bassake
    @taku_tsuchida_bassake 5 місяців тому +17

    最高のOPで5回くらいリピしてました。

  • @xoxxox6992
    @xoxxox6992 5 місяців тому +3

    楽しそうでよかったです。

  • @katsuhikonishimra-hb3ui
    @katsuhikonishimra-hb3ui 5 місяців тому +10

    主婦の人が頑張ってるくだりで、自分のとこで学習データ作成をお願いしたら「在宅ワーク謎の資料」というディレクトリ名で返ってきて笑ったのを思い出しました

  • @きりなま-h1w
    @きりなま-h1w 5 місяців тому +3

    8:14 ここ大好き...

  • @lyz_2151
    @lyz_2151 5 місяців тому +4

    開幕の瞬間風速がすごい

  • @SachsenWH
    @SachsenWH 5 місяців тому +13

    出だしのウィーアー、きただにひろしではなくn人の麦わら海賊団篇(n=7,9)のほうで草

  • @エアリーク
    @エアリーク 5 місяців тому +9

    開始から全力w好きw

  • @冬将軍-p4c
    @冬将軍-p4c 5 місяців тому +3

    カキアツメエが好きすぎて全然進めない

  • @おけ-r7b
    @おけ-r7b 5 місяців тому +3

    今回の導入過去最高を更新した

  • @279lseahorse
    @279lseahorse 5 місяців тому +12

    冒頭のとこしか見てないけど、堀本さん歌うめぇ

  • @bota0461
    @bota0461 5 місяців тому +4

    6:45 Colorless green ideas~ みがある

  • @animizumu
    @animizumu 5 місяців тому +6

    エドシーランのマイクが初めてちゃんと使われた

  • @3d_kuma
    @3d_kuma 5 місяців тому +4

    AIに学習させるくだり、弐瓶勉のSF作品にもその描写※識臣という仮想空間 があったので「あれかー!」となりました😂こういう話はすごく面白いので、またぜひ取り扱ってほしいです。
    「治しておいたよ😊👍」と言ってスプレッドシートの数式を中途半端にいじくる年配上司を止める言葉10選とかやってくれたら絶対見ます…

  • @やす-g2w
    @やす-g2w 5 місяців тому +10

    参考文献にONE PIECEあって草

  • @早川眠人
    @早川眠人 5 місяців тому +7

    15:25 痴性の出るエクセル……エクセル方眼紙

  • @Sho-yu2424
    @Sho-yu2424 5 місяців тому +8

    ウィーアー!4度でハモる前提なの草

  • @toriko8644
    @toriko8644 5 місяців тому +6

    最初の40秒部分の切り抜きが欲しい

  • @uki-800
    @uki-800 5 місяців тому +2

    開幕30秒に250%くらいの火力を叩き込んで来たな 堪えきれんかった

  • @MY03318
    @MY03318 5 місяців тому +3

    あかん、何回聞いてもおもしろい

  • @Mesubutamia
    @Mesubutamia 5 місяців тому +1

    12:25
    #らせん階段 #カブト虫 #廃墟の街 #イチジクのタルト #カブト虫 #ドロローサへの道 #カブト虫 #特異点 #ジョット #天使 #紫陽花 #カブト虫 #特異点 #秘密の皇帝

  • @うだがわ-x4f
    @うだがわ-x4f 5 місяців тому +2

    普通に内容興味深いのに冒頭のパンチが強すぎてそこしかコメントできない

  • @akasute996
    @akasute996 5 місяців тому +1

    24:57 "細胞が、なんか蠢いてるヮ。"って 人の子の仕組みも深いところまで理解するとそうなりますよね。

  • @じーちゃん-f1e
    @じーちゃん-f1e 5 місяців тому +2

    すごい人はめちゃくちゃ泥臭い努力をしてるんだなー…今回の話は個人的にすごく刺さりました。
    泥臭い努力こそが他の追随を許さない価値を生み出すのかもしれないですね。

  • @dynamic_daikon1491
    @dynamic_daikon1491 5 місяців тому +1

    導入が完璧すぎる

  • @hykathon
    @hykathon 5 місяців тому +1

    18:56 冪等性はテロップに出てる通り f(x) = f(f(x)) であって、 1 + 1 = 1 + 1 みたいな同じ処理の結果が等しい事とは別物ですね。

  • @spacknyaho2643
    @spacknyaho2643 5 місяців тому +8

    参考文献にONE PIECEが列記されてて草

  • @江嵜正和
    @江嵜正和 5 місяців тому

    8:30 エポニムというか、シネクドキ?
    それにしても口に出して言いたくなるフレーズですね

  • @2wsc1qaz72
    @2wsc1qaz72 5 місяців тому +17

    Excelで残してくれるだけマシです。
    プリントアウトして手書き修正してハンコ押してからスキャナで取り込んだPDFデータとか渡されたり、
    元データ要求してもハンコ押した正式なもの以外渡せんとか言ってきたり。。。

  • @NT-zf8dx
    @NT-zf8dx 5 місяців тому +6

    6:45 某UA-camrが札幌旅行でやってた、支離滅裂返答ゲームみたい

  • @Fnak202
    @Fnak202 5 місяців тому +1

    以前のソフトウェア開発現場で、「自動テストの結果」「不具合報告」「不具合の修正情報」などの情報を全て WEB 上で管理できるようにして、自動集計も行えるようにしたのですが、PM チームの仕事半分は以下で埋まりました。
    ・自動テストの誤判定を手作業で除去
    ・不具合報告のバージョン間違いや、分かりにくい文言を手作業で修正
    ・更新されていない不具合の状況を開発者に確認

  • @satoshikoike8625
    @satoshikoike8625 5 місяців тому +6

    10:54
    このリズムとイントネーションちょっと危ういな

  • @yosoynannan
    @yosoynannan 5 місяців тому +10

    映画パプリカでも見たような文章

  • @まつゆき-t9r
    @まつゆき-t9r 3 місяці тому +1

    この動画の冒頭を流したら小学生の子供たちが反応してましたꉂ🤣𐤔

  • @kanametatsuya
    @kanametatsuya 5 місяців тому +2

    23:21 ここ好きすぎる笑
    実際なんでひきとぴきがあるんだろ

  • @kicyoh3390
    @kicyoh3390 5 місяців тому +9

    trpgでSAN値チェック失敗して大量にSAN値減って発狂した人の話し方だった、ランボー怒りのプロパンガス構文

  • @kanametatsuya
    @kanametatsuya 5 місяців тому +7

    出落ち面白すぎるだろ笑笑笑笑

  • @yukizokin
    @yukizokin 5 місяців тому

    最新のコンピュータの話が聴けるのが楽しいですね。

  • @Shushupu_Love
    @Shushupu_Love 5 місяців тому +1

    ビートボックスオープニングの次に好き

  • @paparos
    @paparos 5 місяців тому +3

    五木ひろしの「ヨコハマたそがれ」歌詞のサビ以外はほぼ名詞

  • @cork__
    @cork__ 5 місяців тому +1

    冒頭で吹いてしまった…ご飯を

  • @tototoruzzo
    @tototoruzzo 5 місяців тому

    よし、今日も頑張れるぞ!ありがとう!

  • @80suisei-25
    @80suisei-25 5 місяців тому +2

    6:45 どっかで聞いたかと思ったらパプリカだ!

  • @shomwoys
    @shomwoys 5 місяців тому +1

    にっこにこりょーさん分たすかる

  • @susancalvin1918
    @susancalvin1918 9 днів тому

    食物と排泄物の区別ができないのは大変ですね、お疲れさまです・・・

  • @VTFLab
    @VTFLab 5 місяців тому

    大変わかりやすいし面白いしで参考になる
    コモンクロールはボキャブラリーの獲得、ファインチューニングが学校教育、なるほど

  • @ここ-s9y1y
    @ここ-s9y1y 5 місяців тому +8

    25:21 ここで水野さんが「中級者ならではの誤解」って言っちゃってるのって、りょーさんと自分2人が上級者って言ってたのに、自分だけ初級者であることを無意識に認めてしまっている言い間違えで面白い

  • @中野雅也-e4z
    @中野雅也-e4z 5 місяців тому +4

    年月日の件、Excelに書式をそろえて記入してくれた時点でもう百万点ですね
    後は関数でどうとでもなりますし

    • @HitYoutube
      @HitYoutube 5 місяців тому

      240630と西暦の20を省いてしまうのありがちw

  • @Jun-oh8pk
    @Jun-oh8pk 5 місяців тому +4

    堀元さん歌うめぇ

  • @milkman5966
    @milkman5966 5 місяців тому +2

    コモン・クロールはゴール・D・ロジャーの上位互換
    覚えた

  • @gnwf47
    @gnwf47 5 місяців тому +1

    音だけで入力していて
    「自然差」という差分に関する
    専門用語かと思ったら
    自然さ…

  • @うだがわ-x4f
    @うだがわ-x4f 5 місяців тому

    最近仕事でLLM関わること多くて、3章立て長いけど見るか…と思ったんだけど一瞬で終わった。面白すぎる。レギュラーになって欲しい。

  • @TANAKA_YASUHIRO
    @TANAKA_YASUHIRO 5 місяців тому +1

    29:40 海保さんの強盗ネタ、5年後には真実になってそう👀

  • @トマトマト-e5f
    @トマトマト-e5f 5 місяців тому

    23:37 突然「お!」と何かに気づいたホリモト氏

  • @kaz8340
    @kaz8340 5 місяців тому

    29:20~
    の話、優秀な人が地道なことをすると効率が良いという示唆がある。
    それが全体としてどうかは置いておいて。

  • @hrtk1534
    @hrtk1534 5 місяців тому +2

    プッチ神父弾かれてしまう

  • @霊夢儲
    @霊夢儲 5 місяців тому +8

    Excelの、フォントを16ポイントにして、拡大率85%にするやつ

    • @HitYoutube
      @HitYoutube 5 місяців тому +2

      ごめんMS-DOS時代からExcel使っている人にとっては
      FixedSys16やTerminal16フォントにしといて画面だけ拡大率変えるのは常識だったのさw

  • @天下一-v4n
    @天下一-v4n 5 місяців тому +6

    13:05
    その話を聞いて思い出したのが、英語のバッファロー早口言葉
    「Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.(バッファロー種のバッファローがいじめているバッファロー種のバッファローが、バッファロー種のバッファローをイジメている)」
    「baffalo」が「バッファロー種の」という形容詞にも、「バッファロー」という名詞にも、「イジメる」という動詞にもなるという話。
    上記の文も、名詞ばかりに見えてしまうが、切り分けると文になっている。と。
    日本語と英語でまた違うのかも知れないが、難しいところ…ですか?

    • @Seiya_laugh
      @Seiya_laugh 5 місяців тому +2

      憶測ですが、英語は同じ単語が名詞にも動詞にもなるケースが珍しくないので、品詞分解のような処理をしていると思います。
      とはいえ、ここまで同じ単語が続くのはかなりの例外なので、正しく品詞分解が出来ず、結局弾いていそうですが笑

    • @天下一-v4n
      @天下一-v4n 5 місяців тому +2

      @@Seiya_laugh そうなんです。そこが難しいかなぁ、と。
      さらに言うと、日本語でも「●●する」みたいに名詞を動詞化する手段がないではないので、参考にはなるのではないか、とも。

  • @rose_miura
    @rose_miura 5 місяців тому +5

    _人人人人人人人人人人人人人人人_
    > 世はまさにビックデータ時代 <
     ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄

  • @iwasorange
    @iwasorange 5 місяців тому +3

    堀元さんの歌聞いたの初かもww

  • @楢﨑悠也
    @楢﨑悠也 5 місяців тому +3

    最初の用例にパプリカの味を感じました。

  • @吉田知栄-n8v
    @吉田知栄-n8v 5 місяців тому +4

    いきなり大爆笑

  • @鰤臼
    @鰤臼 5 місяців тому

    大規模言語モデルの指示と答え入力するバイトやりたかったな~!

  • @たぬき-s6w
    @たぬき-s6w 5 місяців тому +3

    堀元さんお歌上手ですね😂

  • @ぱぱぱパパ-j3p
    @ぱぱぱパパ-j3p 5 місяців тому +1

    水野さんのExcelのやつ、まさか手打ちで全部修正したのかな

  • @ALTCOLONNA
    @ALTCOLONNA 5 місяців тому +1

    ランボーはネットスラングとして学習させても良いような。「ランボー怒りの休日出勤」とか一般語彙ですよね

  • @nepier
    @nepier 5 місяців тому +2

    機械による演算には冪等性がある、ではなくて
    冪等性がない物理事象からハードウェアなりソフトウェアを巧みに組んで
    できるだけ冪等性を保てるようにがんばっている
    のほうが正しそう

  • @荻野あんず
    @荻野あんず 5 місяців тому +2

    いうてもエクセルなんかのシリアル値は決して一般的では無いんですよね。オープンデータでは水野さんの形式だったりするし

  • @ペンギンクミマヌ
    @ペンギンクミマヌ 4 місяці тому +1

    子守はビックテックでもやってるんですね。趣味でAI作ってて、子守やってる最中に、私に技術がないだけでもっとスマートなやり方があるはずだと思っていました、子守の話を聞いて安心しました。

  • @perigeefullmoon
    @perigeefullmoon 5 місяців тому +2

    大規模言語モデル(ワンピース)ってやっぱおもしろい😁

  • @一枚役取りた過ぎてスイカこぼす

    13:00
    五木ひろしの『よこはま たそがれ』が思い浮かびました