日本最初の合成音声

Поділитися
Вставка
  • Опубліковано 10 січ 2021
  • 1959年(昭和34年)に、電子音によって発声するタイプの日本最初の音声合成装置が、郵政省電波研究所(現・情報通信研究機構)によって開発されました。この動画では、当時の合成音声と、その開発の意義をご紹介します。
    当コンテンツは、2021年5月15日にBSフジで放送された「もしもで考える…なるほど! なっとく塾」“もしも声を自由に変えられたら? ” の中で引用されました。
    この合成音声を開発した鈴木誠史博士(元郵政省通信総合研究所所長)は、90歳になる現在(2023年)も、簡単な科学実験動画を製作して、ご自身のUA-camチャンネル(以下)で公開されています。
    / @user-ep6yc8hc8w
  • Наука та технологія

КОМЕНТАРІ • 991

  • @user-ps9kt8mq1d
    @user-ps9kt8mq1d 10 місяців тому +1001

    60年以上前の技術なのに,想像以上に実用に耐える音声でびっくりした
    技術者の人には尊敬しかないな

    • @user-yj6uq6bw5w
      @user-yj6uq6bw5w 10 місяців тому +14

      技術が停滞してる証拠

    • @ike3563
      @ike3563 10 місяців тому +65

      停滞も何も、チューリングテストに合格してる事例があるんだから、ほぼこれ以上ない領域まで進化しちゃったんだよな。
      だから今度はハードウェア、ユーザビリティ、悪用防止、等の方向に開発が広がっていってるわけで。
      逆に君はどこ目指してるのって話。

    • @ma2mani
      @ma2mani 10 місяців тому

      @@user-yj6uq6bw5w これ以上に何があるんや?頭のバージョンアップを君はすべきだね

    • @naiChaSanJieMeid
      @naiChaSanJieMeid 9 місяців тому +6

      こんなクソ音声で実用に堪えるはまじで草

    • @taueman8
      @taueman8 9 місяців тому +27

      ​@@naiChaSanJieMeidお前らオタクは萌え萌えキューン♡みたいな声を求めてるんだろうが人が話さなくても入力すればしゃべってくれるってのはそれだけで便利なんだよ。

  • @user-qc2ch5su2v
    @user-qc2ch5su2v 3 роки тому +2601

    60年以上も前なのに結構まともな音声やね。

    • @user-yj6uq6bw5w
      @user-yj6uq6bw5w 10 місяців тому +6

      技術が停滞してるだけ

    • @user-lj5cc9cg6l
      @user-lj5cc9cg6l 9 місяців тому +43

      @@user-yj6uq6bw5w停滞してるって色んなコメで必死に打ってる君可愛いね♥️♥️♥️

    • @user-you_are_an_idiot
      @user-you_are_an_idiot 9 місяців тому +7

      60年前を舐めすぎやろ😂

    • @nulla1237
      @nulla1237 9 місяців тому +5

      ゆっくりボイスよりも綺麗に作れてるやんか

    • @sumaho_de_MikuMikuDance
      @sumaho_de_MikuMikuDance 8 місяців тому

      ​@@user-lj5cc9cg6l
      え、、、

  • @user-iz8wg6nd1x
    @user-iz8wg6nd1x 11 місяців тому +153

    途中で出てくる「ええ、そうです」というのが亡くなった伯父そっくりの声質とイントネーションでびっくりした。
    他の言葉も昔の東京の人の発音に近いように思います。
    聞き取り調査が東京でやったものなら当時の東京の人の発音に近くなっても不思議ではないのですが。

    • @youtubeofficialchannel6380
      @youtubeofficialchannel6380 11 місяців тому +25

      こういう証言があるのも面白いなぁ

    • @user-ou7se7dq4k
      @user-ou7se7dq4k 8 місяців тому +6

      いつの間にか当時の発音を残せたわけですね。

  • @AB-kb2zn
    @AB-kb2zn 11 місяців тому +3098

    こっからゆっくりやボカロに進化したって考えるとすごい感慨深いな

    • @user-hs3up2bt1z
      @user-hs3up2bt1z 11 місяців тому +171

      ボイロも入れろ

    • @sinanokazesayaka
      @sinanokazesayaka 11 місяців тому +89

      @@user-hs3up2bt1zおっせーやな(適当)

    • @Anonymous-eq3by
      @Anonymous-eq3by 11 місяців тому +58

      ​@@user-hs3up2bt1z一気に知名度落ちたわ

    • @nakamigi1089
      @nakamigi1089 11 місяців тому +174

      ​@@user-hs3up2bt1z数多ある合成音声の名前なんていちいち入れてられるかよ

    • @koppunsyuraba
      @koppunsyuraba 11 місяців тому +27

      ​@@Aventador_lbwk結月ゆかりやきずなあかりなどの合成音声シリーズの略ってところですかね?元はボイスロイドです

  • @user-zu8ox5jg7t
    @user-zu8ox5jg7t 11 місяців тому +736

    1959年の時点で「や」「わ」「おはよう」などと聞こえるような高度な合成音声を作り出せたとは!音声合成技術にもやはり歴史があったのね。

  • @tetsu7327
    @tetsu7327 11 місяців тому +428

    これが今じゃ歌歌えるようになったのか…

    • @院卒のチー牛
      @院卒のチー牛 7 місяців тому +7

      もうすぐでもう人間と聞き分けがつかないな。

  • @user-hk8uj4ei3y
    @user-hk8uj4ei3y 10 місяців тому +398

    言語として成立してない単母音の連呼から始まって、短い単語を自分の能力を少しずつ確認するかのようにたどたどしく発音するの、ゲームに出てくる明らかにヤバいラスボス格の羽化シーンすぎる

  • @user-pv6dy1fk4h
    @user-pv6dy1fk4h 2 роки тому +662

    この時代のパソコンで遠隔操作使って合成音声で「呪ってやる」とか「ここから出して」とか流されたら誰だって呪われたって思うでな

    • @user-bz1qj8lq8l
      @user-bz1qj8lq8l 2 роки тому +57

      そのスレのまとめ動画から実際のBeepを聞きにここへ来ました^^

    • @user-pv6dy1fk4h
      @user-pv6dy1fk4h 2 роки тому +14

      @@user-bz1qj8lq8l おぉ同士よ

    • @user-jl7jk2gl8r
      @user-jl7jk2gl8r 2 роки тому +10

      @@user-pv6dy1fk4h
      ナカーマがいた

    • @tonkatuteisyoku
      @tonkatuteisyoku Рік тому +8

      ???「同志よ……」

    • @popeka
      @popeka Рік тому +10

      同じく。
      聞いてみると納得の音声ですね

  • @satonaka3673
    @satonaka3673 3 роки тому +640

    なんかこの合成音声聴くとトモコレを思い出してしまう

    • @nomuknk
      @nomuknk 2 роки тому +67

      コクハクシタ↗︎イ→ノデスガ

    • @星町すいせい
      @星町すいせい 2 роки тому +33

      〇〇のそっくりさん、こんにちわ!

    • @Theコラム
      @Theコラム Рік тому +47

      わた↑しと付き→合ってく↓ださい

    • @Chinese_eel
      @Chinese_eel Рік тому +54

      ​@@Theコラム ご め ん な さ い ( 絶 望 )

    • @Eringi_Shumai-KEN
      @Eringi_Shumai-KEN 11 місяців тому +4

      先に言われた……(´・ω・`)

  • @rizuten_2006.
    @rizuten_2006. 11 місяців тому +127

    この声でおはようって起こされたら心臓飛び出るぐらいビビるわ

  • @TaiyouSunSun10
    @TaiyouSunSun10 2 роки тому +301

    なんだか、ぎこちなく喋るロボットみたいで応援したくなるな。

    • @user-djudgphp2f
      @user-djudgphp2f 4 місяці тому +3

      弱いロボットっていう研究がありまして、興味があればググってみて下さい。ロボット自体に能力がなくとも、人間の庇護欲を利用して人間にやってもらえたら…という考えです。

  • @KeyuChan_
    @KeyuChan_ 11 місяців тому +722

    でかい機械だったものが今じゃ個人の小さい機械の中でできるし波形接続以外にもHMM方式やNNWを利用した合成が出たりと技術の進歩を感じる

  • @kazu-kp6hm
    @kazu-kp6hm 10 місяців тому +149

    初見だから音読さんが日本最初の合成音声だと思って感動しちゃった

  • @rinlinpri
    @rinlinpri 10 місяців тому +742

    論文を書いた開発者が動画の監修をしてるのがまた凄い

    • @seika_beginner_4888
      @seika_beginner_4888 10 місяців тому +90

      学会「この理論を作ったのは私ですが...」

    • @7gfkkgcvbnj
      @7gfkkgcvbnj 10 місяців тому +38

      ほんとだ!鈴木誠史という方ですね。
      開発時30歳として、いま93歳・・・生き証人だ。

    • @user-ht1ez9ss4y
      @user-ht1ez9ss4y 10 місяців тому +9

      素人質問で恐縮なのですが

  • @riria8698
    @riria8698 Рік тому +3428

    この声を遠隔で流されたらそりゃトラウマになるわな

  • @y-ange8018
    @y-ange8018 11 місяців тому +386

    最初のものでも、大正・戦前期のラジオくらいの音質だから、結構凄いと思う。

    • @Kei-IWA_Siliconated
      @Kei-IWA_Siliconated 11 місяців тому +32

      それを今聞ける理由は保存メディアがあったからで、つまり同じような磁気テープやレコードディスクをこの装置も積んでいるからですね。>音質

    • @Sotetsu21108f
      @Sotetsu21108f 10 місяців тому +6

      @@Kei-IWA_Siliconated保存メディアや記録媒体の進化も 感動的ですね。

  • @m-yukimine
    @m-yukimine 11 місяців тому +154

    合成音声を合成音声で解説するのが実に面白いw

    • @user-rt7ji6ti4r
      @user-rt7ji6ti4r 10 місяців тому +10

      二つを比べてみるのもこの動画の醍醐味ですね

  • @yua0694
    @yua0694 2 роки тому +1077

    こんな昔から開発され始めてたとは凄い。
    何となく70〜80年代くらいにできた技術かと思ってた笑

    • @user-gz4hk8op1z
      @user-gz4hk8op1z 11 місяців тому +116

      とちらにせよ昭和に開発されてるのが驚くマジで
      だってその割にはアナウンスとか合成音声になったの最近でしょ?

    • @kunugi_chestnut
      @kunugi_chestnut 11 місяців тому +46

      ⁠​NPO科学映像館の「シュミレター」(誤字)で50年ほど前の小学生がテレビで算数の問題を解く映像があったけど、そういう教材がすぐに普及はしなかったのを見るに、コストとか社会の慣れって大きいよな

    • @frosty999ful
      @frosty999ful 11 місяців тому +18

      そもそもコンシューマーエレクトロニクスに於いて
      真空管がトランジスタに置き換わる
      トランジスタからICやLSIにたどり着くまで
      各々15年ほど掛かって(買った消費者もスゴいw)
      今の超絶レベルのマイクロエレクトロニクス
      汎用CPUインテル8080の設計者は日本人
      ワンチップ汎用CPUのアイデアも元は日本の電卓メーカー

    • @user-mo1me4io5j
      @user-mo1me4io5j 11 місяців тому +5

      燃えプロとかあんな小さなチップであれだけの声をだしてたしね

    • @user-lz9kf1ci5c
      @user-lz9kf1ci5c 11 місяців тому +19

      @@user-gz4hk8op1z 日本は世界屈指の技術大国だったからね。アメリカに消されたけど。

  • @tateyokocrt
    @tateyokocrt 11 місяців тому +665

    口腔の再現って、結構急峻なピーク/ディップを持った「次数の高い」フィルターをスウィープする必要があるので、それを最初に作った人は尊敬します。

    • @mokken-sekken
      @mokken-sekken 10 місяців тому +13

      膣つきてぇ〜

    • @winpolluxfs9899
      @winpolluxfs9899 10 місяців тому +1

      すごいねー😂😂

    • @Akita_ken2236
      @Akita_ken2236 10 місяців тому +7

      たしかに「次数の高い」フィルターはアイデンティティでプロットすることがエッセンシャルですもんね。それをファーストでメイクしたヒューマンはリスペクテッドすべきです

    • @Anal_Desert
      @Anal_Desert 9 місяців тому +2

      オフチョベットしたテフをマブガッドしてリットにする定期

    • @user-denshikousaku_staygold
      @user-denshikousaku_staygold Місяць тому +1

      人間の口ってエグいくらい
      帯域が狭くて高性能な周波数フィルタ
      だから電子回路で再現するの
      大変なんだよな…

  • @k2434
    @k2434 11 місяців тому +108

    最近個人が開発した中の人が居ない音声合成ソフト『足立レイ』とかなり似てるから似た仕組みなんだろうなぁ

  • @TreeWell2712
    @TreeWell2712 11 місяців тому +51

    「音と声の境界」って繊細なんやねえ。

  • @TheDeltaevolutione
    @TheDeltaevolutione 11 місяців тому +180

    合成音声がこんなに前から作られていたことに驚き!
    けっこう日本語として聞こえる!すごい!

  • @zubizuberpapa
    @zubizuberpapa 10 місяців тому +217

    携帯電話の音声って、通話者の声に似せて作られた「合成音声」だったのか。
    最初の頃は、合成音声の母音がビープ音のような音だったのと比べると凄い進化ですね。
    ICが無かった時代、ちょっとした事をする回路をトランジスタでもなく真空管で組むと巨大ですね。

    • @toyo-rex4899
      @toyo-rex4899 10 місяців тому +24

      携帯電話の音声が「合成音声」であるくだり、先月末の「チコちゃんに叱られる」内で、「なんで携帯電話の声はいつもと違って聞こえるの?」→「あなたの本当の声ではないから」という答え合わせで詳細に解説されていましたね。

    • @OmoriSousuke
      @OmoriSousuke 10 місяців тому +22

      うそ電話詐欺で孫を装ってもバレにくいのは
      耳が遠くなった以外にも要因があったんだなあ

    • @user-lb6yf6ez9s
      @user-lb6yf6ez9s 10 місяців тому +22

      母に電話かけた時自分と妹で「あんたらの声どっちがどっちか分からん」って言われてたのはこういう事だったのか

    • @nipul1967
      @nipul1967 10 місяців тому +9

      >ちょっとした事をする回路をトランジスタでもなく真空管で組むと巨大ですね。
      普通の電卓(関数電卓とかじゃなくて)を真空管で作ると体育館ほどの大きさになり、発電所が直に必要なほどの電気が必要で、真空管電卓の沢山の真空管の一本でも切れればまともに動かない・・・らしいw

  • @7000_QPG
    @7000_QPG 2 роки тому +941

    てことはゆっくりボイスとかめっちゃ凄いんだなぁ

    • @RIPPYSTUDIO
      @RIPPYSTUDIO 11 місяців тому +19

      あら!!

    • @user-vl2mb4xi2m
      @user-vl2mb4xi2m 11 місяців тому +73

      フリーで何でも言わせられしな。

    • @motokinto
      @motokinto 11 місяців тому +10

      しなしーな

    • @kikyozakura
      @kikyozakura 11 місяців тому +22

      @@user-vl2mb4xi2mライセンスがあることをご存じで?

    • @kbtit_9315
      @kbtit_9315 11 місяців тому +21

      あの軽さはやばいわ
      なあずんだもん(低スペ民)

  • @jarousskyphilippe5831
    @jarousskyphilippe5831 11 місяців тому +68

    初の技術ってもうちょっと拙い感じかと思ったけど普通に聞ける感じなの凄い

  • @TM-yo7qk
    @TM-yo7qk Рік тому +172

    当時の開発者は実況や茶番劇に使われるとは思ってなさそう

    • @tomaaa9985
      @tomaaa9985 11 місяців тому +21

      ましてや、
      なんの功績も残していない馬の骨に勝手に商標登録されるなんて、
      この音声の開発者が知ったらさぞかし悲しむだろうなぁ

    • @ItibayNeko
      @ItibayNeko 11 місяців тому

      ​@@tomaaa9985
      あれはまた…別や。ヤツが登録しようとしたんは「特定の動画フォーマット」であって「電子音声技術」やない。
      「SofTalk」を登録したとかなら、それこそ化けて出られかねんがな。

    • @subeana_okage
      @subeana_okage 10 місяців тому +3

      @@tomaaa9985あうん

  • @rigel-p7475
    @rigel-p7475 Рік тому +243

    この時代に合成音声をつくろうとした(しかも本当に作った)ことだけでなく
    それを使った言語学の研究まで考えていたことが古の知恵みたいですごい

  • @user-hi4bt8de7g
    @user-hi4bt8de7g 10 місяців тому +100

    日本人はNoと言う事すら難しいのに「いやです」とはっきり言える合成音声さんすげえ

    • @ぱぴこぐみ
      @ぱぴこぐみ 8 місяців тому +5

      ???「まぁ、全部言わされてるんですけど」

    • @user-dl6yp3gg5l
      @user-dl6yp3gg5l 8 місяців тому +1

      いやです、いゃです、いゃぇす、いえす!YES!

  • @user-jc9hp5if4m
    @user-jc9hp5if4m 2 роки тому +247

    これが初音ミクの先祖か

    • @TYHGWN3107
      @TYHGWN3107 2 роки тому +52

      @@user-gm3sc7nk1n daisy bellな

    • @user-tq3jg4vu1y
      @user-tq3jg4vu1y Рік тому +12

      @@user-gm3sc7nk1n
      必殺技っぽい

    • @__mero.
      @__mero. Рік тому +11

      @@user-gm3sc7nk1n クレイジーは草

  • @nkdssks13
    @nkdssks13 3 роки тому +275

    結構とゃんとしてるのすごい

    • @user-yx9nl2yr9u
      @user-yx9nl2yr9u 2 роки тому +130

      とゃんとしてるは草

    • @user-gc4sz5io6y
      @user-gc4sz5io6y 11 місяців тому +33

      その文章がちゃんとしてないんよ

    • @izu_39
      @izu_39 11 місяців тому +17

      とゃんとしてるんですね

    • @AAAAA114
      @AAAAA114 10 місяців тому +3

      とゃんとした文書こうよ

    • @_kurumi_chan__
      @_kurumi_chan__ 10 місяців тому +1

      とゃんとしてない文

  • @toisaa
    @toisaa 11 місяців тому +353

    PC-6001mkIIなどに搭載されていたICが、この装置の子孫にあたる様な実感がありました。
    という事は、この装置は現在の全ての日本語合成音声のご先祖様と言って良い存在なのでしょう。

    • @restoreyan
      @restoreyan 11 місяців тому +19

      PC-6001mkII持っていましたがまさにこの系譜の声、って感じでしたね。抑揚がなくモゴモゴ喋る感じがそっくりで、6600シリーズで音階がつけられるようになりましたがその後Beep音源の変調音声あたりまではこんないかにもな合成音声然とした音だった記憶があります。6001シリーズと同時期に学研の科学あたりで聖徳太子の声を専用のミニコンで合成したという付録がついてきたことがありますが、6001シリーズよりは自然ですが、男性がしゃべった声をエフェクトかけて電話品質くらいに落としたような声してました。

    • @aoao7aoao7
      @aoao7aoao7 11 місяців тому +6

      PC6001にカセットポンした音声合成カートリッジで触りましたが、この系譜らしさがありましたね
      語尾の伸ばし方が同じ感じ。小5の時に友人の高橋君宅で使わせてもらったから約40年前
      以外に進歩していないのかな?って印象、8bit機には難しかったPCM録音も16bitだと比較的無難な
      音質まで再生可能になり、短く録音した音声を切り貼りする手法が長く続いていましたね。

    • @donfonten
      @donfonten 7 місяців тому

      ぱすぽ~とぉ~みせなぁ~さ~い(何のゲームか忘れましたが衝撃的でした)

    • @Mokkon
      @Mokkon 7 місяців тому

      NECはパソコンメーカーとして有名になりましたが、元々は電話交換機のメーカーなので色々と関係していたのかもしれません。

  • @user-nv7zl5kj8d
    @user-nv7zl5kj8d 2 роки тому +73

    錆び付いた廃遊園地のまだ生きてる部分がたまたま作動したみたいな恐怖感ある

  • @ouciukjbbjhhjkklksc8948
    @ouciukjbbjhhjkklksc8948 Рік тому +787

    「ええ」が「え、え」と単体で発音するのではなく「えー」というふうにつなげて発音してるのすごい

    • @usr747
      @usr747 11 місяців тому +12

      なんですごいのかわからん。

    • @potalo_dx3zt2wx7m
      @potalo_dx3zt2wx7m 11 місяців тому +14

      @@usr747技術がすごいんやん

    • @usr747
      @usr747 11 місяців тому +11

      @@potalo_dx3zt2wx7m ええと発音させるのとえーと発音させることにどんな技術的な差があるの。

    • @usr747
      @usr747 11 місяців тому +19

      @user-pb3yb4pu7w 2 分前
      @yotu1113 単に1文字ずつ発音させるんじゃなくて、前後の音に応じて最適な発音をさせてるのがすごいってことでは
      そんなことはしていないと思うけど。そもそも一文字という概念がないと思うが。一音ならまだわかるけど。

    • @user-sl1op3cp5v
      @user-sl1op3cp5v 11 місяців тому +13

      伸ばし棒ってコマンドがあったんかな
      え え
      or
      ええ
      ってので人間が表現してたんじゃないの

  • @kimetsu_kids
    @kimetsu_kids 10 місяців тому +42

    最初の合成音声でもこんなにはっきり聞き取れるのすごいな

  • @user-po1gd6rj2r
    @user-po1gd6rj2r 8 місяців тому +12

    この既視感あれだ、トモコレだ

  • @asmr7066
    @asmr7066 11 місяців тому +30

    終戦からわずか14年
    すごいよな

  • @user-ez6rl5rr8p
    @user-ez6rl5rr8p 11 місяців тому +27

    隔世の感あります 『ワレワレ ハ ウチュウジンダ』
    これ 初めて98買ったとき 出してみて 友人達に聞かせたら 
    「オモロイ」と 感心してた それから 三十年ほどした今 
    防災無線のデジタル化に伴い 合成音声化
    村の老人曰く「どこの家の娘だろか 奇麗な声の標準語」とか

  • @marxwakabayashi6676
    @marxwakabayashi6676 11 місяців тому +51

    この動画の監修がその大昔の論文書いた人で最後ちょっと感動した

  • @user-hp2bq5zj4n
    @user-hp2bq5zj4n Рік тому +259

    興味深く見させてもらいました。この技術の延長に今日の音声合成や、またMP3のような音声データ圧縮などもあるのだな、と思うと、感慨深いですね。

  • @X68K_oji3
    @X68K_oji3 11 місяців тому +38

    このアナログ波形合成音を聞いた当時の技術者や数学者は、恐らく失禁するほどうれしかったと思う。

  • @dokkano_sato
    @dokkano_sato 11 місяців тому +97

    これを考えるとボイスボックスとかってもはや魔法だな

    • @user-gl7cs1rg2j
      @user-gl7cs1rg2j 11 місяців тому +20

      十分に発達した科学技術は、魔法と見分けがつかないってか?

    • @whoooooontbehere
      @whoooooontbehere 11 місяців тому +5

      @@user-gl7cs1rg2j正にそれ

  • @Mamenosuke467
    @Mamenosuke467 Рік тому +174

    1980年頃に松下電器(現Panasonic)が小型で「法定放送装置」と言うのが京阪バスや京都市営バスに取り付けられました。
    「危険物を持ち込まないでください」「整理券をお取りください」「次停まります。ご乗車ありがとうございました」
    バスで本格的に合成音声による案内放送はclarionで開発されたのが最初と言われています。

  • @user-mn7mb7mx4l
    @user-mn7mb7mx4l 11 місяців тому +71

    1899年生まれの人がまだ60歳、戦後14年、大正15年から33年だったと思うと、どれだけ昔なのかが実感できるな……

    • @shiramin
      @shiramin 10 місяців тому +8

      アラフォーおっさん俺の親がまだ生まれてないし、もう死んでるジッジバッバが当時20代だったと思うとすごく昔の話だ

    • @blackbear6306
      @blackbear6306 10 місяців тому +3

      東京タワー開業翌年だよ

    • @user-mn7mb7mx4l
      @user-mn7mb7mx4l 8 місяців тому

      これめっちゃわかりやすい……@@blackbear6306

    • @user-mn7mb7mx4l
      @user-mn7mb7mx4l 8 місяців тому

      すげぇ…………@@shiramin

  • @shikumi0
    @shikumi0 10 місяців тому +40

    すばらしい。昭和30年代にここまで再現できるなんてすごすぎる。

  • @hiroshithekxgxb9483
    @hiroshithekxgxb9483 Рік тому +233

    YMO的な『ザ・合成音声』って感じがたまらなくカッコイイですね✨✨

    • @genjai0806
      @genjai0806 11 місяців тому +33

      P-modelでは1992年の解凍P-MODELではAmigaのSay commandがサンプリングされてました

    • @lem6611
      @lem6611 11 місяців тому +12

      そういえばYMOの頃にはもうパソコンに合成音声入ったりしてたけどYMOはそこまで合成音声使ってるわけでもなかったね

    • @user-mi1cf8fe1e
      @user-mi1cf8fe1e 11 місяців тому +13

      @@lem6611YMOのは合成音声じゃなくてボコーダーだからね
      アレは機械を通してるだけで、発声そのものは人間のソレだよ

    • @user-hd2km9uh3h
      @user-hd2km9uh3h 11 місяців тому +4

      どちらかと言うとクラフトワークや冨田勲かと。

    • @user-TOKISUDENIOSUSHI
      @user-TOKISUDENIOSUSHI 11 місяців тому +3

      ショウガクカン ビ デ オ

  • @jin760kubo
    @jin760kubo 11 місяців тому +295

    当初、古いゲーム機種で
    サウンドの波形を入れる「容量」が限りなく少なかった時代
    FINAL FANTASY シリーズで登場する、モーグリの「クポ」という音も
    もっとも容量が少ないサイン波を採用することで生まれました

    • @aoao7aoao7
      @aoao7aoao7 11 місяців тому +14

      でもサイコソルジャーは唄っていた

  • @dolmel-dot-comanai
    @dolmel-dot-comanai 10 місяців тому +13

    初期の声を聞けば聞くほど某アーティストが出したCG年賀状に出てきた目玉みたいなやつの声に聞こえてくるし、この声が唄音ウタとか足立レイみたいな無機音源の遠い祖先と考えると熱いものがあるな…

  • @mou-nemuiwa
    @mou-nemuiwa 11 місяців тому +50

    古典的なロボット系SFの金字塔である「われはロボット(邦題)」が出版されたのが1950年。
    そのほか2001年宇宙の旅(の元ネタ)など、ロボットやAIが喋る、という超技術を描いた名作は50年代の物がわりとある。
    SFで描かれるほど夢の技術だった「機械が喋る」という技術を、おなじ50年代に開発されてるってのが本当にすごい。

  • @yamafuuuu2942
    @yamafuuuu2942 11 місяців тому +21

    戦争終わって荒廃した日本が14年後に作ったんだぜ?凄いよねほんと当時の人は

  • @takkunst3701
    @takkunst3701 10 місяців тому +43

    東京タワーが完成前から合成音声ってあるんだ〜
    何もない状態から作って現代に欠かせないや電話の機能やボーカロイドに発展したりする技術だったり先人の人たちってやっぱすごいな〜

  • @-deko-
    @-deko- 10 місяців тому +18

    何とも言えない不気味さがあって味があっていいなぁ

  • @lemon-banana
    @lemon-banana 11 місяців тому +109

    ボーカロイドの礎というか原点と考えるとすごい

    • @RapidTachikawa
      @RapidTachikawa 10 місяців тому +22

      ボカロは完全機械ではなく中の人がいるのでちょっと違います
      例えば初音ミクは藤田咲さんの声を元にして作られています
      ゆっくりは完全機械なのでこっちが近いですね

    • @ikalukakiyoe
      @ikalukakiyoe 10 місяців тому +5

      @@RapidTachikawa 中の人がいるから前者というわけでもないぞ。最近のAI系(Cevio AI、Synthesizer V AI、Voicepeak、VOCALOID6など)は中の人こそいるけど、後者の方が近い。

    • @user-hx1wf4lw4b
      @user-hx1wf4lw4b 10 місяців тому +6

      ⁠@@ikalukakiyoe
      詳しくないんですが、VOCALOIDは五十音すべて録音してるのではなく音声の要素を抽出して合成しているんでしたっけ?
      だとすると、「肉声から要素のみをデータ化して送信し、受信側は合成音声で復元・再生する」技術の発展形なんですね。
      主要なアイデアは違っても技術は全部繋がってんだな…

    • @ikalukakiyoe
      @ikalukakiyoe 10 місяців тому

      @@user-hx1wf4lw4b 5までのVOCALOIDは音声を要素ごとに録音したものをつなぎ合わせることで歌声を生成してます。 五十音をどのレベルで録音しているのかは不明(小林幸子氏の話によると、「あい」発音した時の間の音声なんかも収録するとか)ですが、少なからず50音を録音する以上のデータを録音していることにはなります。(復元というよりは合成というほうが適当かも。)
      因みに、VOCALOID6などのAI系音声は学習データを用意して、その学習結果から音声をPC内で0から生成するので、以前のものとは全然違います。(学習データを用意するだけなので、中の人は何曲か普通に歌うだけでよいのだとか。)

    • @user-xw1mo8zl4e
      @user-xw1mo8zl4e 10 місяців тому +10

      どっちかというとゆっくりのご先祖様なのかな。
      でもこの機械や技術が無ければ初音ミクちゃんは生まれなかったと思うと感動だよね!

  • @ichi9627
    @ichi9627 2 роки тому +30

    なんかトモダチコレクション思い出したわ懐かしぃ〜

  • @user-ev2io5oi1m
    @user-ev2io5oi1m 8 місяців тому +9

    これが初音ミクのおじいちゃんだと思うと凄いな

  • @user-bq1lb1jy9b
    @user-bq1lb1jy9b 2 роки тому +38

    「聞き取りテスト」の発音が英語のテストで聞く音程そのままでモヤァってした笑

  • @GroupAdd01
    @GroupAdd01 11 місяців тому +130

    ここから約20年後に、TIがスピーク・アンドスペルを売り出し、そこからさらに五六年で、パソコンゲームに正弦波音声合成を使った物が現れ、更に20年経つとボーカロイド…なんとも感慨深いですね。

    • @toyo-rex4899
      @toyo-rex4899 10 місяців тому +5

      この合成音声から20年後といえば、YMOの「TECHNOPOLIS」内の「ト・キ・オ」や「T・E・C・H・N・O・P・O・L・I・S」という合成音声が出てきますね。
      さらにその4年後にリリースされた同じYMOの「君に、胸キュン。」では、曲中の「キュン!」を合成音声で作成しようとしたけど、結局断念してメンバー3人の肉声を重ね合わせたものになっています。
      40年ほど前まではそれほど合成音声を作成するのが難しいものだったのに、現在だとPC・スマホでチャチャッと作成できますから、この数十年の技術の進歩はすさまじいものです。

    • @GroupAdd01
      @GroupAdd01 10 місяців тому +4

      @@toyo-rex4899 テクノポリスのあの声、一度録音してボコーダーでエフェクトかけてたと思ってたんですが、実際には完全合成音声だったんですね。びっくり…。

    • @Kouta.K.
      @Kouta.K. 10 місяців тому +4

      そう?20年ってめちゃくちゃ長いよ
      通信速度の進歩に比べたら大分遅いと思う

  • @user-denshikousaku_staygold
    @user-denshikousaku_staygold 11 місяців тому +78

    要するに、アナログシンセを調整しまくって
    音声出したのか…
    これといいデイジーベルといい、あの時代に
    ボイロとかボカロじみたことやってるの
    凄いよね

    • @ikalukakiyoe
      @ikalukakiyoe 11 місяців тому +16

      ボイロとかボカロは録音された音素の連続なのでどっちかというと方法1に近いぞ。(唯一足立レイだけが1と2の合わせ技って感じ。)

    • @user-denshikousaku_staygold
      @user-denshikousaku_staygold 11 місяців тому +7

      @@ikalukakiyoe
      そっかあれ声サンプリングしてるんだっけか

    • @fukyouwa-yin
      @fukyouwa-yin 11 місяців тому +13

      @@ikalukakiyoe 足立レイは完全なる合成電子音だったと思う。人間の声は使ってないはず。

    • @femmefatale-dn7pe
      @femmefatale-dn7pe 11 місяців тому +5

      足立レイは木琴をベースに作った声だったはず

    • @ikalukakiyoe
      @ikalukakiyoe 10 місяців тому

      @@fukyouwa-yin中の人はいないよ、もちろん。ただ、歌を生成するときはUTAUを使用する。=録音したデータを物理的につなげる。なので、1と2の合わせ技といったまで。(今更だが、デフォ子も1と2の合わせ技か。灯台下暗しだった。)
      余談ですが、Neutrino、Cevio AI、Synthesizer V AI、VoiSona 、Voicepeak、VOCALOID6、Ace Studioなどは中の人こそいるけど、AI生成(学習データに基づいて音声をPCで音声を作る=サンプリングではなくモデリング)なので、2の方になります。

  • @kazuoa.4951
    @kazuoa.4951 11 місяців тому +15

    当時のおばあちゃんとかからの聴き取りの語音明瞭度もこのくらいだったから充分実用的に聞こえる。

  • @neobossnet
    @neobossnet 3 роки тому +62

    1959年って、キャリントン・イベントから、ちょうど一世紀後ですね。この時代に研究されていたとは、ビックリです。

  • @Marukute_Ayashii_Yatsu
    @Marukute_Ayashii_Yatsu 11 місяців тому +83

    合成音声とは少々違うけどMPEGの圧縮率とかものすごいもんなぁ
    どちらもこういう解析の積み重ねから生まれたものなので兄弟みたいなものとも言えるか
    FHDや4Kの映像なんて圧縮伸張の仕組みが無かったらとても扱える代物じゃないし
    人知れず基礎研究に取り組んだ先人達に感謝

    • @user-ou7se7dq4k
      @user-ou7se7dq4k 8 місяців тому +3

      基礎研究って大切なんですよね。

  • @mk-lc1nd
    @mk-lc1nd 11 місяців тому +26

    調声してないUTAUみたいな声だけど楽器から作ってんのすごい努力

  • @user-jj2jw8ch2c
    @user-jj2jw8ch2c 11 місяців тому +33

    60年も前から機械に喋らせようとする考えがあったことに驚き

  • @AmatujiEnsuke
    @AmatujiEnsuke 8 місяців тому +5

    2:30どうぶつの森のとたけけっぽい
    今では歌えるにまで進化してるのが凄い

  • @TachRR765
    @TachRR765 11 місяців тому +42

    これはすごい!
    チューニングは大変そうだけど、時間をかければ普通に会話できるレベルで驚いた。

  • @PanameraGTS
    @PanameraGTS 11 місяців тому +100

    AI利用の音声変換について調べていたらこの動画がオススメに出てきました。技術の進歩ってすごいなあと感慨深いです。

  • @user-wz2ou8ww6g
    @user-wz2ou8ww6g 11 місяців тому +31

    4:10の声が無駄にテンション高いおじさんみたいで好き😅

    • @Lilykatie0507
      @Lilykatie0507 11 місяців тому +6

      テンションがHighですね。

  • @TsucaPon40
    @TsucaPon40 11 місяців тому +31

    黎明期の合成音声は、人工内耳でやるような感じで、機械で合成されたような音声になってしまいます。
    人工内耳は、本来は3万本の聴覚神経をCochlearではわずか22個、Advanced Bionicsでは18本、
    MED-ELでは12個の電極で肩代わりをしますので、機械で合成されたような聞こえ方になるそうです。

  • @user-on8wo3pw1l
    @user-on8wo3pw1l 2 роки тому +80

    泥ママに盗まれたPCにBEEP音で夜中にホラー音声流してみたって動画があったけど…夜中にこの絶妙にカスレた音声が流れてきたら確実に漏らす自信がある。
    PC「…お、はよう。」

    • @azukidango
      @azukidango Рік тому +7

      2チャンのやつやんw絶対見た後に調べたべw

    • @winpolluxfs9899
      @winpolluxfs9899 Рік тому +8

      @@azukidango だから何…?

  • @taro___jog
    @taro___jog 9 місяців тому +5

    トモコレってこれから作られてたのか...!!

  • @user-ou7se7dq4k
    @user-ou7se7dq4k 8 місяців тому +3

    だんだん話せるようになっていくみたいな感じがいい。

  • @user-yy7io7ig2m
    @user-yy7io7ig2m 10 місяців тому +7

    あかりがやってきたぞ!って曲のあのセリフ達は相当すごいってことがよくわかった

  • @user-np8ht6wg9s
    @user-np8ht6wg9s 11 місяців тому +16

    クラフトワークのようなかっこよさを感じた

  • @user-hd2km9uh3h
    @user-hd2km9uh3h 11 місяців тому +107

    これも凄いですが冨田勲の無線等を使って山間部を走り電波の強弱やノイズを使って作ったという音声合成も凄い。昔の人は本当に奇知に飛んだ事をしてたんだなぁと改めて感心しました。

  • @k1Z9s0_
    @k1Z9s0_ 10 місяців тому +7

    第一声目聞いたとき、ゾッとしたわ

  • @hotatenohasira
    @hotatenohasira 10 місяців тому +4

    だんだん初代トモダチコレクションの音声に聞こえてくる

  • @orange5957
    @orange5957 11 місяців тому +26

    すごいP-MODEL感がある

    • @user-qv7ty1iw9v
      @user-qv7ty1iw9v 10 місяців тому +2

      オゾノ・コブラノスキー

    • @genjai0806
      @genjai0806 9 місяців тому

      Amiga Say command

  • @age788
    @age788 11 місяців тому +12

    今から約40年前、『燃えプロ』とか『水戸黄門』でファミコンが初めて喋った時は感動したものだった。

  • @flowerflower1154
    @flowerflower1154 11 місяців тому +13

    「ええ、そうです」が昔の人の言い方でおもしろい

  • @coconuz
    @coconuz 11 місяців тому +31

    この頃はまだ音声のスペクトラムを見て声の特徴を調べるってのはできなかったんやろな

  • @Ryo9755
    @Ryo9755 10 місяців тому +6

    開発者「シャベッタァァァァァァァ!!(歓喜)」

  • @not_tea22
    @not_tea22 Рік тому +39

    4:24 目覚ましに使おうかなw

  • @mt1845
    @mt1845 Рік тому +15

    60年以上前からあったの凄い

  • @anyanya0812
    @anyanya0812 9 місяців тому +4

    めっちゃトモコレみてぇ…

  • @user-yf4dl4dd1b
    @user-yf4dl4dd1b 7 місяців тому +1

    大変為になりました。先人達の努力には頭を垂れるのみです…

  • @user-hc5kk4pg8f
    @user-hc5kk4pg8f 11 місяців тому +9

    変なトーンってのには気になるけど、何を言ってるのかは理解できるから凄いですね!

  • @takey0urhands
    @takey0urhands 11 місяців тому +15

    ここから60年足らずで日常の中に当たり前に合成音声が入ってきて意味のある使われ方をするようになった、ってのはすごいな
    今はペッパー君みたいなのしかいなくても、あと50年もしたら表情豊かなロボットが日常生活の中でこちらによくできた皮肉を言ったりしてくるんだろうな

  • @user-gr4lz3vn8q
    @user-gr4lz3vn8q 10 місяців тому +6

    どうにか修復して「ゆっくりしていってね」と言わせたい

  • @pabacalda
    @pabacalda 7 місяців тому +3

    ここから60年って考えると進化遅くないか
    使う側の利便性がだいぶ変わったのかな

  • @momoiunder17
    @momoiunder17 9 місяців тому +12

    先人達の知恵が、今日の技術の基礎になり発展してると思うと考え深いですね。思った以上に、聴き取りやすく完成度が高い事に驚かされます。

  • @okaman_ch
    @okaman_ch 7 місяців тому +16

    これのおかげで世界に誇る日本のボカロ文化があるとするとめちゃくちゃ感慨深いなぁ

  • @user-sz7il4uo1j
    @user-sz7il4uo1j 11 місяців тому +10

    研究目的が直接の合成音声ではなく音響心理学やG.7xx等のCODEC開発の基礎研究として生かされてたんですねぇ

  • @user-gp4vw5vt1c
    @user-gp4vw5vt1c 11 місяців тому +4

    ゆっくり実況とボーカロイドで、慣れてるけど未だに合成音声が聞き取れない人がいるよね

  • @user-yd8tt9rm5y
    @user-yd8tt9rm5y 10 місяців тому +4

    モーニングコールで「オハ、ヨウ」とか言われたら恐怖で仕事休む

  • @Wilconago
    @Wilconago 11 місяців тому +94

    この音声を使って人力ボーカロイドを作る猛者が出現すると予想

    • @aoitikuwa
      @aoitikuwa 11 місяців тому +12

      YAMAHA布教しようね

    • @genjai0806
      @genjai0806 9 місяців тому +2

      オゾノコブラノスキー

  • @HankyuNizat8008
    @HankyuNizat8008 8 місяців тому +2

    合成音声その一:大抵の駅放送、列車内放送
    応用:ボーカロイド、ボイスロイド、CeVIO、AIvoice等
    その二:足立レイ()

  • @yuukimotomura
    @yuukimotomura 10 місяців тому

    趣味でいわゆるひとつの「プロ実況MAD動画」を作成しています。制作にあたり、この動画は極めて参考になりました。ならびに貴重でもあり非常にありがたい動画です。もっと早くこの動画に出会いたかったです。

  • @mukuro8434
    @mukuro8434 10 місяців тому +3

    おはようのやつとか、ハガレンの某キメラみたいを思い出してしまった……。

  • @rei10ko
    @rei10ko 10 місяців тому +7

    ソフト一つでできる時代からみると、PCが部屋一つだったのが、スマホというPC同様のが片手になったぐらいの違いがある。
    時代の進歩はすげえ

  • @Kk-bd8cx
    @Kk-bd8cx 9 місяців тому +2

    最初は何でも難しいのよ。
    無から有を作るわけだから。
    発送、いや発想するだけでも凄いこと。
    その時点で存在する技術をいろいろと組み合わせることで実現させる技術者には脱帽です。

  • @0730issop
    @0730issop 11 місяців тому +7

    CD💿の音も実際の楽器やボーカルの声ではなく、その楽器やボーカルの出す波形をデジタル処理して本物そっくりに再生しているのですね。しかし、人の耳には原音に忠実な音声として聞こえるから、不思議です。