Розмір відео: 1280 X 720853 X 480640 X 360
Показувати елементи керування програвачем
Автоматичне відтворення
Автоповтор
【参考文献】◯プログラマのための文字コード技術入門amzn.to/46c6jqf◯「カタカナは20文字だけ」「没アイテムで宝箱がカラッポに」 ファミコンハードの限界に挑んだ制作者たち ねとらぼあnlab.itmedia.co.jp/nl/articles/1801/07/news008.html【サポーターコミュニティ加入はこちらから】yurugengo.com/support【おたよりフォーム】forms.gle/BLEZpLcdEPmoZTH4A※皆様からの楽しいおたよりをお待ちしています!
以前、吐噶喇列島の島に住んでいました。住居表示は鹿児島県鹿児島郡十島村〇〇島〇〇番地 となっていました。
言語沼の件あってのこのシリーズ、エモい
初代ドラクエで採用されたカタカナは 20 文字+「ド」の 21 種類で、「リ」「ヘ」は平仮名で代用するため、収録文字数は 19 文字となっています。ちなみに、その 20 文字の中に「ク」は入っていません。(物語中に「クエスト」という単語は出てこない。)有名な話では、「ダースドラゴン」というモンスターは、アイデア段階では「ダークドラゴン」という名前だったというのがあります。また、水野さんが仰っていた呪文「メラ」はスタメン張っていたという話ですが、実は初代ドラクエに「メラ」は登場していません。初代ドラクエに登場した攻撃呪文は「ギラ」「ベギラマ」の 2 種類だけで、「メラ」が初登場したのはⅢですね。
また初代ポケモンでは「り」「へ」以外のひらがな・カタカナと「゛」「゜」「…」「ど」「ィ」「円」「!」「?」「 」とプログラムの仕様で生まれた終端文字なるもの(透明)、0~9、A~G辺りまでのアルファベット(背景のチップとして使用していたりもする)で256文字分(1文字当たり1byte)になっていたりします。よくバグらせると゛だらけになったりアネ゛デパミ゛みたいた名前が生まれたりするのもプログラムで「が」や「ぱ」を疑似的に再現していたからこそ生まれていたりしていると考えられます。(「と」の上に「゛」をつける普通バージョンだと上のポケモンのステータスなどの表示に影響が出るため?「ど」は1byteの大きさに収めるための文字でポケモンのステータス画面でのみ見られます。)
5:54 「ぬるぬる」なんて頻繁に言わないと言ったすぐあとに「ぬるっとしちゃう」が堀元さんの口から発されている
その字幕が「nuるっとしちゃう」になってたら300万融資した(ウソ)
nuるnuるPを存在しないって言ったときにnullとかけてるのかなってちょっと思いました
ぬるぽ
@@雄尿瓶ガッ
ガッ!
15:30ポケモンはバーチャルコンソールも含めるとと全シリーズから最新作にポケモンを移送できるんだけど、GBは「ヘ」の平仮名とカタカナの文字コードが同じで、移送するときに他の文字で判断して文字コードを平仮名かカタカナどっちかに変換する機能がついてたりするらしい。ポケモンっていうゲームだけ容量が少なかった時代の遺産がまだ残ってるんだよね
「ほっけ」を漢字で表すと魚編に花で「𩸽」なのですが、これはサロゲートペアといってUnicodeの中でも1文字16bitに収まらなくて拡張された少し特殊な字の1つです。扱いに注意が必要と言われていました。文字コード回でほっけのTシャツを着てくる堀元さん、流石ですね。
サロゲートペアを処理するコード書いたことありますが、あれはイヤだった。UTF8が発見されて良かったです。日本語は3バイトになりがちでムカつくけど。
昔、フォント作成PJに関わったことがあります。文字コードは設定されてても第1水準から作っていくので、最初は無い無い尽くし。第2、第3と進むとだいぶスレてきて高頻度を優先的に作る方式になりました。
繧繝 同じ色を濃から淡へ、淡から濃へと層をなすように繰り返す彩色法(デジタル大辞泉より)初期のDQでは「モンスター」が使えない(「モ」が無い)ので「まもの」と表記したとか
弁が3つの文字が合流していたのは初耳。ぜんぶ「弁える」の意味だと思ってた。智弁和歌山の弁はもとは辯で、弁護士や弁論と同じ源だったんですね。久しぶりに面白かった脱線話でした。
2人とも緑Tシャツお揃でかわいい
ドラクエ1の攻撃呪文はギラとベギラマしかないです(キメラがいるのでメラは出せるけど)「ダークドラゴン」というモンスターを実装しようとしたところ、「ク」が使えなかったので「ダースドラゴン」という謎の名前になったそうです。なぜかドラクエ3になって「ク」が使えるようになったあとも「ダースリカント」という新モンスターが登場したので、「ダース」という架空の形容詞を冠したモンスターは2体います。
14:55ちなみに「ク」も「エ」も未収録なのでゲーム会話中では「ドラゴンくえすと」と表示されます。
ドレミの歌以外で「『喇』は『喇叭』の『喇』」って言うことあるんだ
コナンくん「札幌に住んでるのに円山動物園ではなくてわざわざ旭山動物園…? 妙だな…」
「円マーク円以外に使わんしね」元も同じ記号ですね。海外通販で円表記だと思って買ったら元だった、といったケースがあり、問題になっています。
パソコンで文字を入力していると文字コードにに入ってない文字が〓(下駄記号)になって出てくることがあります。これは活版印刷の時、必要な活字がないとき不要の活字を上下さかさまにして仮置きし、その底面がゲラ刷りしたとき〓に見えたので、〓が文字コードに存在しない文字の代替文字になった。ちなみにこれを「下駄を履かせる」というそうです。
瓣(花弁・安全弁)と辯(雄弁・大阪弁)は分かりやすいけど正しいか否か分ける/弁えるを意味する辨(弁別・勘弁)に該当する漢字だけ区別するのかなり難しくね?弁当は物理的な境や蓋なので瓣かと思いきや辨だし弁証法・弁護士・弁舌・弁論・弁説・詭弁・弁解・弁明は一見全部コトバ関係なのに最初と最後だけ辨で違う。さらに弁理士や弁償するの弁は辨(わきまえるの意)ですらなく4文字目の辦(処理するの意)そしてダメ押しのように5文字目の辮(編むの意、弁髪)まである。一周まわって一緒にしてくれた先人に感謝かもしれん、全部バラバラのままだったらきっと自分は発狂してた…
流石にそこまで深い話は出来なかったか…
難読語の漢字は書けるがその意味を知らない水野氏と漢字を図形と認識するもその違いが曖昧な堀元氏。よいコンビである。
自分も違いをちゃんとは理解していないから説明ができないんだけど文字コードとエンコードは別物なのに混同されて一緒くたに扱われることが非常に多い。UTF-8 や Shift_JIS はエンコードで正確には文字コードではない。UTF-8 は文字コードである Unicode のエンコード方式のひとつ、Shift_JIS は文字コードである JIS コードのエンコード方式のひとつです。
ドラクエの話だと、ダークドラゴンを出そうとしたけど容量的にカタカナのクが使えないからダースドラゴンになったって話があった気がする
むだそすん!
@@masuo64 カタカナの話ね、ひらがなは使えるんやでwww
外来語の音訳であることを示すために、口偏を使ってたので、トカラ(奄美地方の言葉が由来)に漢字を当てる際に、音を表す声符に口偏を付けて吐噶喇となっています喇叭も同様
はえー勉強になる
繧繝(うんげん)、後学のために調べてみました。雛人形の載ってる畳の縁に付いてるカラフルな模様のあれ。
2人とも想像が膨らみすぎて色々話が脱線するの好き
楽しみに待ってました
縺溘ヮ縺セ縺。
ドラクエの「ク」は初代には無い文字で、ダークドラゴンをダースドラゴンとして登場させたのは有名な話ですね。
水野さんは文字コードを文字化けの原因として認識しているし、横隔膜はしゃっくりの原因として認識している
ただし、横隔膜がどこにあるかわからないし、しゃっくりのメカニズムもわからない。
幽霊文字の回楽しみすぎる…。漢字字典(≠漢和辞典)読んでると定期的に語義未詳の字が出るし、それがUnicodeとかでも起きるのは結構自然な結果でもあるよなぁ。幽霊文字クリシェはきっと折り目が線に見えた妛とか誰もミスの原因をしらないという彁とかかな?
Unicodeは、2バイトコードと4バイトコードがある。アラビア文字は、4バイトコードで表現し、日本語は、2バイトコードで表現している。
予想通りでしたね!
半角カナの呪縛とか、EBCDICやEUCとか、shift-JISはなんでシフトなのかとか、コードページってなにとか、最初の文字コードは5ビットだから32文字だぜとか、超漢字ってあったよねぇとか、文字コードのネタはそれだけでチャネル作れるほどありそうです。
ゆる文字コード学ラジオ待ったなし
Bと13では、鋼の錬金術師のお話に、存在しないはずの13号倉庫がある!?→昼見に行ったら実際はB倉庫でペイントされたBが1と3の組合せみたいなフォントで夜暗かったせいもあって、13号と勘違いしたってオチの話があったはず
ありましたね、単行本のおまけに入っていた気がします
文字コードが同一でもフォントによって文字が違うことはあり得ます。主流のアウトラインフォントではあまり見られませんが、ビットマップフォントではあえて嘘字を作成することがあります。ドット数の限界を超えた画数に対応できず、見た印象で漢字を識別するという区別のしかたをしてもらうためです。「感字」と呼んでいました。旧字でも新字でもない「そのフォント以外無い漢字」を表示するので、字を調べる用途では注意が必要です。
「包摂基準」は「包摂規準」と書くべき、みたいな話をJIS漢字の委員会の人が言ってた気がするんだけど、ずっと混用されて続けてる(総務省や法務省も基準を使ってる)。
32:29 今、堀元氏と全く同じ反応してから、1933(昭和8)年に弁理士資格取った父が言ってたことを思い出した。当時ガキンチョだった私には何のことやらさっぱりわからんかった。「弁理士とはな、弁護士と違って『ことわり(理)をわきまえる(弁=辨!)』仕事なんだ」…その後「弁護士は喋るばっかり」とか謎のdisりをしていたのも「辯」からだったのか…と、多分半世紀弱ぐらいで初めて納得しました‼️ちなみに父、早稲田大学政治経済学部卒。ソニーの創業者、伊深大氏と同窓だったとよく自慢しておりました。
ISO感度はISOの初期の規格であるISO100に基づく規格なので関係あります
10:35 吐噶喇の喇を説明するのに喇叭を例示してるのに喇叭の喇を説明するのに吐噶喇の喇って言っちゃうの実に水野さん
循環参照だ
毎回堀元さんの「○○さる」がそれで合ってるか...?ってなっちゃう...人に説明する時は「○○さる=○○できる」or「自分の意思・行動とは反して起きてしまうこと、自分が無関係なことを言いたい」と言ってます。(これで合ってるか分かりませんが)「コントローラー握った時にボタン押ささっちゃってさ〜」だと「コントローラーを握った時に、(押すという意思は無かったが結果)押してしまった」的な感じになります。よく使うのは「書かさる(さらない)」「このペン書かさんないなと思ってたけど、紙にグリグリやってたら書かさったよ」は「このペン(自分の行動とは関係なく)書くことができない状態だったが、紙にグリグリしてたら書けるようになった」「○○さる(さらない)」は自分の行動と関係なく最終的に起こったことを言っている感じがするので視点?が自分ではなく物にあるのかなあ?という感じがします(学がないのでこれで正しいか分かりませんが)。「洗濯機に服入れる前にボタン押ささった」だと、気付かずに押したわけではないんだなという感じがします。逆に「洗濯機のボタン押ささんないな」だと実際にはポチポチ押しているんだなという感じがします。
北海道出身にして現役プログラマーである俺得回。そして、お二人の切り口が自分にはない視点からの切り口で、国際通貨某のワイルドカード的な記号に対して「単語と同じだね」って言う話に繋がったのが凄く面白くて新鮮だった。ちなみに「おささる」とか「おささっちゃう」はある程度否定的なニュアンスというか、不都合であるみたいな意味合いが含まれてることが多く、「押すつもりはないのに(構造上の欠陥とかで)意図せず押してしまう」みたいな時に「(押そうとしてないのに)押ささっちゃうんだよこれー!!」とか言いますね。
文字コード制限で、いまも影響が残っているのは円記号とバックスラッシュの問題ですね。windowsのフォルダの区切りが円マークなのは見にくいと個人的には思います。ちょっと話は違いますが、波ダッシュも話がややこしいですね~。
アスキーアートをロゴにしてるツールとかも、ロゴが円マークだらけになって悲しくなるよね
波ダッシュ、win7だかwin8で打たれたテキストだと、未だに変なフォントになるのに、打った本人は気づいてないんですよね。
最近はsjis(≒ms932)とUTF-8とUTF-8(BOM)くらいを気にすれば良いけど、古いものだとEUC-JPとか気にしたりしてましたねあと文字コードのこと調べてると英語圏の人が文字コードの事なんも考えてないんだろうなと思うことがよくある
以前コンビニでバイトをしていた時、住所の代筆を頼まれたのですが「岐阜県揖斐郡」って普段書かない漢字ばかりで手に汗握った思い出があります
5:58「ぬ」要らない言うてたのにぬるっとしちゃう堀元さん
30:11常用漢字の中でも、後から追加された「遡」とかは常用漢字でも点2個ですね
ダルい駄菓子屋のおばちゃん「はい、じゃあおつり30万¤!」
自分は青森出身で「〜〜ささる」を「〜〜しようとしていなかったはずが、なぜか〜〜してしまう」という意で使用ささるのですが、これは「〜〜を自然にしてしまう」の応用と考えました。
トカラ列島は十島村ですね。日本で1番長い市町村だったり、日本で唯一領域外に役場あがある市町村だったりと雑学に事欠かない土地です。
領域外に役場がある市町村は他にもあった・・・
待ってました。絵文字や異体字セレクタのややこしい話が出てくることに期待。
𦚰(肉月に刀三つ)を脇(肉月に力三つ)と間違われるとご先祖様に申し訳なくなるので本当につらかったけどJISレベル4で収録されて歓喜したことは懐かしい。
33:25 サロゲートペアの話への布石ですね。こういう伏線を見つけるとワクワクしますね!!
祖母が祖父のことを「お父さん」と呼ぶのを「じいちゃん」でしょ!って訂正してたのを思い出した
International Organization for Standardization の略ならIOSやろがいと思ってググったら明確な由来がなく、私が世界統一した際は滅ぼそうと決めた
iOSが世界を席巻すると未来予知したのかもしれない。
これ期待してた、超待ってた
やっと来た!楽しみに待ってました
ファミコンが若い人にも知られていたら、導入で伝えようとしていた収録できている文字のイメージがつきやすいんですけどねぇ。
6:00 あーここほんと面白いwコンビ芸なんよw 円熟味増してるわーw
私の年収は¤0です。これでうまく誤魔化せたな。
ゆる言語学ラジオの内容が入ります。 27:10 〜 33:49 水野さんの話が面白いので、聞き入りますね。
昔QuizKnockのチャンネルで、「東大生なら文字化けしてても読める」ってやってましたね。
「この文字とこの文字は同じである」と判断する仕事は本当に面倒です。「これはデザイン差なので同定してよい」とかいう言葉が飛び交います。ちなみに総務省の包摂基準はけっこう緩いです。
このチャンネルでプロジェクトヘイルメアリーに出会い、火星の人を絶賛読書中の私には文字コードの話題はめちゃめちゃタイムリーですちなみに道民ですが、【押ささる】は・つい押したくなってしまうよりもどちらかというと・(誤って手が触れて)押してしまうの方がニュアンスちかいかな~と思ってます
さらに合流した弁の字は元々は違う字としてあったと言う話もありますね
Bと13のくだりはアニメ版のハガレンの怪談話回で見たことありますね
文字コードにないエピソードで、声優の朴璐美さんの璐が出せないから王路で代替しているのをよく見かける。
野球好きなら李承燁の火へんに華とか李机浩の木へんに凡とかそういう話かな
鬼滅の刃のネズコも字が出せなくて代替しているのを見ましたね。鬼滅ファンから誤字として指摘を受けるのか。名前が出る全ページに※で注釈が付いていた
「ぬるぬるとか言えなくて良い」の後にさっそく「ぬるっと」って言い出しちゃう堀元さん。
ドルとポンドは当時から基軸通貨としての立ち位置があったので独立させたほうが都合良かったとかじゃないのかな
その理屈だと円も必要やろ!ってなりそうな。円も強かったんやで、今じゃ考えられんが。
ASCIIが制定されたのは1963年、そのISO版が数年後くらいじゃなかったっけ。まだ円が強い時代じゃなかったよ。JISコードだと0x5Cに\の代わりに¥が割り当てられていていろいろ不便だった。
弁当の弁は「配膳する」から分けるの意味の「辨」みたいですね。
ドラクエの世界で出てくる、アレフガルドという地名はパッケージで説明されるけど、アとフが収録されてないせいでゲーム中では言及されない
ペアルックっぽいことに気が取られて内容が頭に入ってこない!
Zをパージしてしまうと Zamenhof の回が作れなくなってしまって困るのでは? > 水野さん
漢字は字体が問題になるけれど、実はアルファベットにも字体の違いがあってこちらはグリフ(?)の違いとして扱われていますね。小文字aに角のあるものとないもの、gがめがねのレンズ2つになっているのと、1つのもの…。漢字の書体字典なんかみると、同じ漢字なのに少しずつ異なるものがいくつも並んでいます。時代や地域あるいは人によって形が異なっていたのでしょう。康煕字典で字体を統一したことがあったようですが、これは印刷用に造られた字体に思います。書道やってる人は気づくと思うけれど、筆で書くときは少し変わった形なることがありますね。しんにょうが1点か2点で意味が変わることはないので同じ字としてもいいと思うのですが、漢字の簡略化なんかの歴史が関係してきて基準を決めにくいのでしょうね。
面白かったです
データベースの回で、「朝涼」とかの項目名をすべて番号づけるための表を別で作って、本体の表には番号の数字しかないっていう状態が、今考えると文字コードに似ているな、と。
文字コードって昔からいろんな種類があった。半角 BCDコード→ASCIIコード(Unix、PC) →EBCDICコード(IBMなどのメインフレーム)全角(日本語独自規格) ASCII系→Shift-JIS(PC)、EUC(Unix) EBCDIC系→IBM漢字、JEF(富士通)世界共通 UTF-8異なる文字コードの場合は必ず文字変換を行い、変換不能な文字コードがあると文字化けします。そもそも文字コードを間違えてファイルを開くと文字化けしまう。初期の頃のメールで半角カタカナが文字化けしたのは、PC側がShift-JISでメールサーバがEUCだったためで、Shift-JISは半角カタカナを1バイトで割り当てているのに、EUCでは半角カタカナが2バイトで割り当てられていました。今はメールサーバがUTF-8なので、Windows側がShift-JISでも半角カタカナの文字化けはなくなりました。文字コードの中には改行コードもあります。OSによって改行コードも変わるので、エンジニアをしているとトラブル対応の際に改行コードも意識します。
昔の半角カタカナ等の文字化けは、iso-2022-jp (いわゆるJISコード)で送ると宣言していながらそれに定義されていない文字を使うからで…最近はメーラーのデフォがUTF-8だから化けてないけど、iso-2022-jpで送れば化ける可能性があります。
最近知った、洗浄は洗滌と書いてで"せんでき"と読んだけど"せんじょう"と読まれる事が多く滌が常用漢字に入らなかったため、洗浄と書かれるようになったとか漏洩はもともと、ろうせつと読むけど曳の"えい"にひっぱられてろうえいと読むとかは関係ないですね
文字コードのISOもカメラのISOもディスクイメージのISOもキーボードのISOも会社が掲げてるISO14001?とかも全部 国際標準化機構ですよー。
弁のほかにも芸とかも合流してますね
繧繝は繧繝模様、畳の繧繝縁の時しか使わない気がします。暈繝でもよいはずです。
「押ささる」は便利
昔のPCは第二水準漢字ROMが別売りとかあったな。懐かしい話だ。
通販での贈答品の熨斗を作る仕事をしたことがあって、コードにない特殊字を手書き(絵)として数種類、その個別のPCのみに覚えさせて印字できるようにしてたのを思い出しました。今だと1字だけオリジナルフォントを作る感じでしょうか。あと「辻」も悩まされました。お客様に手書きで文字を書いていただくのですが、点一個なのかどうなのかとか、そもそもお客様が違いを認識しておられない場合どうするのか?とか勝手に変えてしまってクレームになるとマジでややこしいので。。。渡「辺」もや「斉」藤もややこしいですがこちらはお客様自身が文字の違いを理解してる場合が多いのでまだマシでした。
辻とか樋口の「樋」は、戸籍上明確に別字と扱われ、圧倒的に一点之繞の方が多いと思われますが、これを電子媒体で表示できない(CSSでfont-variant-east-asian:jis90;を指定してやればWEB上の表示はできますが)のは、非常に問題だと思います。斉藤の「斉」渡辺の「辺」は、非常に多くの字体が別字として扱われることに比べると非常に不合理を感じます。
IVSの異体字セレクタU+E0100〜U+E01EFを使いましょう
@@早川眠人さんありがとうございます。いろんなサイトで調べてみましたが、なかなか難しそうです。使い方をやさしく解説したページをご存じでしょたらお教えください。
@@yt-system1372 「IMEパッドで異体字セレクタを利用する」でggr
文字コードは文字の話なだけあって、水野さんの引き出しが多いですねえ
地元の新潟では「タオルなど長めの布などの先端が、地面に引きずられている」という現象を【しびいている】と言っていました。標準語にはこの言葉が存在しなくて困る
ポケモンの細長い電気タイプのシビ◯◯ってそれもかかってそうだな
13とBの話はハガレンで似たような話を扱った回があったな。軍の倉庫で存在しない13番倉庫が現れる噂があったけど、Bがデザイン上、1と3に見えただけだってやつ
ドラクエの話題で言うと後発のRPGである桃太郎伝説は「きんぎんパールプレゼントのオニ」というギャグキャラを出したいが為に容量が倍になったという逸話があります。
8:26葛の下の方の形違うのは、旧字体・新字体じゃなくて異体字じゃなかったっけ…?
24:22 アフォーダンス九大プレ模試で出た‼️一般語彙とは言わせない‼️
「おささる」についてですが、積読チャンネルでチャン(堀本)さんが紹介されていたテッドチャンの小説、予期される未来に出てくるランプが光ったら1秒後に必ずボタンを押してしまう玩具に当てはまりますね。でも現実で自分の意思とは関係なく行動してしまうことって?と思うので、道民の方はどういうシュチュエーションでこの言葉を使うのかすごく気になります。
13:12 なんだその認識あったのかという驚き
中国では「¥」は人民元を表します。中国出張後の旅費清算では注意が必要です。
RMBやJPYで明示しましょう
私の年収は¥100万しかありません。
文字コードのドタバタと言えば、ユニコードのハングル大移動だな。
ドラクエの容量削減の逸話だと、「ダースドラゴン」の一件があります。本当は「ダークドラゴン」としたかったところ、容量削減のために、ストーリー進行に問題がない、片仮名の「ク」を削除したらしいです。
中国語学べばこのチャンネルの考察の深さ10倍深くなりそう、と弁の話面白がりながら思った
28:18 スペルチェックは含まれますかね?
ドラクエはカタカナ無いかと思ってたが、確かに呪文はカタカナか
13とBを同一にみなすのは恐らく1337表記の話から派生してますね...
13:20大丈夫です。私も同族です。
Bと13は金田一かコナンかぬ~べ~で見たことある気がする。
北海道、東北方言の「〜ささる」は大変面白いので是非それで一回やってみてほしいです。文法的には中動態、古典文法における自発の「る、らる」に由来するものだと個人的に推測しています。言語の伝播が同心円状に伝わるということからすると、例えば沖縄にも同じような表現が残っていたりしないでしょうかね
19:48 実は中国元も円マークです。
同じような色の服を着ているせいで二人がペアルックに見えて気になって仕方がないw
【参考文献】
◯プログラマのための文字コード技術入門
amzn.to/46c6jqf
◯「カタカナは20文字だけ」「没アイテムで宝箱がカラッポに」 ファミコンハードの限界に挑んだ制作者たち ねとらぼあ
nlab.itmedia.co.jp/nl/articles/1801/07/news008.html
【サポーターコミュニティ加入はこちらから】
yurugengo.com/support
【おたよりフォーム】
forms.gle/BLEZpLcdEPmoZTH4A
※皆様からの楽しいおたよりをお待ちしています!
以前、吐噶喇列島の島に住んでいました。住居表示は鹿児島県鹿児島郡十島村〇〇島〇〇番地 となっていました。
言語沼の件あってのこのシリーズ、エモい
初代ドラクエで採用されたカタカナは 20 文字+「ド」の 21 種類で、「リ」「ヘ」は平仮名で代用するため、収録文字数は 19 文字となっています。
ちなみに、その 20 文字の中に「ク」は入っていません。(物語中に「クエスト」という単語は出てこない。)
有名な話では、「ダースドラゴン」というモンスターは、アイデア段階では「ダークドラゴン」という名前だったというのがあります。
また、水野さんが仰っていた呪文「メラ」はスタメン張っていたという話ですが、実は初代ドラクエに「メラ」は登場していません。
初代ドラクエに登場した攻撃呪文は「ギラ」「ベギラマ」の 2 種類だけで、「メラ」が初登場したのはⅢですね。
また初代ポケモンでは「り」「へ」以外のひらがな・カタカナと「゛」「゜」「…」「ど」「ィ」「円」「!」「?」「 」とプログラムの仕様で生まれた終端文字なるもの(透明)、0~9、A~G辺りまでのアルファベット(背景のチップとして使用していたりもする)で256文字分(1文字当たり1byte)になっていたりします。よくバグらせると゛だらけになったりアネ゛デパミ゛みたいた名前が生まれたりするのもプログラムで「が」や「ぱ」を疑似的に再現していたからこそ生まれていたりしていると考えられます。(「と」の上に「゛」をつける普通バージョンだと上のポケモンのステータスなどの表示に影響が出るため?「ど」は1byteの大きさに収めるための文字でポケモンのステータス画面でのみ見られます。)
5:54 「ぬるぬる」なんて頻繁に言わないと言ったすぐあとに「ぬるっとしちゃう」が堀元さんの口から発されている
その字幕が「nuるっとしちゃう」になってたら300万融資した(ウソ)
nuるnuるPを存在しないって言ったときにnullとかけてるのかなってちょっと思いました
ぬるぽ
@@雄尿瓶
ガッ
ガッ!
15:30
ポケモンはバーチャルコンソールも含めるとと全シリーズから最新作にポケモンを移送できるんだけど、
GBは「ヘ」の平仮名とカタカナの文字コードが同じで、移送するときに他の文字で判断して文字コードを平仮名かカタカナどっちかに変換する機能がついてたりするらしい。
ポケモンっていうゲームだけ容量が少なかった時代の遺産がまだ残ってるんだよね
「ほっけ」を漢字で表すと魚編に花で「𩸽」なのですが、これはサロゲートペアといってUnicodeの中でも1文字16bitに収まらなくて拡張された少し特殊な字の1つです。扱いに注意が必要と言われていました。
文字コード回でほっけのTシャツを着てくる堀元さん、流石ですね。
サロゲートペアを処理するコード書いたことありますが、あれはイヤだった。UTF8が発見されて良かったです。日本語は3バイトになりがちでムカつくけど。
昔、フォント作成PJに関わったことがあります。
文字コードは設定されてても第1水準から作っていくので、最初は無い無い尽くし。
第2、第3と進むとだいぶスレてきて高頻度を優先的に作る方式になりました。
繧繝 同じ色を濃から淡へ、淡から濃へと層をなすように繰り返す彩色法(デジタル大辞泉より)
初期のDQでは「モンスター」が使えない(「モ」が無い)ので「まもの」と表記したとか
弁が3つの文字が合流していたのは初耳。ぜんぶ「弁える」の意味だと思ってた。
智弁和歌山の弁はもとは辯で、弁護士や弁論と同じ源だったんですね。
久しぶりに面白かった脱線話でした。
2人とも緑Tシャツお揃でかわいい
ドラクエ1の攻撃呪文はギラとベギラマしかないです(キメラがいるのでメラは出せるけど)
「ダークドラゴン」というモンスターを実装しようとしたところ、「ク」が使えなかったので「ダースドラゴン」という謎の名前になったそうです。
なぜかドラクエ3になって「ク」が使えるようになったあとも「ダースリカント」という新モンスターが登場したので、「ダース」という架空の形容詞を冠したモンスターは2体います。
14:55
ちなみに「ク」も「エ」も未収録なのでゲーム会話中では「ドラゴンくえすと」と表示されます。
ドレミの歌以外で
「『喇』は『喇叭』の『喇』」って言うことあるんだ
コナンくん「札幌に住んでるのに円山動物園ではなくてわざわざ旭山動物園…? 妙だな…」
「円マーク円以外に使わんしね」
元も同じ記号ですね。海外通販で円表記だと思って買ったら元だった、
といったケースがあり、問題になっています。
パソコンで文字を入力していると文字コードにに入ってない文字が〓(下駄記号)になって出てくることがあります。これは活版印刷の時、必要な活字がないとき不要の活字を上下さかさまにして仮置きし、その底面がゲラ刷りしたとき〓に見えたので、〓が文字コードに存在しない文字の代替文字になった。ちなみにこれを「下駄を履かせる」というそうです。
瓣(花弁・安全弁)と辯(雄弁・大阪弁)は分かりやすいけど
正しいか否か分ける/弁えるを意味する辨(弁別・勘弁)に該当する漢字だけ
区別するのかなり難しくね?
弁当は物理的な境や蓋なので瓣かと思いきや辨だし
弁証法・弁護士・弁舌・弁論・弁説・詭弁・弁解・弁明
は一見全部コトバ関係なのに最初と最後だけ辨で違う。
さらに弁理士や弁償するの弁は
辨(わきまえるの意)ですらなく4文字目の辦(処理するの意)
そしてダメ押しのように5文字目の辮(編むの意、弁髪)まである。
一周まわって一緒にしてくれた先人に感謝かもしれん、
全部バラバラのままだったらきっと自分は発狂してた…
流石にそこまで深い話は出来なかったか…
難読語の漢字は書けるがその意味を知らない水野氏と漢字を図形と認識するもその違いが曖昧な堀元氏。よいコンビである。
自分も違いをちゃんとは理解していないから説明ができないんだけど
文字コードとエンコードは別物なのに混同されて一緒くたに
扱われることが非常に多い。
UTF-8 や Shift_JIS はエンコードで正確には文字コードではない。
UTF-8 は文字コードである Unicode のエンコード方式のひとつ、
Shift_JIS は文字コードである JIS コードのエンコード方式の
ひとつです。
ドラクエの話だと、ダークドラゴンを出そうとしたけど容量的にカタカナのクが使えないからダースドラゴンになったって話があった気がする
むだそすん!
@@masuo64 カタカナの話ね、ひらがなは使えるんやでwww
外来語の音訳であることを示すために、口偏を使ってたので、トカラ(奄美地方の言葉が由来)に漢字を当てる際に、音を表す声符に口偏を付けて吐噶喇となっています
喇叭も同様
はえー勉強になる
繧繝(うんげん)、後学のために調べてみました。雛人形の載ってる畳の縁に付いてるカラフルな模様のあれ。
2人とも想像が膨らみすぎて色々話が脱線するの好き
楽しみに待ってました
縺溘ヮ縺セ縺。
ドラクエの「ク」は初代には無い文字で、ダークドラゴンをダースドラゴンとして登場させたのは有名な話ですね。
水野さんは文字コードを文字化けの原因として認識しているし、横隔膜はしゃっくりの原因として認識している
ただし、横隔膜がどこにあるかわからないし、しゃっくりのメカニズムもわからない。
幽霊文字の回楽しみすぎる…。漢字字典(≠漢和辞典)読んでると定期的に語義未詳の字が出るし、それがUnicodeとかでも起きるのは結構自然な結果でもあるよなぁ。幽霊文字クリシェはきっと折り目が線に見えた妛とか誰もミスの原因をしらないという彁とかかな?
Unicodeは、2バイトコードと4バイトコードがある。
アラビア文字は、4バイトコードで表現し、日本語は、2バイトコードで表現している。
予想通りでしたね!
半角カナの呪縛とか、EBCDICやEUCとか、shift-JISはなんでシフトなのかとか、コードページってなにとか、最初の文字コードは5ビットだから32文字だぜとか、超漢字ってあったよねぇとか、文字コードのネタはそれだけでチャネル作れるほどありそうです。
ゆる文字コード学ラジオ待ったなし
Bと13では、鋼の錬金術師のお話に、存在しないはずの13号倉庫がある!?→昼見に行ったら実際はB倉庫でペイントされたBが1と3の組合せみたいなフォントで夜暗かったせいもあって、13号と勘違いしたってオチの話があったはず
ありましたね、単行本のおまけに入っていた気がします
文字コードが同一でもフォントによって文字が違うことはあり得ます。
主流のアウトラインフォントではあまり見られませんが、ビットマップフォントではあえて嘘字を作成することがあります。
ドット数の限界を超えた画数に対応できず、見た印象で漢字を識別するという区別のしかたをしてもらうためです。「感字」と呼んでいました。
旧字でも新字でもない「そのフォント以外無い漢字」を表示するので、字を調べる用途では注意が必要です。
「包摂基準」は「包摂規準」と書くべき、みたいな話をJIS漢字の委員会の人が言ってた気がするんだけど、ずっと混用されて続けてる(総務省や法務省も基準を使ってる)。
32:29 今、堀元氏と全く同じ反応してから、1933(昭和8)年に弁理士資格取った父が言ってたことを思い出した。当時ガキンチョだった私には何のことやらさっぱりわからんかった。「弁理士とはな、弁護士と違って『ことわり(理)をわきまえる(弁=辨!)』仕事なんだ」…その後「弁護士は喋るばっかり」とか謎のdisりをしていたのも「辯」からだったのか…と、多分半世紀弱ぐらいで初めて納得しました‼️
ちなみに父、早稲田大学政治経済学部卒。ソニーの創業者、伊深大氏と同窓だったとよく自慢しておりました。
ISO感度はISOの初期の規格であるISO100に基づく規格なので関係あります
10:35 吐噶喇の喇を説明するのに喇叭を例示してるのに喇叭の喇を説明するのに吐噶喇の喇って言っちゃうの実に水野さん
循環参照だ
毎回堀元さんの「○○さる」がそれで合ってるか...?ってなっちゃう...
人に説明する時は
「○○さる=○○できる」
or
「自分の意思・行動とは反して起きてしまうこと、自分が無関係なことを言いたい」と言ってます。(これで合ってるか分かりませんが)
「コントローラー握った時にボタン押ささっちゃってさ〜」
だと
「コントローラーを握った時に、(押すという意思は無かったが結果)押してしまった」
的な感じになります。
よく使うのは「書かさる(さらない)」
「このペン書かさんないなと思ってたけど、紙にグリグリやってたら書かさったよ」
は
「このペン(自分の行動とは関係なく)書くことができない状態だったが、紙にグリグリしてたら書けるようになった」
「○○さる(さらない)」は自分の行動と関係なく最終的に起こったことを言っている感じがするので視点?が自分ではなく物にあるのかなあ?という感じがします(学がないのでこれで正しいか分かりませんが)。
「洗濯機に服入れる前にボタン押ささった」
だと、気付かずに押したわけではないんだなという感じがします。逆に
「洗濯機のボタン押ささんないな」
だと実際にはポチポチ押しているんだなという感じがします。
北海道出身にして現役プログラマーである俺得回。
そして、お二人の切り口が自分にはない視点からの切り口で、国際通貨某のワイルドカード的な記号に対して「単語と同じだね」って言う話に繋がったのが凄く面白くて新鮮だった。
ちなみに「おささる」とか「おささっちゃう」はある程度否定的なニュアンスというか、不都合であるみたいな意味合いが含まれてることが多く、
「押すつもりはないのに(構造上の欠陥とかで)意図せず押してしまう」みたいな時に「(押そうとしてないのに)押ささっちゃうんだよこれー!!」とか言いますね。
文字コード制限で、いまも影響が残っているのは円記号とバックスラッシュの問題ですね。windowsのフォルダの区切りが円マークなのは見にくいと個人的には思います。ちょっと話は違いますが、波ダッシュも話がややこしいですね~。
アスキーアートをロゴにしてるツールとかも、ロゴが円マークだらけになって悲しくなるよね
波ダッシュ、win7だかwin8で打たれたテキストだと、未だに変なフォントになるのに、打った本人は気づいてないんですよね。
最近はsjis(≒ms932)とUTF-8とUTF-8(BOM)くらいを気にすれば良いけど、古いものだとEUC-JPとか気にしたりしてましたね
あと文字コードのこと調べてると英語圏の人が文字コードの事なんも考えてないんだろうなと思うことがよくある
以前コンビニでバイトをしていた時、住所の代筆を頼まれたのですが
「岐阜県揖斐郡」って普段書かない漢字ばかりで手に汗握った思い出があります
5:58
「ぬ」要らない言うてたのにぬるっとしちゃう堀元さん
30:11
常用漢字の中でも、後から追加された「遡」とかは常用漢字でも点2個ですね
ダルい駄菓子屋のおばちゃん「はい、じゃあおつり30万¤!」
自分は青森出身で「〜〜ささる」を「〜〜しようとしていなかったはずが、なぜか〜〜してしまう」という意で使用ささるのですが、これは「〜〜を自然にしてしまう」の応用と考えました。
トカラ列島は十島村ですね。
日本で1番長い市町村だったり、日本で唯一領域外に役場あがある市町村だったりと雑学に事欠かない土地です。
領域外に役場がある市町村は他にもあった・・・
待ってました。絵文字や異体字セレクタのややこしい話が出てくることに期待。
𦚰(肉月に刀三つ)を脇(肉月に力三つ)と間違われるとご先祖様に申し訳なくなるので本当につらかったけどJISレベル4で収録されて歓喜したことは懐かしい。
33:25 サロゲートペアの話への布石ですね。
こういう伏線を見つけるとワクワクしますね!!
祖母が祖父のことを「お父さん」と呼ぶのを「じいちゃん」でしょ!って訂正してたのを思い出した
International Organization for Standardization の略ならIOSやろがいと思ってググったら
明確な由来がなく、私が世界統一した際は滅ぼそうと決めた
iOSが世界を席巻すると未来予知したのかもしれない。
これ期待してた、超待ってた
やっと来た!楽しみに待ってました
ファミコンが若い人にも知られていたら、導入で伝えようとしていた
収録できている文字のイメージがつきやすいんですけどねぇ。
6:00 あーここほんと面白いw
コンビ芸なんよw 円熟味増してるわーw
私の年収は¤0です。
これでうまく誤魔化せたな。
ゆる言語学ラジオの内容が入ります。 27:10 〜 33:49
水野さんの話が面白いので、聞き入りますね。
昔QuizKnockのチャンネルで、「東大生なら文字化けしてても読める」ってやってましたね。
「この文字とこの文字は同じである」と判断する仕事は本当に面倒です。
「これはデザイン差なので同定してよい」とかいう言葉が飛び交います。
ちなみに総務省の包摂基準はけっこう緩いです。
このチャンネルでプロジェクトヘイルメアリーに出会い、火星の人を絶賛読書中の私には文字コードの話題はめちゃめちゃタイムリーです
ちなみに道民ですが、【押ささる】は
・つい押したくなってしまう
よりもどちらかというと
・(誤って手が触れて)押してしまう
の方がニュアンスちかいかな~と思ってます
さらに合流した弁の字は元々は違う字としてあったと言う話もありますね
Bと13のくだりはアニメ版のハガレンの怪談話回で見たことありますね
文字コードにないエピソードで、声優の朴璐美さんの璐が出せないから王路で代替しているのをよく見かける。
野球好きなら
李承燁の火へんに華とか
李机浩の木へんに凡とか
そういう話かな
鬼滅の刃のネズコも字が出せなくて代替しているのを見ましたね。
鬼滅ファンから誤字として指摘を受けるのか。名前が出る全ページに※で注釈が付いていた
「ぬるぬるとか言えなくて良い」の後にさっそく「ぬるっと」って言い出しちゃう堀元さん。
ドルとポンドは当時から基軸通貨としての立ち位置があったので独立させたほうが都合良かったとかじゃないのかな
その理屈だと円も必要やろ!ってなりそうな。円も強かったんやで、今じゃ考えられんが。
ASCIIが制定されたのは1963年、
そのISO版が数年後くらいじゃなかったっけ。
まだ円が強い時代じゃなかったよ。
JISコードだと0x5Cに\の代わりに¥が
割り当てられていていろいろ不便だった。
弁当の弁は「配膳する」から分けるの意味の「辨」みたいですね。
ドラクエの世界で出てくる、アレフガルドという地名は
パッケージで説明されるけど、アとフが収録されてないせいでゲーム中では言及されない
ペアルックっぽいことに気が取られて内容が頭に入ってこない!
Zをパージしてしまうと Zamenhof の回が作れなくなってしまって困るのでは? > 水野さん
漢字は字体が問題になるけれど、実はアルファベットにも字体の違いがあってこちらはグリフ(?)の違いとして扱われていますね。小文字aに角のあるものとないもの、gがめがねのレンズ2つになっているのと、1つのもの…。
漢字の書体字典なんかみると、同じ漢字なのに少しずつ異なるものがいくつも並んでいます。時代や地域あるいは人によって形が異なっていたのでしょう。康煕字典で字体を統一したことがあったようですが、これは印刷用に造られた字体に思います。書道やってる人は気づくと思うけれど、筆で書くときは少し変わった形なることがありますね。
しんにょうが1点か2点で意味が変わることはないので同じ字としてもいいと思うのですが、漢字の簡略化なんかの歴史が関係してきて基準を決めにくいのでしょうね。
面白かったです
データベースの回で、「朝涼」とかの項目名をすべて番号づけるための表を別で作って、本体の表には番号の数字しかないっていう状態が、今考えると文字コードに似ているな、と。
文字コードって昔からいろんな種類があった。
半角
BCDコード→ASCIIコード(Unix、PC)
→EBCDICコード(IBMなどのメインフレーム)
全角(日本語独自規格)
ASCII系→Shift-JIS(PC)、EUC(Unix)
EBCDIC系→IBM漢字、JEF(富士通)
世界共通
UTF-8
異なる文字コードの場合は必ず文字変換を行い、変換不能な文字コードがあると文字化けします。そもそも文字コードを間違えてファイルを開くと文字化けしまう。
初期の頃のメールで半角カタカナが文字化けしたのは、PC側がShift-JISでメールサーバがEUCだったためで、Shift-JISは半角カタカナを1バイトで割り当てているのに、EUCでは半角カタカナが2バイトで割り当てられていました。今はメールサーバがUTF-8なので、Windows側がShift-JISでも半角カタカナの文字化けはなくなりました。
文字コードの中には改行コードもあります。OSによって改行コードも変わるので、エンジニアをしているとトラブル対応の際に改行コードも意識します。
昔の半角カタカナ等の文字化けは、iso-2022-jp (いわゆるJISコード)で送ると宣言していながらそれに定義されていない文字を使うからで…
最近はメーラーのデフォがUTF-8だから化けてないけど、iso-2022-jpで送れば化ける可能性があります。
最近知った、洗浄は洗滌と書いてで"せんでき"と読んだけど"せんじょう"と読まれる事が多く滌が常用漢字に入らなかったため、洗浄と書かれるようになったとか
漏洩はもともと、ろうせつと読むけど曳の"えい"にひっぱられてろうえいと読むとか
は関係ないですね
文字コードのISOもカメラのISOもディスクイメージのISOもキーボードのISOも会社が掲げてるISO14001?とかも全部 国際標準化機構ですよー。
弁のほかにも芸とかも合流してますね
繧繝は繧繝模様、畳の繧繝縁の時しか使わない気がします。暈繝でもよいはずです。
「押ささる」は便利
昔のPCは第二水準漢字ROMが別売りとかあったな。懐かしい話だ。
通販での贈答品の熨斗を作る仕事をしたことがあって、コードにない特殊字を手書き(絵)として数種類、その個別のPCのみに覚えさせて印字できるようにしてたのを思い出しました。今だと1字だけオリジナルフォントを作る感じでしょうか。あと「辻」も悩まされました。お客様に手書きで文字を書いていただくのですが、点一個なのかどうなのかとか、そもそもお客様が違いを認識しておられない場合どうするのか?とか勝手に変えてしまってクレームになるとマジでややこしいので。。。渡「辺」もや「斉」藤もややこしいですがこちらはお客様自身が文字の違いを理解してる場合が多いのでまだマシでした。
辻とか樋口の「樋」は、戸籍上明確に別字と扱われ、圧倒的に一点之繞の方が多いと思われますが、これを電子媒体で表示できない(CSSでfont-variant-east-asian:jis90;を指定してやればWEB上の表示はできますが)のは、非常に問題だと思います。斉藤の「斉」渡辺の「辺」は、非常に多くの字体が別字として扱われることに比べると非常に不合理を感じます。
IVSの異体字セレクタU+E0100〜U+E01EFを使いましょう
@@早川眠人さんありがとうございます。いろんなサイトで調べてみましたが、なかなか難しそうです。使い方をやさしく解説したページをご存じでしょたらお教えください。
@@yt-system1372
「IMEパッドで異体字セレクタを利用する」でggr
文字コードは文字の話なだけあって、水野さんの引き出しが多いですねえ
地元の新潟では「タオルなど長めの布などの先端が、地面に引きずられている」という現象を【しびいている】と言っていました。
標準語にはこの言葉が存在しなくて困る
ポケモンの細長い電気タイプのシビ◯◯ってそれもかかってそうだな
13とBの話はハガレンで似たような話を扱った回があったな。
軍の倉庫で存在しない13番倉庫が現れる噂があったけど、Bがデザイン上、1と3に見えただけだってやつ
ドラクエの話題で言うと後発のRPGである桃太郎伝説は「きんぎんパールプレゼントのオニ」というギャグキャラを出したいが為に容量が倍になったという逸話があります。
8:26
葛の下の方の形違うのは、旧字体・新字体じゃなくて異体字じゃなかったっけ…?
24:22 アフォーダンス九大プレ模試で出た‼️一般語彙とは言わせない‼️
「おささる」についてですが、積読チャンネルでチャン(堀本)さんが紹介されていたテッドチャンの小説、予期される未来に出てくるランプが光ったら1秒後に必ずボタンを押してしまう玩具に当てはまりますね。
でも現実で自分の意思とは関係なく行動してしまうことって?と思うので、道民の方はどういうシュチュエーションでこの言葉を使うのかすごく気になります。
13:12 なんだその認識あったのかという驚き
中国では「¥」は人民元を表します。中国出張後の旅費清算では注意が必要です。
RMBやJPYで明示しましょう
私の年収は¥100万しかありません。
文字コードのドタバタと言えば、ユニコードのハングル大移動だな。
ドラクエの容量削減の逸話だと、「ダースドラゴン」の一件があります。
本当は「ダークドラゴン」としたかったところ、容量削減のために、ストーリー進行に問題がない、片仮名の「ク」を削除したらしいです。
中国語学べばこのチャンネルの考察の深さ10倍深くなりそう、と弁の話面白がりながら思った
28:18 スペルチェックは含まれますかね?
ドラクエはカタカナ無いかと思ってたが、確かに呪文はカタカナか
13とBを同一にみなすのは恐らく1337表記の話から派生してますね...
13:20
大丈夫です。私も同族です。
Bと13は金田一かコナンかぬ~べ~で見たことある気がする。
北海道、東北方言の「〜ささる」は大変面白いので是非それで一回やってみてほしいです。文法的には中動態、古典文法における自発の「る、らる」に由来するものだと個人的に推測しています。言語の伝播が同心円状に伝わるということからすると、例えば沖縄にも同じような表現が残っていたりしないでしょうかね
19:48 実は中国元も円マークです。
同じような色の服を着ているせいで二人がペアルックに見えて気になって仕方がないw