文字コードを深掘りする。文字化けはなぜ起こるのか?【文字コード1】#92

Поділитися
Вставка
  • Опубліковано 25 лис 2024

КОМЕНТАРІ • 294

  • @yurucom
    @yurucom  Рік тому +18

    【参考文献】
    ◯プログラマのための文字コード技術入門
    amzn.to/46c6jqf
    ◯「カタカナは20文字だけ」「没アイテムで宝箱がカラッポに」 ファミコンハードの限界に挑んだ制作者たち ねとらぼあ
    nlab.itmedia.co.jp/nl/articles/1801/07/news008.html
    【サポーターコミュニティ加入はこちらから】
    yurugengo.com/support
    【おたよりフォーム】
    forms.gle/BLEZpLcdEPmoZTH4A
    ※皆様からの楽しいおたよりをお待ちしています!

  • @ihatovoihatovo1732
    @ihatovoihatovo1732 Рік тому +132

    以前、吐噶喇列島の島に住んでいました。住居表示は鹿児島県鹿児島郡十島村〇〇島〇〇番地 となっていました。

  • @mudaso-heavy-user
    @mudaso-heavy-user Рік тому +182

    言語沼の件あってのこのシリーズ、エモい

  • @Fnak202
    @Fnak202 Рік тому +107

    初代ドラクエで採用されたカタカナは 20 文字+「ド」の 21 種類で、「リ」「ヘ」は平仮名で代用するため、収録文字数は 19 文字となっています。
    ちなみに、その 20 文字の中に「ク」は入っていません。(物語中に「クエスト」という単語は出てこない。)
    有名な話では、「ダースドラゴン」というモンスターは、アイデア段階では「ダークドラゴン」という名前だったというのがあります。
    また、水野さんが仰っていた呪文「メラ」はスタメン張っていたという話ですが、実は初代ドラクエに「メラ」は登場していません。
    初代ドラクエに登場した攻撃呪文は「ギラ」「ベギラマ」の 2 種類だけで、「メラ」が初登場したのはⅢですね。

    • @subratte256
      @subratte256 Рік тому

      また初代ポケモンでは「り」「へ」以外のひらがな・カタカナと「゛」「゜」「…」「ど」「ィ」「円」「!」「?」「 」とプログラムの仕様で生まれた終端文字なるもの(透明)、0~9、A~G辺りまでのアルファベット(背景のチップとして使用していたりもする)で256文字分(1文字当たり1byte)になっていたりします。よくバグらせると゛だらけになったりアネ゛デパミ゛みたいた名前が生まれたりするのもプログラムで「が」や「ぱ」を疑似的に再現していたからこそ生まれていたりしていると考えられます。(「と」の上に「゛」をつける普通バージョンだと上のポケモンのステータスなどの表示に影響が出るため?「ど」は1byteの大きさに収めるための文字でポケモンのステータス画面でのみ見られます。)

  • @TonyStark_85
    @TonyStark_85 Рік тому +88

    5:54 「ぬるぬる」なんて頻繁に言わないと言ったすぐあとに「ぬるっとしちゃう」が堀元さんの口から発されている

  • @184a-xx8km
    @184a-xx8km Рік тому +50

    15:30
    ポケモンはバーチャルコンソールも含めるとと全シリーズから最新作にポケモンを移送できるんだけど、
    GBは「ヘ」の平仮名とカタカナの文字コードが同じで、移送するときに他の文字で判断して文字コードを平仮名かカタカナどっちかに変換する機能がついてたりするらしい。
    ポケモンっていうゲームだけ容量が少なかった時代の遺産がまだ残ってるんだよね

  • @magical_hippopotamus
    @magical_hippopotamus Рік тому +94

    「ほっけ」を漢字で表すと魚編に花で「𩸽」なのですが、これはサロゲートペアといってUnicodeの中でも1文字16bitに収まらなくて拡張された少し特殊な字の1つです。扱いに注意が必要と言われていました。
    文字コード回でほっけのTシャツを着てくる堀元さん、流石ですね。

    • @taturou
      @taturou Рік тому

      サロゲートペアを処理するコード書いたことありますが、あれはイヤだった。UTF8が発見されて良かったです。日本語は3バイトになりがちでムカつくけど。

  • @koi506
    @koi506 Рік тому +42

    昔、フォント作成PJに関わったことがあります。
    文字コードは設定されてても第1水準から作っていくので、最初は無い無い尽くし。
    第2、第3と進むとだいぶスレてきて高頻度を優先的に作る方式になりました。

  • @nanoriKYDO
    @nanoriKYDO Рік тому +48

    繧繝 同じ色を濃から淡へ、淡から濃へと層をなすように繰り返す彩色法(デジタル大辞泉より)
    初期のDQでは「モンスター」が使えない(「モ」が無い)ので「まもの」と表記したとか

  • @sabak7390
    @sabak7390 Рік тому +39

    弁が3つの文字が合流していたのは初耳。ぜんぶ「弁える」の意味だと思ってた。
    智弁和歌山の弁はもとは辯で、弁護士や弁論と同じ源だったんですね。
    久しぶりに面白かった脱線話でした。

  • @yu100nabeyan
    @yu100nabeyan Рік тому +21

    2人とも緑Tシャツお揃でかわいい

  • @kirirei_sliyou
    @kirirei_sliyou Рік тому +30

    ドラクエ1の攻撃呪文はギラとベギラマしかないです(キメラがいるのでメラは出せるけど)
    「ダークドラゴン」というモンスターを実装しようとしたところ、「ク」が使えなかったので「ダースドラゴン」という謎の名前になったそうです。
    なぜかドラクエ3になって「ク」が使えるようになったあとも「ダースリカント」という新モンスターが登場したので、「ダース」という架空の形容詞を冠したモンスターは2体います。

  • @nandemotsukuruyo
    @nandemotsukuruyo Рік тому +26

    14:55
    ちなみに「ク」も「エ」も未収録なのでゲーム会話中では「ドラゴンくえすと」と表示されます。

  • @ポメ西
    @ポメ西 Рік тому +81

    ドレミの歌以外で
    「『喇』は『喇叭』の『喇』」って言うことあるんだ

  • @thesaito2721
    @thesaito2721 Рік тому +41

    コナンくん「札幌に住んでるのに円山動物園ではなくてわざわざ旭山動物園…? 妙だな…」

  • @squandered3589
    @squandered3589 Рік тому +20

    「円マーク円以外に使わんしね」
    元も同じ記号ですね。海外通販で円表記だと思って買ったら元だった、
    といったケースがあり、問題になっています。

  • @kiji-siro
    @kiji-siro Рік тому +27

    パソコンで文字を入力していると文字コードにに入ってない文字が〓(下駄記号)になって出てくることがあります。これは活版印刷の時、必要な活字がないとき不要の活字を上下さかさまにして仮置きし、その底面がゲラ刷りしたとき〓に見えたので、〓が文字コードに存在しない文字の代替文字になった。ちなみにこれを「下駄を履かせる」というそうです。

  • @チキン南蛮-r4p
    @チキン南蛮-r4p Рік тому +8

    瓣(花弁・安全弁)と辯(雄弁・大阪弁)は分かりやすいけど
    正しいか否か分ける/弁えるを意味する辨(弁別・勘弁)に該当する漢字だけ
    区別するのかなり難しくね?
    弁当は物理的な境や蓋なので瓣かと思いきや辨だし
    弁証法・弁護士・弁舌・弁論・弁説・詭弁・弁解・弁明
    は一見全部コトバ関係なのに最初と最後だけ辨で違う。
    さらに弁理士や弁償するの弁は
    辨(わきまえるの意)ですらなく4文字目の辦(処理するの意)
    そしてダメ押しのように5文字目の辮(編むの意、弁髪)まである。
    一周まわって一緒にしてくれた先人に感謝かもしれん、
    全部バラバラのままだったらきっと自分は発狂してた…

    • @Konata_Love17
      @Konata_Love17 Місяць тому +1

      流石にそこまで深い話は出来なかったか…

  • @doridoriization
    @doridoriization Рік тому +88

    難読語の漢字は書けるがその意味を知らない水野氏と漢字を図形と認識するもその違いが曖昧な堀元氏。よいコンビである。

  • @Irix.5674
    @Irix.5674 Рік тому +13

    自分も違いをちゃんとは理解していないから説明ができないんだけど
    文字コードとエンコードは別物なのに混同されて一緒くたに
    扱われることが非常に多い。
    UTF-8 や Shift_JIS はエンコードで正確には文字コードではない。
    UTF-8 は文字コードである Unicode のエンコード方式のひとつ、
    Shift_JIS は文字コードである JIS コードのエンコード方式の
    ひとつです。

  • @mudaso-heavy-user
    @mudaso-heavy-user Рік тому +34

    ドラクエの話だと、ダークドラゴンを出そうとしたけど容量的にカタカナのクが使えないからダースドラゴンになったって話があった気がする

    • @masuo64
      @masuo64 Рік тому +7

      むだそすん!

    • @mudaso-heavy-user
      @mudaso-heavy-user Рік тому +3

      @@masuo64 カタカナの話ね、ひらがなは使えるんやでwww

  • @xitianzhenwu6756
    @xitianzhenwu6756 Рік тому +27

    外来語の音訳であることを示すために、口偏を使ってたので、トカラ(奄美地方の言葉が由来)に漢字を当てる際に、音を表す声符に口偏を付けて吐噶喇となっています
    喇叭も同様

  • @nanaki1006
    @nanaki1006 Рік тому +16

    繧繝(うんげん)、後学のために調べてみました。雛人形の載ってる畳の縁に付いてるカラフルな模様のあれ。

  • @Konata_Love17
    @Konata_Love17 Місяць тому +1

    2人とも想像が膨らみすぎて色々話が脱線するの好き

  • @mudaso-heavy-user
    @mudaso-heavy-user Рік тому +14

    楽しみに待ってました

  • @りゅう-g1e
    @りゅう-g1e Рік тому +18

    ドラクエの「ク」は初代には無い文字で、ダークドラゴンをダースドラゴンとして登場させたのは有名な話ですね。

  • @koolongkoolong
    @koolongkoolong Рік тому +62

    水野さんは文字コードを文字化けの原因として認識しているし、横隔膜はしゃっくりの原因として認識している

    • @haine102
      @haine102 Рік тому +6

      ただし、横隔膜がどこにあるかわからないし、しゃっくりのメカニズムもわからない。

  • @じゅっぱ-v4j
    @じゅっぱ-v4j Рік тому +37

    幽霊文字の回楽しみすぎる…。漢字字典(≠漢和辞典)読んでると定期的に語義未詳の字が出るし、それがUnicodeとかでも起きるのは結構自然な結果でもあるよなぁ。幽霊文字クリシェはきっと折り目が線に見えた妛とか誰もミスの原因をしらないという彁とかかな?

    • @人生パラドックス
      @人生パラドックス Рік тому +4

      Unicodeは、2バイトコードと4バイトコードがある。
      アラビア文字は、4バイトコードで表現し、日本語は、2バイトコードで表現している。

    • @kumamushi3
      @kumamushi3 Рік тому +1

      予想通りでしたね!

  • @tenrai3065
    @tenrai3065 Рік тому +17

    半角カナの呪縛とか、EBCDICやEUCとか、shift-JISはなんでシフトなのかとか、コードページってなにとか、最初の文字コードは5ビットだから32文字だぜとか、超漢字ってあったよねぇとか、文字コードのネタはそれだけでチャネル作れるほどありそうです。

    • @Q0rx5kn5oSE
      @Q0rx5kn5oSE Рік тому +3

      ゆる文字コード学ラジオ待ったなし

  • @ファタス
    @ファタス Рік тому +12

    Bと13では、鋼の錬金術師のお話に、存在しないはずの13号倉庫がある!?→昼見に行ったら実際はB倉庫でペイントされたBが1と3の組合せみたいなフォントで夜暗かったせいもあって、13号と勘違いしたってオチの話があったはず

    • @senkobayashi1307
      @senkobayashi1307 Рік тому +4

      ありましたね、単行本のおまけに入っていた気がします

  • @koi506
    @koi506 Рік тому +10

    文字コードが同一でもフォントによって文字が違うことはあり得ます。
    主流のアウトラインフォントではあまり見られませんが、ビットマップフォントではあえて嘘字を作成することがあります。
    ドット数の限界を超えた画数に対応できず、見た印象で漢字を識別するという区別のしかたをしてもらうためです。「感字」と呼んでいました。
    旧字でも新字でもない「そのフォント以外無い漢字」を表示するので、字を調べる用途では注意が必要です。

  • @fx-702p
    @fx-702p Рік тому +10

    「包摂基準」は「包摂規準」と書くべき、みたいな話をJIS漢字の委員会の人が言ってた気がするんだけど、ずっと混用されて続けてる(総務省や法務省も基準を使ってる)。

  • @JackieMatthews610318
    @JackieMatthews610318 Рік тому +1

    32:29 今、堀元氏と全く同じ反応してから、1933(昭和8)年に弁理士資格取った父が言ってたことを思い出した。当時ガキンチョだった私には何のことやらさっぱりわからんかった。「弁理士とはな、弁護士と違って『ことわり(理)をわきまえる(弁=辨!)』仕事なんだ」…その後「弁護士は喋るばっかり」とか謎のdisりをしていたのも「辯」からだったのか…と、多分半世紀弱ぐらいで初めて納得しました‼️
    ちなみに父、早稲田大学政治経済学部卒。ソニーの創業者、伊深大氏と同窓だったとよく自慢しておりました。

  • @和歌山みかん-z7p
    @和歌山みかん-z7p Рік тому +35

    ISO感度はISOの初期の規格であるISO100に基づく規格なので関係あります

  • @PhodraX4
    @PhodraX4 Рік тому +10

    10:35 吐噶喇の喇を説明するのに喇叭を例示してるのに喇叭の喇を説明するのに吐噶喇の喇って言っちゃうの実に水野さん

    • @Aros417
      @Aros417 Рік тому

      循環参照だ

  • @たらんぽす
    @たらんぽす Рік тому +2

    毎回堀元さんの「○○さる」がそれで合ってるか...?ってなっちゃう...
    人に説明する時は
    「○○さる=○○できる」
    or
    「自分の意思・行動とは反して起きてしまうこと、自分が無関係なことを言いたい」と言ってます。(これで合ってるか分かりませんが)
    「コントローラー握った時にボタン押ささっちゃってさ〜」
    だと
    「コントローラーを握った時に、(押すという意思は無かったが結果)押してしまった」
    的な感じになります。
    よく使うのは「書かさる(さらない)」
    「このペン書かさんないなと思ってたけど、紙にグリグリやってたら書かさったよ」

    「このペン(自分の行動とは関係なく)書くことができない状態だったが、紙にグリグリしてたら書けるようになった」
    「○○さる(さらない)」は自分の行動と関係なく最終的に起こったことを言っている感じがするので視点?が自分ではなく物にあるのかなあ?という感じがします(学がないのでこれで正しいか分かりませんが)。
    「洗濯機に服入れる前にボタン押ささった」
    だと、気付かずに押したわけではないんだなという感じがします。逆に
    「洗濯機のボタン押ささんないな」
    だと実際にはポチポチ押しているんだなという感じがします。

  • @ellnore_pad
    @ellnore_pad 11 місяців тому

    北海道出身にして現役プログラマーである俺得回。
    そして、お二人の切り口が自分にはない視点からの切り口で、国際通貨某のワイルドカード的な記号に対して「単語と同じだね」って言う話に繋がったのが凄く面白くて新鮮だった。
    ちなみに「おささる」とか「おささっちゃう」はある程度否定的なニュアンスというか、不都合であるみたいな意味合いが含まれてることが多く、
    「押すつもりはないのに(構造上の欠陥とかで)意図せず押してしまう」みたいな時に「(押そうとしてないのに)押ささっちゃうんだよこれー!!」とか言いますね。

  • @yoshi46-319
    @yoshi46-319 Рік тому +14

    文字コード制限で、いまも影響が残っているのは円記号とバックスラッシュの問題ですね。windowsのフォルダの区切りが円マークなのは見にくいと個人的には思います。ちょっと話は違いますが、波ダッシュも話がややこしいですね~。

    • @ぱわふる-e6z
      @ぱわふる-e6z Рік тому

      アスキーアートをロゴにしてるツールとかも、ロゴが円マークだらけになって悲しくなるよね

    • @masuo64
      @masuo64 Рік тому

      波ダッシュ、win7だかwin8で打たれたテキストだと、未だに変なフォントになるのに、打った本人は気づいてないんですよね。

  • @TokumeiResearch200X
    @TokumeiResearch200X Рік тому +3

    最近はsjis(≒ms932)とUTF-8とUTF-8(BOM)くらいを気にすれば良いけど、古いものだとEUC-JPとか気にしたりしてましたね
    あと文字コードのこと調べてると英語圏の人が文字コードの事なんも考えてないんだろうなと思うことがよくある

  • @KIKKOMANamawa
    @KIKKOMANamawa Рік тому +5

    以前コンビニでバイトをしていた時、住所の代筆を頼まれたのですが
    「岐阜県揖斐郡」って普段書かない漢字ばかりで手に汗握った思い出があります

  • @よしだ-g8v
    @よしだ-g8v Рік тому +2

    5:58
    「ぬ」要らない言うてたのにぬるっとしちゃう堀元さん

  • @furusatonotkokyou
    @furusatonotkokyou Рік тому +5

    30:11
    常用漢字の中でも、後から追加された「遡」とかは常用漢字でも点2個ですね

  • @Bisco-le1rt
    @Bisco-le1rt Рік тому +10

    ダルい駄菓子屋のおばちゃん「はい、じゃあおつり30万¤!」

  • @田中舘
    @田中舘 10 місяців тому +1

    自分は青森出身で「〜〜ささる」を「〜〜しようとしていなかったはずが、なぜか〜〜してしまう」という意で使用ささるのですが、これは「〜〜を自然にしてしまう」の応用と考えました。

  • @やまけん-x1n
    @やまけん-x1n Рік тому +4

    トカラ列島は十島村ですね。
    日本で1番長い市町村だったり、日本で唯一領域外に役場あがある市町村だったりと雑学に事欠かない土地です。

    • @やまけん-x1n
      @やまけん-x1n Рік тому +1

      領域外に役場がある市町村は他にもあった・・・

  • @maruneko35
    @maruneko35 Рік тому +3

    待ってました。絵文字や異体字セレクタのややこしい話が出てくることに期待。

  • @あるテューバ吹き
    @あるテューバ吹き Рік тому +7

    𦚰(肉月に刀三つ)を脇(肉月に力三つ)と間違われるとご先祖様に申し訳なくなるので本当につらかったけどJISレベル4で収録されて歓喜したことは懐かしい。

  • @hykathon
    @hykathon Рік тому

    33:25 サロゲートペアの話への布石ですね。
    こういう伏線を見つけるとワクワクしますね!!

  • @ツグミヤトラ
    @ツグミヤトラ Рік тому +9

    祖母が祖父のことを「お父さん」と呼ぶのを「じいちゃん」でしょ!って訂正してたのを思い出した

  • @----___----___----___----___--
    @----___----___----___----___-- Рік тому +13

    International Organization for Standardization の略ならIOSやろがいと思ってググったら
    明確な由来がなく、私が世界統一した際は滅ぼそうと決めた

    • @francescogatti3002
      @francescogatti3002 Рік тому +2

      iOSが世界を席巻すると未来予知したのかもしれない。

  • @takpon9261
    @takpon9261 Рік тому

    これ期待してた、超待ってた

  • @tenkawakiirobou
    @tenkawakiirobou Рік тому

    やっと来た!楽しみに待ってました

  • @jyozu
    @jyozu Рік тому +4

    ファミコンが若い人にも知られていたら、導入で伝えようとしていた
    収録できている文字のイメージがつきやすいんですけどねぇ。

  • @tatsutakaraage2662
    @tatsutakaraage2662 Рік тому +16

    6:00 あーここほんと面白いw
    コンビ芸なんよw 円熟味増してるわーw

  • @24852
    @24852 Рік тому +14

    私の年収は¤0です。
    これでうまく誤魔化せたな。

  • @ameatokua
    @ameatokua Рік тому +5

    ゆる言語学ラジオの内容が入ります。 27:1033:49
    水野さんの話が面白いので、聞き入りますね。

  • @bicks123
    @bicks123 Рік тому +3

    昔QuizKnockのチャンネルで、「東大生なら文字化けしてても読める」ってやってましたね。

  • @atsushigrizlupo8479
    @atsushigrizlupo8479 Рік тому +1

    「この文字とこの文字は同じである」と判断する仕事は本当に面倒です。
    「これはデザイン差なので同定してよい」とかいう言葉が飛び交います。
    ちなみに総務省の包摂基準はけっこう緩いです。

  • @halyur33
    @halyur33 Рік тому +2

    このチャンネルでプロジェクトヘイルメアリーに出会い、火星の人を絶賛読書中の私には文字コードの話題はめちゃめちゃタイムリーです
    ちなみに道民ですが、【押ささる】は
    ・つい押したくなってしまう
    よりもどちらかというと
    ・(誤って手が触れて)押してしまう
    の方がニュアンスちかいかな~と思ってます

  • @roadevery9434
    @roadevery9434 Рік тому +4

    さらに合流した弁の字は元々は違う字としてあったと言う話もありますね

  • @gorotlavis2495
    @gorotlavis2495 3 місяці тому +1

    Bと13のくだりはアニメ版のハガレンの怪談話回で見たことありますね

  • @メタ物
    @メタ物 Рік тому +8

    文字コードにないエピソードで、声優の朴璐美さんの璐が出せないから王路で代替しているのをよく見かける。

    • @passute
      @passute Рік тому

      野球好きなら
      李承燁の火へんに華とか
      李机浩の木へんに凡とか
      そういう話かな

    • @_tatibana1243
      @_tatibana1243 Рік тому

      鬼滅の刃のネズコも字が出せなくて代替しているのを見ましたね。
      鬼滅ファンから誤字として指摘を受けるのか。名前が出る全ページに※で注釈が付いていた

  • @haine102
    @haine102 Рік тому

    「ぬるぬるとか言えなくて良い」の後にさっそく「ぬるっと」って言い出しちゃう堀元さん。

  • @murayan68k
    @murayan68k Рік тому +6

    ドルとポンドは当時から基軸通貨としての立ち位置があったので独立させたほうが都合良かったとかじゃないのかな

    • @francescogatti3002
      @francescogatti3002 Рік тому +1

      その理屈だと円も必要やろ!ってなりそうな。円も強かったんやで、今じゃ考えられんが。

    • @ねじまきどり
      @ねじまきどり Рік тому

      ASCIIが制定されたのは1963年、
      そのISO版が数年後くらいじゃなかったっけ。
      まだ円が強い時代じゃなかったよ。
      JISコードだと0x5Cに\の代わりに¥が
      割り当てられていていろいろ不便だった。

  • @ぽいむぽいむぴぴむ
    @ぽいむぽいむぴぴむ Рік тому +2

    弁当の弁は「配膳する」から分けるの意味の「辨」みたいですね。

  • @tambaren
    @tambaren Рік тому +2

    ドラクエの世界で出てくる、アレフガルドという地名は
    パッケージで説明されるけど、アとフが収録されてないせいでゲーム中では言及されない

  • @shindy_jp
    @shindy_jp Рік тому +2

    ペアルックっぽいことに気が取られて内容が頭に入ってこない!

  • @tatsuaki.takahashi
    @tatsuaki.takahashi Рік тому +3

    Zをパージしてしまうと Zamenhof の回が作れなくなってしまって困るのでは? > 水野さん

  • @moonsnowknight
    @moonsnowknight 5 місяців тому

    漢字は字体が問題になるけれど、実はアルファベットにも字体の違いがあってこちらはグリフ(?)の違いとして扱われていますね。小文字aに角のあるものとないもの、gがめがねのレンズ2つになっているのと、1つのもの…。
    漢字の書体字典なんかみると、同じ漢字なのに少しずつ異なるものがいくつも並んでいます。時代や地域あるいは人によって形が異なっていたのでしょう。康煕字典で字体を統一したことがあったようですが、これは印刷用に造られた字体に思います。書道やってる人は気づくと思うけれど、筆で書くときは少し変わった形なることがありますね。
    しんにょうが1点か2点で意味が変わることはないので同じ字としてもいいと思うのですが、漢字の簡略化なんかの歴史が関係してきて基準を決めにくいのでしょうね。

  • @sissie6843
    @sissie6843 Рік тому

    面白かったです

  • @zr258
    @zr258 Рік тому +2

    データベースの回で、「朝涼」とかの項目名をすべて番号づけるための表を別で作って、本体の表には番号の数字しかないっていう状態が、今考えると文字コードに似ているな、と。

  • @h.t3996
    @h.t3996 Рік тому +1

    文字コードって昔からいろんな種類があった。
    半角
     BCDコード→ASCIIコード(Unix、PC)
          →EBCDICコード(IBMなどのメインフレーム)
    全角(日本語独自規格)
     ASCII系→Shift-JIS(PC)、EUC(Unix)
     EBCDIC系→IBM漢字、JEF(富士通)
    世界共通
     UTF-8
    異なる文字コードの場合は必ず文字変換を行い、変換不能な文字コードがあると文字化けします。そもそも文字コードを間違えてファイルを開くと文字化けしまう。
    初期の頃のメールで半角カタカナが文字化けしたのは、PC側がShift-JISでメールサーバがEUCだったためで、Shift-JISは半角カタカナを1バイトで割り当てているのに、EUCでは半角カタカナが2バイトで割り当てられていました。今はメールサーバがUTF-8なので、Windows側がShift-JISでも半角カタカナの文字化けはなくなりました。
    文字コードの中には改行コードもあります。OSによって改行コードも変わるので、エンジニアをしているとトラブル対応の際に改行コードも意識します。

    • @michihirokabata2519
      @michihirokabata2519 11 місяців тому

      昔の半角カタカナ等の文字化けは、iso-2022-jp (いわゆるJISコード)で送ると宣言していながらそれに定義されていない文字を使うからで…
      最近はメーラーのデフォがUTF-8だから化けてないけど、iso-2022-jpで送れば化ける可能性があります。

  • @pozo20
    @pozo20 Рік тому +4

    最近知った、洗浄は洗滌と書いてで"せんでき"と読んだけど"せんじょう"と読まれる事が多く滌が常用漢字に入らなかったため、洗浄と書かれるようになったとか
    漏洩はもともと、ろうせつと読むけど曳の"えい"にひっぱられてろうえいと読むとか
    は関係ないですね

  • @HashimotoHobbyCh
    @HashimotoHobbyCh Рік тому

    文字コードのISOもカメラのISOもディスクイメージのISOもキーボードのISOも会社が掲げてるISO14001?とかも全部 国際標準化機構ですよー。

  • @keisukesugi5085
    @keisukesugi5085 Рік тому +1

    弁のほかにも芸とかも合流してますね

  • @クララ-d2k
    @クララ-d2k 3 місяці тому

    繧繝は繧繝模様、畳の繧繝縁の時しか使わない気がします。暈繝でもよいはずです。

  • @Twilingal
    @Twilingal Рік тому +1

    「押ささる」は便利

  • @呉羽誠司-l6b
    @呉羽誠司-l6b Рік тому +1

    昔のPCは第二水準漢字ROMが別売りとかあったな。懐かしい話だ。

  • @いあ158
    @いあ158 2 місяці тому

    通販での贈答品の熨斗を作る仕事をしたことがあって、コードにない特殊字を手書き(絵)として数種類、その個別のPCのみに覚えさせて印字できるようにしてたのを思い出しました。今だと1字だけオリジナルフォントを作る感じでしょうか。あと「辻」も悩まされました。お客様に手書きで文字を書いていただくのですが、点一個なのかどうなのかとか、そもそもお客様が違いを認識しておられない場合どうするのか?とか勝手に変えてしまってクレームになるとマジでややこしいので。。。渡「辺」もや「斉」藤もややこしいですがこちらはお客様自身が文字の違いを理解してる場合が多いのでまだマシでした。

  • @yt-system1372
    @yt-system1372 Рік тому +3

    辻とか樋口の「樋」は、戸籍上明確に別字と扱われ、圧倒的に一点之繞の方が多いと思われますが、これを電子媒体で表示できない(CSSでfont-variant-east-asian:jis90;を指定してやればWEB上の表示はできますが)のは、非常に問題だと思います。斉藤の「斉」渡辺の「辺」は、非常に多くの字体が別字として扱われることに比べると非常に不合理を感じます。

    • @早川眠人
      @早川眠人 Рік тому +2

      IVSの異体字セレクタU+E0100〜U+E01EFを使いましょう

    • @yt-system1372
      @yt-system1372 Рік тому

      @@早川眠人さんありがとうございます。いろんなサイトで調べてみましたが、なかなか難しそうです。使い方をやさしく解説したページをご存じでしょたらお教えください。

    • @早川眠人
      @早川眠人 Рік тому

      @@yt-system1372
      「IMEパッドで異体字セレクタを利用する」でggr

  • @じーちゃん-f1e
    @じーちゃん-f1e Рік тому

    文字コードは文字の話なだけあって、水野さんの引き出しが多いですねえ

  • @HigashiJuicy
    @HigashiJuicy Рік тому +2

    地元の新潟では「タオルなど長めの布などの先端が、地面に引きずられている」という現象を【しびいている】と言っていました。
    標準語にはこの言葉が存在しなくて困る

    • @haine102
      @haine102 Рік тому

      ポケモンの細長い電気タイプのシビ◯◯ってそれもかかってそうだな

  • @his58enc8odk310
    @his58enc8odk310 10 місяців тому

    13とBの話はハガレンで似たような話を扱った回があったな。
    軍の倉庫で存在しない13番倉庫が現れる噂があったけど、Bがデザイン上、1と3に見えただけだってやつ

  • @ツチノコ情報館
    @ツチノコ情報館 2 місяці тому

    ドラクエの話題で言うと後発のRPGである桃太郎伝説は「きんぎんパールプレゼントのオニ」というギャグキャラを出したいが為に容量が倍になったという逸話があります。

  • @furusatonotkokyou
    @furusatonotkokyou Рік тому +2

    8:26
    葛の下の方の形違うのは、旧字体・新字体じゃなくて異体字じゃなかったっけ…?

  • @canon1729
    @canon1729 4 місяці тому +1

    24:22 アフォーダンス九大プレ模試で出た‼️一般語彙とは言わせない‼️

  • @ねこ-x3j
    @ねこ-x3j 9 місяців тому

    「おささる」についてですが、積読チャンネルでチャン(堀本)さんが紹介されていたテッドチャンの小説、予期される未来に出てくるランプが光ったら1秒後に必ずボタンを押してしまう玩具に当てはまりますね。
    でも現実で自分の意思とは関係なく行動してしまうことって?と思うので、道民の方はどういうシュチュエーションでこの言葉を使うのかすごく気になります。

  • @user-pi1er7zx3m
    @user-pi1er7zx3m Рік тому

    13:12 なんだその認識あったのかという驚き

  • @火星の人-s2r
    @火星の人-s2r Рік тому +7

    中国では「¥」は人民元を表します。中国出張後の旅費清算では注意が必要です。

  • @Sola.No.17
    @Sola.No.17 Рік тому +3

    文字コードのドタバタと言えば、ユニコードのハングル大移動だな。

  • @ゆうた-m4e
    @ゆうた-m4e 4 місяці тому

    ドラクエの容量削減の逸話だと、「ダースドラゴン」の一件があります。
    本当は「ダークドラゴン」としたかったところ、容量削減のために、ストーリー進行に問題がない、片仮名の「ク」を削除したらしいです。

  • @gunhasirac
    @gunhasirac Рік тому

    中国語学べばこのチャンネルの考察の深さ10倍深くなりそう、と弁の話面白がりながら思った

  • @subratte256
    @subratte256 Рік тому

    28:18 スペルチェックは含まれますかね?

  • @100EIZO
    @100EIZO Рік тому +1

    ドラクエはカタカナ無いかと思ってたが、確かに呪文はカタカナか

  • @riorio1580
    @riorio1580 3 місяці тому

    13とBを同一にみなすのは恐らく1337表記の話から派生してますね...

  • @MAS256_konbu
    @MAS256_konbu Рік тому

    13:20
    大丈夫です。私も同族です。

  • @あるテューバ吹き
    @あるテューバ吹き Рік тому +2

    Bと13は金田一かコナンかぬ~べ~で見たことある気がする。

  • @guranora
    @guranora Рік тому

    北海道、東北方言の「〜ささる」は大変面白いので是非それで一回やってみてほしいです。文法的には中動態、古典文法における自発の「る、らる」に由来するものだと個人的に推測しています。言語の伝播が同心円状に伝わるということからすると、例えば沖縄にも同じような表現が残っていたりしないでしょうかね

  • @hy7207
    @hy7207 3 місяці тому +1

    19:48 実は中国元も円マークです。

  • @matano-0419
    @matano-0419 Рік тому +1

    同じような色の服を着ているせいで二人がペアルックに見えて気になって仕方がないw