Розмір відео: 1280 X 720853 X 480640 X 360
Показувати елементи керування програвачем
Автоматичне відтворення
Автоповтор
HTMLのエスケープで思い出すのが、湘南乃風『睡蓮花』の歌詞です。途中に何度か出てくる"
おもしろ😂
それ経験してみたかったなwwおもろすぎる
これほんますこ
「歌詞に『あ』が出たら10%速く歌っていく」やつみたいな感じ?
「WindowsがUnicodeを使うようになったのはつい最近」という発言、「OSのシステムは2023年現在もShift_JISを使用している。」という字幕、いずれも語弊があります。(後者は語弊というより誤解?)OS内部でUnicode(UTF-16)が使われるようになったのはWindows NT4.0の時代、1996年のことです。以降、2023年現在に至るまでファイルシステムNTFS含めて内部的にUTF-16が使用されています。2019年に起きたのは単に「メモ帳という1アプリケーションが扱う文字コードのデフォルトがUTF-8になった」というだけのことなので誤解なきよう。
コメントありがとうございます! こちらの動画の編集担当者です。テロップで補足するにあたり、「2019年に変更されたのはメモ帳アプリのデフォルト文字エンコードで、OSのシステムロケールは現在もShift_JISである」という情報を明記しようとしたのですが、私の理解が不十分でシステムロケールとOS内部での文字コードとを混同したままテロップを制作してしまい、おっしゃる通り不適切な記述になっていました。正確な情報を提供できず、誠に申し訳ない気持ちです。このたびは貴重なご指摘をいただき、ありがとうございました!
ゆるコンは補足回必ずいると思いますw堀元さんガバいんだもの…
フォントの話をしている時に「ほんと」と言いまくってるの、堀元さんに怒られそうwwwwというか実際に紛らわしい笑
ゆるコンピュータ科学ラジオ、量子コンピュータ回のLE0さんみたいに常に小窓にスミノさんが控えていてほしい気持ちがある。
めちゃくちゃわかります!スミノさん控えててくれたらものすごい安心感もって聞けますよね!!
ありがとうございます。僕は台本を脱線させまくるので呼ばれない気がします 笑そのかわり知見を求められれば協力しますよ。2000年問題のときのように。
@@smnky?はい?
ゆるコンの バックスラッシュの件、自分もモヤモヤしてました。スミノさんにちゃんと解説してもらえて良かったです。
コメントありがとうございます。いただいた反応の大きさから「モヤモヤしていたのは自分だけじゃなかっただな」と思いました。
海外インディーゲームやってると頻繁に中華フォントに遭遇するので本当に何とかしてほしいですね…英語圏の開発者向けに中華フォントについて説明している"Your Code Displays Japanese Wrong"というページもあるのでもっと広まってほしい
開発・修正コストと(日本人の)マーケットへの影響の小ささが問題なのでしょうね。そのへんの言語対応がもっと簡単にできるフレームワークが登場してほしいです。
音質も画質も良くて助かる😊
「新たな刺客 中華フォント化」というテロップ自体が中華フォント化してるの 芸が細かいですねしかし統合漢字の影響が ひらがなやカタカナにまで及んでる(ように見える)のはどういう理由なんだろう
鋭いです!多くの中華フォントは平仮名と片仮名を含んでいます。どちらも種類がすくないので、これを含めておくことにより中国人は自国のフォントのみで日本語コンテンツを表示できます(いわゆるトウフ■にならない)ただしあちらのデザイナーが作っているので字面のバランスが(日本人には)気持ち悪く感じます。よく通販などで買った海外製品の取説にある字体が不気味に感じるのはこのためです。
学徒の補強動画嬉しいです😊ゆるコン見るたびにスミノさんの顔がチラつきます😊昔の話題がでるたびにきっと何か言いたくなってそうだと思ってました😆
ご明察です。たまに別館内部のチャットでひっそりと補足をいれてます。今回はそれを拾ってくれたケイさんが動画化をすすめてくれて公開の流れになりました。
ゆるコンピュータ科学ラジオの知りたかった背景部分をかなり補足されててめちゃくちゃ聞いて良かった回でした。ベトナム語は現在ラテン文字を使ってますが、声調やベトナム語特有の音を表すために文中にたくさんダイアクリティカルマークを使うようになっていて、これはこれで大変だなと傍から見てて思います😅
ベトナムのアスキーコードvisciiは凄まじいからなあ。とにかく頑張って文字を詰め込んで割り当てた感がある。0x80以降だけではなく、 0x02 0x05 0x06 0x14 0x19 0x1E にも文字を割り当てているし。
声調を文字に反映する言語は大変ですよね。英語のようにダイアクリティカルマークを用いない言語は珍しい気がしますが、そういう点でもまさに計算機と相性の良い言語だと思います。
お二人の話、とても興味深かったです😊
わかりみが深すぎて、ほとんどのエピソードで己の若い頃の苦しい思い出が浮かび苦笑いしながら、先生の話をたのしませていただきました
だいぶ前ですが妖奇士(あやかしあやし)という漢字を武器にして戦うアニメがあった気がします!
WindowsがUTF-8に対応して一番最初に感じたのは「スマホ用の絵文字(Emoji)が直接キーボード打つだけで使える!」って点でしたね。それまではできなかったような気がします。
ヒエログリフの上位互換!!香港在住者ですが、公共の標識など漢字+英語の物を見掛ける度、「中国語の分からない非アジア圏出身の人には、半分の文字情報が全く無意味なのだなぁ」と感じて、日本語使用者の利点をしみじみ思います。
中華フォントのチャプターのキャプションが中華フォントになってるの凝ってる…
本動画の編集をしてくれたuraQさんはそういう面白小ネタをはさんでくるのが上手いんですよね~。
CP/Mでコマンドに渡すスイッチ記号が/だったから、互換性を維持したままMS-DOSに階層ディレクトリを導入する為にはパス区切りに/が使えなかった。(T_T)
あぁ、たしかに。MS-DOSになってからも /NOK のようにスラッシュでオプション指定していましたね。さすがお詳しい。
出演キャラが骨を虚空に書くと、視聴者側から見たら⻣に…
44:10「それこそフォントに~」
80年代には既に、バックスラッシュの文字コードの位置は各国の通貨記号を割り当ててよいことになっていることを知識として知っていました。
ゆるコンピュータ科学ラジオ見てて「ツッコミたい!」って思ってたことがほぼ解説されててスッキリしました。私はDTPを仕事にしているので、誰か「ゆるDTP学ラジオ」もやらないかな、と期待してますw
ありがとうございます。僕の説明にもいろいろなツッコミをいただいているので、まだ調べが甘い部分がありますね。皆さんのコメントで足りない資料が補完されてきています。ありがたい。DTP方面に詳しそうな学徒は誰だろう。くろうにさんとケイさんかな?
>漢字で戦うアニメ『天保異聞 妖奇士』 うっ、頭が……
ßとβは手書きだと違いがわからない
きっと話してくれると信じてました
昔、友人がドイツ語のウムラウトをWebサイトに表示する方法が分からず、 コロンを右につけて a: e: o: で表記していたのを思い出しました。「天才かよ!?」となりました。
調べて解決するより聞いた方が早いってのはあるあるなんだけど、近くに証人がいるってのはすっげぇな
軒先を借りて母屋を取ってしまいましたね。わかりやすく、面白かったです。
クリーンコンピュータMZ-80、懐かしいですね。
平田さんのエクセルにおける数字の話、てっきりシングルクォートつけると数値でなく文字列にできるって話かと思った。あのシングルクォートはある種のエスケープ記号と言えると思う。
エスケープ文字初めて知って(?)single quoteを持ち出したかと思って、平田さんむっちゃ賢くない?って思いましたね。
絵文字さんにもう足向けて寝れねえや
漢字で戦うアニメ……アクエリオンロゴス?(アクエリオンシリーズは必殺技の演出が「THE 漢字」みたいな表現が多いですね)
9:06 エスケープ文字の説明が微妙ではと思いました。「制御コードや特殊文字の直前に\を置くことによりその機能を無効化する」特殊文字はその通りですが、制御コードはどちらかというと逆ですよね。エスケープ文字機能は以下の2つに分かれると思います。1.特別な意味を持った記号(特殊文字)をその文字自体として扱う=「特別な意味」を無効化する →ダブルクォーテーションの例(\")2.制御コードを表現するためにエスケープ文字+制御文字で指定する →改行などの例(CR: 、LF:など) 制御コードについては「無効化」という表現は誤解を招くかと思います。
ドラム式洗濯機をベランダに入れられるかわざわざお店の人に来てもらったんですが、乾電池みたいに規格があればすごく楽になりますね
ほんとですね。うちも洗濯機を買い替えるときは搬入がいつも不安です。ちゃんと規格があれば、家などの搬入経路もそれが通るように設計しますしね。
mojo言語の拡張子が.🔥なのびっくりした
なんと、.mojo 以外にも🔥が使えたんですね! こういう流れは歓迎したいです。
かつてのiモードには値段が定額じゃなくなる文字数を区別する機能がついてた気がします。
最初に遭遇した文字化けは第2水準漢字ROMの無いPCで表示したときの■トウフかな
なつかしい。僕も X1/turbo でトウフに遭遇して第2水準漢字ROM導入ました。
さすが別館!面白かった。
逆に普段使う文字を中華に合わせちゃえ! にはならんですかね? もんがまえの漢字とかがゲバ字で「门」、第一高校が㐧一高校とか、みたいなのは一定の世代には馴染み深いですし。0年代に日本生まれ日本育ちだけど簡単に書けて一定数に意味も通じるしそれでいいんじゃ、、、?とか思ったりします何より欧米のゲーム会社が「中国と日本は使う漢字違うんか、、、せや! 日本語ローカライズ見送ったろ!!」とかなるよりはいいと思うんですよね、、、
このコンビええですわ。二人の声の差が気持ちいい。正規チャンネルでみたい!!ほんで、スミノさんはゆるコンに学者枠で出てほしいっすわ。あの子は専門知識と実績もあるねんやろけどはしょる部分の解説がなんかアレなんでスミノさんのサポートあったらもっとわかりやすいと思う。
ありがとうございます。IT分野はいまや裾野がかなり広いので、いろいろな分野や年代の人がいた方が知識や記憶を補完できるのは間違いないですね。機会があればぜひ。
ユニコードは、学術論文をパソコンで仕上げる現在、漢字だけでなく、楔形文字やヒエログリフ、話しにも出た線文字Bなど過去の遺物もコードを割り当てることになって、大変ですね。現行のタイ文字やミャンマー語文字など、縦方向に長くなる文字は、日本語や中国語などと混在すると行間がスカスカになるっていうのも、問題の一つかと思います。
親のV740というラップトップでネットサーフィンしていた中学時代、4、5日に1件くらい文字化けしたサイトに出くわして文字コードいじってましたが高校に入る頃にはそんなサイトにはほとんど出くわさなくなり、ここ数年はブラウザの文字コード設定はいじったことありません。一般ユーザーが関知しない裏側で技術屋さんが頑張ってるんですね。
一度普及すると置き換えられないの最たる例は周波数が東西日本で違う点でしょう
たしかに!電気製品は両対応のものが普及しましたが、カメラのシャッタースピードでいつも悩まされてます。
有名なツールも日本語使った途端にバグるのはよくありますね 有名なeditorのvimもいつまでも日本語バグがあって日本人がパッチ上げていって直しました
ありますねー。Emacsでもバージョンアップ導入前に日本語入力が正しくできるかをまず確認していました。
ベトナム語では、電子文書の符号化方式はUTF-8、と、公式に決まっています。
φ(ギリシャ文字のファイ)と∅(空集合記号)は全く別の意味、は数学屋あるあるですね
ファイアオントーフについては、現ドワンゴで当時iモードの絵文字を考えた栗田さんに話を聞きにいってもらいたいな〜
VMWareのWebコンソール、デフォルトだとUSキーボード配列に強制的になるから、"@"が入力できねぇ!":"はどこだ!?と、初めて触った時はすんごい混乱したなぁ…
フランスに行った別館館長のLE0さんは日々AZERTY配列で記号入力と格闘しているそうです 笑
骨の異体字に関しては、おめーらNとИ統一するぞと()シンケンジャーはPower rangerでリメイクされてるはず…漢字どうなってるんだろう
Power Rangers Super Samurai のショドウフォンで書く字体はシンケンジャーのと一緒に見えました。
WindowsNT3.1の時点で内部の文字コードはUnicode(UTF-16)だったような。
ご指摘ありがとうございます。たしかにNT系では早くからUnicodeだったようです。Win2000ではすでにUnicodeでした。
最初から最後まで興味深い話で、面白かったです。>骨という字がついたキャラがいればいいキン肉マンには、キン骨マンというキャラがいて、額に「骨」と書いてありましたね。
キン骨マンをしっている方が多くて嬉しいですね。「弱そう」発言はキン骨マンがイメージにあったからなんです。そういえばボーンコールドっていう息子が出てましたね。あっちは強そう。
🍘も「夕日をバックにしたビル」に見えるって聞いた気がします
たしかに!エモい絵文字に見えてきました。
スマホの普及で消えた(消えかけている)ものといえばコンデジ。
¥ 実際はCNY中國元/RMB人民幣の略称にも使われますよね?
たしかに。そして「円」も「元」も「圓」が本来の表記でしたね。
ちゃんとASCIIとISO646を分けて、ISO646のナショナルユースケースに触れている点が良いですね。¥問題をMSが悪いといいだす人たちに見て欲しい動画。でも、Windowsは初代NT(1993年)から現在(2023年)までシステムはUNICODEですよ。システムが非UNICODEだったのはMS-DOS系と非NT系です。
ご指摘ありがとうございます。僕のWindowsに関しての知識が甘かったです。仰るとおりWin2000ではすでにUnicodeだったのを思い出しました。
そもそも「文字」じたいに曖昧性があるので、実用と理想の合間で永遠に解決しないでしょう「文字」は「形」と「意味」の対ですが、「意味」ば文脈で変わりますたとえば、「同じ形なら同じ数値(文字コード)でいいじゃん?」だったら、0Oや、Il1は同じコードでもよかったはずなんですそうなってないのは少なからず形と意味は分けて考える必要があるならば意味にコードを振ろうか、となると、今度は「このコンテキストでは意味が同じで形が違う」たとえば、高橋さんと髙橋さんは普通の検索では同一視したいけど表示は別にしたいとか逆に「見た目が同じだけど意味が違う」というのも、実用上問題になることがありますunicodeでいうところの「〜」はwavedashなのかfull width tildeなのか、とかそもそも入力時にどっちなのかわからん、みたいなまずコンピュータ関係なく、この漢字とこの漢字は公文書では統合しよう、みたいなことが国レベルで起こりますからねw
チルダの例で行くと、ネットショップで住所入力字のハイフンもなんとかしてほしいですね。厳密すぎてマイナス記号などを入れると「住所に使えない文字です」と弾かれることが多くて面倒です。
絵文字にそんな功績(CJK強制対応)があったとは。
記号が足りないのでAPLでは専用の記号とキーボードを作りました。ただ、続く言語はありませんでしたね。
アンペール社の WS-1 ですね。続く機械もありませんが、ワクワクした時代でした。
懐かしい。 ⍟ とか ⍝ とか、APL以外では顔文字くらいでしか使われない記号ですね。
♨️𓊝島根県に「温泉津(ゆのつ)」という場所があり、最寄りの温泉津駅(山陰本線)には上記の絵文字表記(温泉♨️+船𓊝)の駅名看板があったりしますw
作中で漢字が大きなテーマになっている作品としてはアホリズム (aphorism) がありますね。この作品は一人 1 つの漢字に依存した異能力を使ったバトルマンガですね。結構グロい内容が含まれています。
TeamsでWeb会議するときの参加者のアイコンが中華フォントになっていて気持ち悪いです。ですが、かなり多くの人に使われているはずなのにググってもそれを指摘している数は少ないです。私は学参フォントも気持ち悪く感じるのですが、字形にこだわるのは日本人でもここに来るような人ではない一般では少数派なのではと悲観しています。
車が1速からスタートしないとエンストするように、規格も1速で定義しないとそもそも普及しなかった、というより当時5速想定で定義したものは普及せず1速で定義したものに負けたという背景はありそう。
中華フォントの違和感、仕事でMicr○soft Teamsを使っている人は頻繁に遭遇していますね
ゆるコンピュータ科学ラジオは上っ面のキャッチーなネタを拾ってふざけ散らかしてるだけで、情報量に乏しい(ゆる学徒最底辺)のでこのようなツッコミは非常に良いと思います。一方でこの動画にはエンタメ性、言い換えるとカタルシスがないんですよね😅その辺りの脚本というか構成ができれば、「父殺し」も充分可能かと思いますけどねぇ🤣🤣頑張って!
同感です。とくに、右脳/左脳回はゆるコンピュータ科学ラジオのなかでもとくにひどかった。コンピュータは一般人にとって身近で深遠なジャンルであるからこそ、面白く解説できれば非常に価値がありますね。ぜひ父殺しをしてほしいです。
コメントありがとうございます。おっしゃるとおり、自分で見返してもエンタメ性が乏しいと感じていたところです。どのような構成が面白いのかも手探りで、みなさんのコメントを参考に調整していってます。
骨って書いてるキャラクター、キン骨マンですね
キン骨マンを思い出して「弱そう…」発言してました 笑
おじさんとしては分かりみが深かったです。Windows(の前のMS-DOS)でバックスラッシュをデリミタにしたのはビル・ゲイツがUNIXと同じじゃ嫌だと駄々を捏ねたから。という都市伝説を聞いたことがありますが、、、どちらにしろそういう時代でしたよね。汎用性より独自性を推してた。
当時MSはXenixってUNIX互換OS出してたぐらいなんでそれはないでしょうね。通説では階層ディレクトリが無かった1.0の頃に、コマンドラインオプションの指定にスラッシュを使っちゃってたから、と言われてます。今でも dir /w みたいに名残が残ってますね。
@@randmax3821 「dir/w」は「dirのなかのw.exe」とは解釈されず、「dir△/w」と解釈されると。CP/M由来と聞いたことがあります。
Windowsのディレクトリ記号が¥マークなのは、MS-DOSがそうだったからかと。
携帯電話の電話番号も090、080、070と来てるからそのうち0?0が足りなくなるんだろうなあ
070は以前はPHSに割り当てられていた番号ですね。現在の電話番号は11桁ですが、10桁の時代には050がPHSでした。これから人口は極端には増えないと思いますが、IoTデバイスなどが増えてくると桁の拡張があるかもしれませんね。
MS-DOS2.0でディレクトリ記号に\を使い出したけど、それ以前のMS-DOSで/をコマンドのオプションに使ってたからね。昔のfortoranみたいにカラムで制御をして行単位で命令を完結させれば記号の問題はなかったけど、それはそれでめちゃ不便だったw
Windowsの前の MS-DOS の前の CP/M-80の頃でも、パスの区切りは ¥ でしたね。確か、CP/M-80 が パス区切りにスラッシュを使えなかったのは、先にコマンドオプションをスラッシュにしてたからと聞いたことがあります。ともあれ、今日もスミノ節全開で楽しませていただきました。準決勝は残念でしたけど、やっぱりいいですね!応援しています!!
CP/Mに階層ディレクトリは無いですよ。MS-DOSもversion1の頃は階層ディレクトリは無かった。
@@早川眠人 !!!!そうでした!!!ってことは、オプションだけCP/Mから持ってきたMS-DOSが戦犯?これ以上、墓穴を掘るのはやめましょう。訂正、ありがとうございました。感謝です!
たしかオプションが/で使うプログラムとの互換性を保つため、パス区切りを似てるが使われてない\にするようにしたと聞いた覚えがある。
VMS なんかは、DKA500:[000000.PROJECT.day.after.tomorrow]file.lic;21というような問題の起こらないファイルパスだったのに、時代のいたずらですねぇ。ファイルバージョンは今時の OS で復活してほしい。
Windowsのディレクトリ記号こそMS-DOSからのなごりなので、アホじゃなくて必然しかないなWindowsをdosから起動したりdos窓開いたりしてたわけで
32kBメモリが「海のように広い」と言われてた、そんな時代
面白かった〜漢字をひとまとめに中華フォント・字形にされる話、AppleとかGoogleのサイトやメール表記がそれになるとフィッシングかな…?って疑心暗鬼に陥りそうなのでぜひ回避してほしいです😂土鍋は滅びなくてよかった…
フィッシングに見えるのよくわかります。フォントがテキトーだと情報の信頼度が下がりますよね。
47:31 >「骨」って書いてある主人公が現れればいいキン肉マンのスピンオフ、キン骨マン待望論!
キン骨マンの息子のボーンコールドにでっかく「骨」って書いてあれば主役級でも行けそうな気がします。
14:42 コンピュータ業界はアメリカ中心という話、画像処理系のプログラミングをやっていて、gray/greyのどっちがイギリス英語だっけといつも悩んでます。あとプログラミングとは直接関係ないですが、装甲車の3DCGモデルを扱った時に自衛隊の車両だとアメリカ式のArmored Vehicleではなくイギリス式にArmoured Vehicleと綴られる事が多いらしくて、統一すべきか困った事があリます。
3:55 悪き A S C I I って聞こえた
41:03 UNICODEでもIVS(異体字セレクタ)を使えば区別できる
個人的には、IVSが規格化された目的は「こういう規格(アイディア)を用いないように」ということを啓蒙するためのものだと思っています。まるで辞書に「この文字は間違った文字、誤字」であることを掲載するために作られた文字、そんな風なものだと思っています。
@@inacpan6706 ユニコードの規格の理念から言って、文字デザインを規定するのはそれに反する。しかし、テキストファイルのみでの文字化けのない情報交換の必要性も理解できる。そのせめぎ合いの中で生まれたのがIVSだと思う。
こうやって誤りのようなものがあったら訂正していくのが良いですね(最近読んだ本が分かる発言)
中華フォント化の見出しも中華フォントになっている()
堀元見とビルゲイツをdisって来たな
「骨」の字がデザインされたキャラ……キン骨マン(「キン肉マン」)というのがいますが、ダメ……ですよねぇ。
動画中に「なんか弱そう…」と言ったとき、キン骨マンをイメージしてました 笑
MZ-80CはROM 16KB、RAM 48KBで26万8千円、MZ-80K はROM 16KB RAM 32KB 19万8千円 だったと思う
ROMは4kiBですね。なにせクリーンコンピュータですから。
0000H- ROM1000H- RAMD000H- ビデオRAME000H?- メモリマップドI/Oだったかな?記憶飛んでる😅
@@takedesu0D000H = 53248 というのはいまだに覚えています。画面の左上から直接Z80アセンブラに対応する文字を入力していって、D000H にコマンドでジャンブすると実行できたんですよね。
47:13 キン骨マンがおるやろ!
懐かしいですね。「弱そう」発言は彼を思い出してなんですが、あれでも超人強度20くらいはあった気がします。
めっちゃ面白い
IBM-ATとか DOS/Vとかパソコン雑誌に現われる時代を知る自分は、この動画を見るまでマルチバイトという言い方を知りませんでした。頭の中は、英語byte=フランス語octetのレベルで止まっていました😅😅
マルチバイトとはASCIIとshift JISが混在する文字列を扱う場合に使う用語。全てUNICODEで文字列を扱う場合ワイドキャラクターと言う。
カタカナのソ、漢字の表などがShift-JISに5Cが含まれていてこれらの文字を使うと文字列が途中で切れる、誤動作するバグがよく出ていました。
PerlのCGIなどでも "表\示" のようにエスケープして回避していましたよね。懐かしい。
ちょっと女性の方のほうの知識の問題なのか話し方の問題なのか、男性のほうの折角の的を射た話の流れに、的はずれな話を持ち込まれると聞き手が混乱してしまいますね。できれば、こんな例示を合いの手として入れる、などとシナリオを作られたらとてもクオリティが上がると思いました。男性の方のお話はとてもクオリティが高いので。
バックスラッシュと言えばAA・・・\(^o^)/CJK系のフォント、LaTeXでよくドン詰まってたの懐かしいな~。Unicodeありがと~~~💩
LaTeXでは ¥ がバックスラッシュとして機能したので、円マークを出したいときにはYと=を重ねたりした時期がありました。
中国語勉強していると言編が画数少なくて楽なので自分用に見るメモにだけ真似してます
同じく。言偏の簡略化(讠)がとくに便利です。
骨がついてる主人公と言えば、呪術廻戦0の乙骨憂太がいますよね
「中華フォント」については本当に、本当に、ほんっっっっっとうに深刻だと思ってる。なぜならただ気持ち悪いじゃなく、文化の侵食につながる危険性があると思っているからです。動画内の小学生の例である通り、中華フォントに触れるときってゲームやアニメなどのホビー、エンタメなんですよね。だから意外と日常的な部分で触れる機会が多い。更にスマホなどの日常化から中国製ソフトやハードの台頭などで、中華フォントを避けられない状況も増えてきている。それで「気持ち悪い」と思っているうちはまだいいけど、何度も触れるうちに中華フォントに違和感を感じなくなったり、「普及してきているから」と日本の制度のほうが中華フォントに対応するようなことになったら本当に取り返しがつかなくなる。シングルバイト圏の人たちにはまじでこの問題に目を向けてほしいです。
おっしゃるとおりですねだから日本アニメの放送を禁止する国があったり、中国ではGBコードで正しい文字が表示されることを義務づけていたりするんですよね。日本の官もこの辺にもっと関心を持ってほしいです。
なぜ元祖 階層化ディレクトリ の unix において '/' だったのを MS-DOS2.0 が '\' にしたのかが問題である ^^
これ聞きながら、いまごろトロン・コードの必要性を感じてきた。坂村教授は正しかった?
懐かしいですね。僕も収録中何度かTRONという言葉が口から出そうになって「ここで話すと説明が長くなる・・・」と我慢してました。
カーリーブラケットだよ
ありがとうございます。編集時に「あー、しまった」と思ったのですが恥ずかしいので字幕ナシでスルーしようと…。やっぱり気づかれましたか 笑
私はブレースと呼んでます
繁体字、簡体字、新体字{旧当用漢字(現新体字)}、の問題ですね。
いままで新字という言葉でしか見たことなかったんですが、新体字っていうんですね!
@@masuo64 旧字体、新字体、拡張新字体。
CJK統合漢字がある一方でハングルに12000もの無駄なコードが割り当てられている。母音と子音個別のコードとそれを組み合わせたいわゆるハングル文字の両方があってハングルだけ使うことを考えても文書によって文字コードがぐちゃぐちゃになる。漢字を捨てられるのならベトナムのようにローマ字表記にしておけばUS(ベトナムはフランス?)キーボードやアプリがそのまま使えて一番良かった。漢字が必要な時は中国語を引用してくれば事足りる。そして日本語と中国語の漢字に別々のコードを割り当てることができた。
ハングルについては、Unicode 1.0時代にユニコードコンソーシアムがやらかしちゃった影響が大きいですね。それがなければ、Unicode 2.0で11172文字も登録することにならなかったか、登録するにしてもBMP外に登録したでしょう。CJK統合漢字については、当初「世界中の全ての文字は16bitで表せられる」という妄想でUnicode 1.0を作っちゃったのが悪かったと思います。最初から、当初ISO/IEC 10646の案で設計されていた4オクテット固定長コード、あるいは可変長にしておけば、CJK統合漢字なんて発想もしなくて済んだはずです。
常用ハングル2600字で理論組合せ11000字だそうです。常用文字のみに個別コードを割り当て、その他は字母組合せ方式にすればコードポイントが大分節約できてたのにね。
@@早川眠人 それをねじ込んだ理由が日中が大量の漢字を入れるならうちも同じ数のハングルをとゴネたためですからね。おかげでMSは早々にサロゲートペアなるシフトJISの再発明をやらかすしUTF-8が標準になってやれやれですよ。
結局任意記号にファイルパスのセパレータを割り当てたマイクロソフトの悪行ってことだな。いやMSがパクったCPMのせい?
CP/M由来説が濃厚そうですね。階層ディレクトリがなかったのでオプションに "/" を先に割り当てたと考えると辻褄があいます。
HTMLのエスケープで思い出すのが、湘南乃風『睡蓮花』の歌詞です。
途中に何度か出てくる"
おもしろ😂
それ経験してみたかったなwwおもろすぎる
これほんますこ
「歌詞に『あ』が出たら10%速く歌っていく」やつみたいな感じ?
「WindowsがUnicodeを使うようになったのはつい最近」という発言、「OSのシステムは2023年現在もShift_JISを使用している。」という字幕、いずれも語弊があります。
(後者は語弊というより誤解?)
OS内部でUnicode(UTF-16)が使われるようになったのはWindows NT4.0の時代、1996年のことです。
以降、2023年現在に至るまでファイルシステムNTFS含めて内部的にUTF-16が使用されています。
2019年に起きたのは単に「メモ帳という1アプリケーションが扱う文字コードのデフォルトがUTF-8になった」というだけのことなので誤解なきよう。
コメントありがとうございます! こちらの動画の編集担当者です。
テロップで補足するにあたり、「2019年に変更されたのはメモ帳アプリのデフォルト文字エンコードで、OSのシステムロケールは現在もShift_JISである」という情報を明記しようとしたのですが、私の理解が不十分でシステムロケールとOS内部での文字コードとを混同したままテロップを制作してしまい、おっしゃる通り不適切な記述になっていました。
正確な情報を提供できず、誠に申し訳ない気持ちです。
このたびは貴重なご指摘をいただき、ありがとうございました!
ゆるコンは補足回必ずいると思いますw
堀元さんガバいんだもの…
フォントの話をしている時に「ほんと」と言いまくってるの、堀元さんに怒られそうwwww
というか実際に紛らわしい笑
ゆるコンピュータ科学ラジオ、量子コンピュータ回のLE0さんみたいに常に小窓にスミノさんが控えていてほしい気持ちがある。
めちゃくちゃわかります!
スミノさん控えててくれたらものすごい安心感もって聞けますよね!!
ありがとうございます。
僕は台本を脱線させまくるので呼ばれない気がします 笑
そのかわり知見を求められれば協力しますよ。2000年問題のときのように。
@@smnky?はい?
ゆるコンの バックスラッシュの件、自分もモヤモヤしてました。スミノさんにちゃんと解説してもらえて良かったです。
コメントありがとうございます。いただいた反応の大きさから「モヤモヤしていたのは自分だけじゃなかっただな」と思いました。
海外インディーゲームやってると頻繁に中華フォントに遭遇するので本当に何とかしてほしいですね…
英語圏の開発者向けに中華フォントについて説明している"Your Code Displays Japanese Wrong"というページもあるのでもっと広まってほしい
開発・修正コストと(日本人の)マーケットへの影響の小ささが問題なのでしょうね。そのへんの言語対応がもっと簡単にできるフレームワークが登場してほしいです。
音質も画質も良くて助かる😊
「新たな刺客 中華フォント化」というテロップ自体が中華フォント化してるの 芸が細かいですね
しかし統合漢字の影響が ひらがなやカタカナにまで及んでる(ように見える)のはどういう理由なんだろう
鋭いです!
多くの中華フォントは平仮名と片仮名を含んでいます。どちらも種類がすくないので、これを含めておくことにより中国人は自国のフォントのみで日本語コンテンツを表示できます(いわゆるトウフ■にならない)
ただしあちらのデザイナーが作っているので字面のバランスが(日本人には)気持ち悪く感じます。
よく通販などで買った海外製品の取説にある字体が不気味に感じるのはこのためです。
学徒の補強動画嬉しいです😊
ゆるコン見るたびにスミノさんの顔がチラつきます😊
昔の話題がでるたびにきっと何か言いたくなってそうだと思ってました😆
ご明察です。たまに別館内部のチャットでひっそりと補足をいれてます。今回はそれを拾ってくれたケイさんが動画化をすすめてくれて公開の流れになりました。
ゆるコンピュータ科学ラジオの知りたかった背景部分をかなり補足されててめちゃくちゃ聞いて良かった回でした。
ベトナム語は現在ラテン文字を使ってますが、声調やベトナム語特有の音を表すために文中にたくさんダイアクリティカルマークを使うようになっていて、これはこれで大変だなと傍から見てて思います😅
ベトナムのアスキーコードvisciiは凄まじいからなあ。
とにかく頑張って文字を詰め込んで割り当てた感がある。
0x80以降だけではなく、 0x02 0x05 0x06 0x14 0x19 0x1E にも文字を割り当てているし。
声調を文字に反映する言語は大変ですよね。英語のようにダイアクリティカルマークを用いない言語は珍しい気がしますが、そういう点でもまさに計算機と相性の良い言語だと思います。
お二人の話、とても興味深かったです😊
わかりみが深すぎて、ほとんどのエピソードで己の若い頃の苦しい思い出が浮かび苦笑いしながら、先生の話をたのしませていただきました
だいぶ前ですが妖奇士(あやかしあやし)という漢字を武器にして戦うアニメがあった気がします!
WindowsがUTF-8に対応して一番最初に感じたのは「スマホ用の絵文字(Emoji)が直接キーボード打つだけで使える!」って点でしたね。
それまではできなかったような気がします。
ヒエログリフの上位互換!!
香港在住者ですが、公共の標識など漢字+英語の物を見掛ける度、「中国語の分からない非アジア圏出身の人には、半分の文字情報が全く無意味なのだなぁ」と感じて、日本語使用者の利点をしみじみ思います。
中華フォントのチャプターのキャプションが中華フォントになってるの凝ってる…
本動画の編集をしてくれたuraQさんはそういう面白小ネタをはさんでくるのが上手いんですよね~。
CP/Mでコマンドに渡すスイッチ記号が/だったから、互換性を維持したままMS-DOSに階層ディレクトリを導入する為にはパス区切りに/が使えなかった。(T_T)
あぁ、たしかに。MS-DOSになってからも /NOK のようにスラッシュでオプション指定していましたね。さすがお詳しい。
出演キャラが骨を虚空に書くと、視聴者側から見たら⻣に…
44:10
「それこそフォントに~」
80年代には既に、バックスラッシュの文字コードの位置は各国の通貨記号を割り当ててよいことになっていることを知識として知っていました。
ゆるコンピュータ科学ラジオ見てて「ツッコミたい!」って思ってたことがほぼ解説されててスッキリしました。私はDTPを仕事にしているので、誰か「ゆるDTP学ラジオ」もやらないかな、と期待してますw
ありがとうございます。
僕の説明にもいろいろなツッコミをいただいているので、まだ調べが甘い部分がありますね。
皆さんのコメントで足りない資料が補完されてきています。ありがたい。
DTP方面に詳しそうな学徒は誰だろう。くろうにさんとケイさんかな?
>漢字で戦うアニメ
『天保異聞 妖奇士』 うっ、頭が……
ßとβは手書きだと違いがわからない
きっと話してくれると信じてました
昔、友人がドイツ語のウムラウトをWebサイトに表示する方法が分からず、 コロンを右につけて a: e: o: で表記していたのを思い出しました。「天才かよ!?」となりました。
調べて解決するより聞いた方が早いってのはあるあるなんだけど、近くに証人がいるってのはすっげぇな
軒先を借りて母屋を取ってしまいましたね。わかりやすく、面白かったです。
クリーンコンピュータMZ-80、懐かしいですね。
平田さんのエクセルにおける数字の話、てっきりシングルクォートつけると数値でなく文字列にできるって話かと思った。あのシングルクォートはある種のエスケープ記号と言えると思う。
エスケープ文字初めて知って(?)single quoteを持ち出したかと思って、平田さんむっちゃ賢くない?って思いましたね。
絵文字さんにもう足向けて寝れねえや
漢字で戦うアニメ……アクエリオンロゴス?(アクエリオンシリーズは必殺技の演出が「THE 漢字」みたいな表現が多いですね)
9:06 エスケープ文字の説明が微妙ではと思いました。
「制御コードや特殊文字の直前に\を置くことによりその機能を無効化する」
特殊文字はその通りですが、制御コードはどちらかというと逆ですよね。
エスケープ文字機能は以下の2つに分かれると思います。
1.特別な意味を持った記号(特殊文字)をその文字自体として扱う=「特別な意味」を無効化する
→ダブルクォーテーションの例(\")
2.制御コードを表現するためにエスケープ文字+制御文字で指定する
→改行などの例(CR:
、LF:
など)
制御コードについては「無効化」という表現は誤解を招くかと思います。
ドラム式洗濯機をベランダに入れられるかわざわざお店の人に来てもらったんですが、乾電池みたいに規格があればすごく楽になりますね
ほんとですね。うちも洗濯機を買い替えるときは搬入がいつも不安です。
ちゃんと規格があれば、家などの搬入経路もそれが通るように設計しますしね。
mojo言語の拡張子が.🔥なのびっくりした
なんと、.mojo 以外にも🔥が使えたんですね! こういう流れは歓迎したいです。
かつてのiモードには値段が定額じゃなくなる文字数を区別する機能がついてた気がします。
最初に遭遇した文字化けは第2水準漢字ROMの無いPCで表示したときの■トウフかな
なつかしい。僕も X1/turbo でトウフに遭遇して第2水準漢字ROM導入ました。
さすが別館!面白かった。
逆に普段使う文字を中華に合わせちゃえ! にはならんですかね? もんがまえの漢字とかがゲバ字で「门」、第一高校が㐧一高校とか、みたいなのは一定の世代には馴染み深いですし。0年代に日本生まれ日本育ちだけど簡単に書けて一定数に意味も通じるしそれでいいんじゃ、、、?とか思ったりします
何より欧米のゲーム会社が「中国と日本は使う漢字違うんか、、、せや! 日本語ローカライズ見送ったろ!!」とかなるよりはいいと思うんですよね、、、
このコンビええですわ。
二人の声の差が気持ちいい。
正規チャンネルでみたい!!
ほんで、スミノさんはゆるコンに学者枠で出てほしいっすわ。
あの子は専門知識と実績もあるねんやろけど
はしょる部分の解説がなんかアレなんで
スミノさんのサポートあったらもっとわかりやすいと思う。
ありがとうございます。IT分野はいまや裾野がかなり広いので、いろいろな分野や年代の人がいた方が知識や記憶を補完できるのは間違いないですね。機会があればぜひ。
ユニコードは、学術論文をパソコンで仕上げる現在、漢字だけでなく、楔形文字やヒエログリフ、話しにも出た線文字Bなど過去の遺物もコードを割り当てることになって、大変ですね。現行のタイ文字やミャンマー語文字など、縦方向に長くなる文字は、日本語や中国語などと混在すると行間がスカスカになるっていうのも、問題の一つかと思います。
親のV740というラップトップでネットサーフィンしていた中学時代、4、5日に1件くらい文字化けしたサイトに出くわして文字コードいじってましたが高校に入る頃にはそんなサイトにはほとんど出くわさなくなり、ここ数年はブラウザの文字コード設定はいじったことありません。一般ユーザーが関知しない裏側で技術屋さんが頑張ってるんですね。
一度普及すると置き換えられないの最たる例は周波数が東西日本で違う点でしょう
たしかに!
電気製品は両対応のものが普及しましたが、カメラのシャッタースピードでいつも悩まされてます。
有名なツールも日本語使った途端にバグるのはよくありますね 有名なeditorのvimもいつまでも日本語バグがあって日本人がパッチ上げていって直しました
ありますねー。Emacsでもバージョンアップ導入前に日本語入力が正しくできるかをまず確認していました。
ベトナム語では、電子文書の符号化方式はUTF-8、と、公式に決まっています。
φ(ギリシャ文字のファイ)と∅(空集合記号)は全く別の意味、は数学屋あるあるですね
ファイアオントーフについては、現ドワンゴで当時iモードの絵文字を考えた栗田さんに話を聞きにいってもらいたいな〜
VMWareのWebコンソール、デフォルトだとUSキーボード配列に強制的になるから、
"@"が入力できねぇ!":"はどこだ!?と、初めて触った時はすんごい混乱したなぁ…
フランスに行った別館館長のLE0さんは日々AZERTY配列で記号入力と格闘しているそうです 笑
骨の異体字に関しては、おめーらNとИ統一するぞと()
シンケンジャーはPower rangerでリメイクされてるはず…漢字どうなってるんだろう
Power Rangers Super Samurai のショドウフォンで書く字体はシンケンジャーのと一緒に見えました。
WindowsNT3.1の時点で内部の文字コードはUnicode(UTF-16)だったような。
ご指摘ありがとうございます。たしかにNT系では早くからUnicodeだったようです。Win2000ではすでにUnicodeでした。
最初から最後まで興味深い話で、面白かったです。
>骨という字がついたキャラがいればいい
キン肉マンには、キン骨マンというキャラがいて、額に「骨」と書いてありましたね。
キン骨マンをしっている方が多くて嬉しいですね。「弱そう」発言はキン骨マンがイメージにあったからなんです。そういえばボーンコールドっていう息子が出てましたね。あっちは強そう。
🍘も「夕日をバックにしたビル」に見えるって聞いた気がします
たしかに!エモい絵文字に見えてきました。
スマホの普及で消えた(消えかけている)ものといえばコンデジ。
¥ 実際はCNY中國元/RMB人民幣の略称にも使われますよね?
たしかに。そして「円」も「元」も「圓」が本来の表記でしたね。
ちゃんとASCIIとISO646を分けて、ISO646のナショナルユースケースに触れている点が良いですね。¥問題をMSが悪いといいだす人たちに見て欲しい動画。でも、Windowsは初代NT(1993年)から現在(2023年)までシステムはUNICODEですよ。システムが非UNICODEだったのはMS-DOS系と非NT系です。
ご指摘ありがとうございます。僕のWindowsに関しての知識が甘かったです。仰るとおりWin2000ではすでにUnicodeだったのを思い出しました。
そもそも「文字」じたいに曖昧性があるので、実用と理想の合間で永遠に解決しないでしょう
「文字」は「形」と「意味」の対ですが、「意味」ば文脈で変わります
たとえば、「同じ形なら同じ数値(文字コード)でいいじゃん?」だったら、0Oや、Il1は同じコードでもよかったはずなんです
そうなってないのは少なからず形と意味は分けて考える必要がある
ならば意味にコードを振ろうか、となると、今度は「このコンテキストでは意味が同じで形が違う」
たとえば、高橋さんと髙橋さんは普通の検索では同一視したいけど表示は別にしたいとか
逆に「見た目が同じだけど意味が違う」というのも、実用上問題になることがあります
unicodeでいうところの「〜」はwavedashなのかfull width tildeなのか、とか
そもそも入力時にどっちなのかわからん、みたいな
まずコンピュータ関係なく、この漢字とこの漢字は公文書では統合しよう、みたいなことが国レベルで起こりますからねw
チルダの例で行くと、ネットショップで住所入力字のハイフンもなんとかしてほしいですね。厳密すぎてマイナス記号などを入れると「住所に使えない文字です」と弾かれることが多くて面倒です。
絵文字にそんな功績(CJK強制対応)があったとは。
記号が足りないのでAPLでは専用の記号とキーボードを作りました。ただ、続く言語はありませんでしたね。
アンペール社の WS-1 ですね。続く機械もありませんが、ワクワクした時代でした。
懐かしい。 ⍟ とか ⍝ とか、APL以外では顔文字くらいでしか使われない記号ですね。
♨️𓊝
島根県に「温泉津(ゆのつ)」という場所があり、最寄りの温泉津駅(山陰本線)には上記の絵文字表記(温泉♨️+船𓊝)の駅名看板があったりしますw
作中で漢字が大きなテーマになっている作品としては
アホリズム (aphorism) がありますね。
この作品は一人 1 つの漢字に依存した異能力を使った
バトルマンガですね。
結構グロい内容が含まれています。
TeamsでWeb会議するときの参加者のアイコンが中華フォントになっていて気持ち悪いです。ですが、かなり多くの人に使われているはずなのにググってもそれを指摘している数は少ないです。私は学参フォントも気持ち悪く感じるのですが、字形にこだわるのは日本人でもここに来るような人ではない一般では少数派なのではと悲観しています。
車が1速からスタートしないとエンストするように、規格も1速で定義しないとそもそも普及しなかった、というより当時5速想定で定義したものは普及せず1速で定義したものに負けたという背景はありそう。
中華フォントの違和感、仕事でMicr○soft Teamsを使っている人は頻繁に遭遇していますね
ゆるコンピュータ科学ラジオは上っ面のキャッチーなネタを拾ってふざけ散らかしてるだけで、情報量に乏しい(ゆる学徒最底辺)のでこのようなツッコミは非常に良いと思います。
一方でこの動画にはエンタメ性、言い換えるとカタルシスがないんですよね😅
その辺りの脚本というか構成ができれば、「父殺し」も充分可能かと思いますけどねぇ🤣🤣
頑張って!
同感です。とくに、右脳/左脳回はゆるコンピュータ科学ラジオのなかでもとくにひどかった。コンピュータは一般人にとって身近で深遠なジャンルであるからこそ、面白く解説できれば非常に価値がありますね。ぜひ父殺しをしてほしいです。
コメントありがとうございます。
おっしゃるとおり、自分で見返してもエンタメ性が乏しいと感じていたところです。
どのような構成が面白いのかも手探りで、みなさんのコメントを参考に調整していってます。
骨って書いてるキャラクター、キン骨マンですね
キン骨マンを思い出して「弱そう…」発言してました 笑
おじさんとしては分かりみが深かったです。
Windows(の前のMS-DOS)でバックスラッシュをデリミタにしたのはビル・ゲイツがUNIXと同じじゃ嫌だと駄々を捏ねたから。という都市伝説を聞いたことがありますが、、、どちらにしろそういう時代でしたよね。汎用性より独自性を推してた。
当時MSはXenixってUNIX互換OS出してたぐらいなんでそれはないでしょうね。通説では階層ディレクトリが無かった1.0の頃に、コマンドラインオプションの指定にスラッシュを使っちゃってたから、と言われてます。今でも dir /w みたいに名残が残ってますね。
@@randmax3821 「dir/w」は「dirのなかのw.exe」とは解釈されず、「dir△/w」と解釈されると。CP/M由来と聞いたことがあります。
Windowsのディレクトリ記号が¥マークなのは、
MS-DOSがそうだったからかと。
携帯電話の電話番号も090、080、070と来てるからそのうち0?0が足りなくなるんだろうなあ
070は以前はPHSに割り当てられていた番号ですね。
現在の電話番号は11桁ですが、10桁の時代には050がPHSでした。
これから人口は極端には増えないと思いますが、IoTデバイスなどが増えてくると桁の拡張があるかもしれませんね。
MS-DOS2.0でディレクトリ記号に\を
使い出したけど、それ以前のMS-DOSで
/をコマンドのオプションに使ってたからね。
昔のfortoranみたいにカラムで制御をして
行単位で命令を完結させれば記号の
問題はなかったけど、それはそれでめちゃ
不便だったw
Windowsの前の MS-DOS の前の CP/M-80の頃でも、パスの区切りは ¥ でしたね。確か、CP/M-80 が パス区切りにスラッシュを使えなかったのは、先にコマンドオプションをスラッシュにしてたからと聞いたことがあります。
ともあれ、今日もスミノ節全開で楽しませていただきました。準決勝は残念でしたけど、やっぱりいいですね!応援しています!!
CP/Mに階層ディレクトリは無いですよ。MS-DOSもversion1の頃は階層ディレクトリは無かった。
@@早川眠人 !!!!そうでした!!!ってことは、オプションだけCP/Mから持ってきたMS-DOSが戦犯?
これ以上、墓穴を掘るのはやめましょう。訂正、ありがとうございました。感謝です!
たしかオプションが/で使うプログラムとの互換性を保つため、パス区切りを似てるが使われてない\にするようにしたと聞いた覚えがある。
VMS なんかは、DKA500:[000000.PROJECT.day.after.tomorrow]file.lic;21
というような問題の起こらないファイルパスだったのに、時代のいたずらですねぇ。
ファイルバージョンは今時の OS で復活してほしい。
Windowsのディレクトリ記号こそMS-DOSからのなごりなので、アホじゃなくて必然しかないな
Windowsをdosから起動したりdos窓開いたりしてたわけで
32kBメモリが「海のように広い」と言われてた、そんな時代
面白かった〜
漢字をひとまとめに中華フォント・字形にされる話、
AppleとかGoogleのサイトやメール表記がそれになるとフィッシングかな…?って疑心暗鬼に陥りそうなのでぜひ回避してほしいです😂
土鍋は滅びなくてよかった…
フィッシングに見えるのよくわかります。フォントがテキトーだと情報の信頼度が下がりますよね。
47:31 >「骨」って書いてある主人公が現れればいい
キン肉マンのスピンオフ、キン骨マン待望論!
キン骨マンの息子のボーンコールドにでっかく「骨」って書いてあれば主役級でも行けそうな気がします。
14:42 コンピュータ業界はアメリカ中心という話、画像処理系のプログラミングをやっていて、gray/greyのどっちがイギリス英語だっけといつも悩んでます。
あとプログラミングとは直接関係ないですが、装甲車の3DCGモデルを扱った時に自衛隊の車両だとアメリカ式のArmored Vehicleではなくイギリス式にArmoured Vehicleと綴られる事が多いらしくて、統一すべきか困った事があリます。
3:55 悪き A S C I I って聞こえた
41:03 UNICODEでもIVS(異体字セレクタ)を使えば区別できる
個人的には、IVSが規格化された目的は「こういう規格(アイディア)を用いないように」ということを啓蒙するためのものだと思っています。まるで辞書に「この文字は間違った文字、誤字」であることを掲載するために作られた文字、そんな風なものだと思っています。
@@inacpan6706
ユニコードの規格の理念から言って、文字デザインを規定するのはそれに反する。しかし、テキストファイルのみでの文字化けのない情報交換の必要性も理解できる。そのせめぎ合いの中で生まれたのがIVSだと思う。
こうやって誤りのようなものがあったら訂正していくのが良いですね(最近読んだ本が分かる発言)
中華フォント化の見出しも中華フォントになっている()
堀元見とビルゲイツをdisって来たな
「骨」の字がデザインされたキャラ……キン骨マン(「キン肉マン」)というのがいますが、ダメ……ですよねぇ。
動画中に「なんか弱そう…」と言ったとき、キン骨マンをイメージしてました 笑
MZ-80CはROM 16KB、RAM 48KBで26万8千円、MZ-80K はROM 16KB RAM 32KB 19万8千円 だったと思う
ROMは4kiBですね。なにせクリーンコンピュータですから。
0000H- ROM
1000H- RAM
D000H- ビデオRAM
E000H?- メモリマップドI/O
だったかな?
記憶飛んでる😅
@@takedesu0
D000H = 53248 というのはいまだに覚えています。
画面の左上から直接Z80アセンブラに対応する文字を入力していって、D000H にコマンドでジャンブすると実行できたんですよね。
47:13 キン骨マンがおるやろ!
懐かしいですね。「弱そう」発言は彼を思い出してなんですが、あれでも超人強度20くらいはあった気がします。
めっちゃ面白い
IBM-ATとか DOS/Vとかパソコン雑誌に現われる時代を知る自分は、この動画を見るまでマルチバイトという言い方を知りませんでした。頭の中は、英語byte=フランス語octetのレベルで止まっていました😅😅
マルチバイトとはASCIIとshift JISが混在する文字列を扱う場合に使う用語。全てUNICODEで文字列を扱う場合ワイドキャラクターと言う。
カタカナのソ、漢字の表などがShift-JISに5Cが含まれていてこれらの文字を使うと文字列が途中で切れる、誤動作するバグがよく出ていました。
PerlのCGIなどでも "表\示" のようにエスケープして回避していましたよね。懐かしい。
ちょっと女性の方のほうの知識の問題なのか話し方の問題なのか、男性のほうの折角の的を射た話の流れに、的はずれな話を持ち込まれると聞き手が混乱してしまいますね。できれば、こんな例示を合いの手として入れる、などとシナリオを作られたらとてもクオリティが上がると思いました。男性の方のお話はとてもクオリティが高いので。
バックスラッシュと言えばAA・・・\(^o^)/
CJK系のフォント、LaTeXでよくドン詰まってたの懐かしいな~。Unicodeありがと~~~💩
LaTeXでは ¥ がバックスラッシュとして機能したので、円マークを出したいときにはYと=を重ねたりした時期がありました。
中国語勉強していると言編が画数少なくて楽なので自分用に見るメモにだけ真似してます
同じく。言偏の簡略化(讠)がとくに便利です。
骨がついてる主人公と言えば、呪術廻戦0の乙骨憂太がいますよね
「中華フォント」については本当に、本当に、ほんっっっっっとうに深刻だと思ってる。
なぜならただ気持ち悪いじゃなく、文化の侵食につながる危険性があると思っているからです。
動画内の小学生の例である通り、中華フォントに触れるときってゲームやアニメなどのホビー、エンタメなんですよね。
だから意外と日常的な部分で触れる機会が多い。
更にスマホなどの日常化から中国製ソフトやハードの台頭などで、中華フォントを避けられない状況も増えてきている。
それで「気持ち悪い」と思っているうちはまだいいけど、何度も触れるうちに中華フォントに違和感を感じなくなったり、
「普及してきているから」と日本の制度のほうが中華フォントに対応するようなことになったら本当に取り返しがつかなくなる。
シングルバイト圏の人たちにはまじでこの問題に目を向けてほしいです。
おっしゃるとおりですね
だから日本アニメの放送を禁止する国があったり、中国ではGBコードで正しい文字が表示されることを義務づけていたりするんですよね。日本の官もこの辺にもっと関心を持ってほしいです。
なぜ元祖 階層化ディレクトリ の unix において '/' だったのを MS-DOS2.0 が '\' にしたのかが問題である ^^
これ聞きながら、いまごろトロン・コードの必要性を感じてきた。坂村教授は正しかった?
懐かしいですね。僕も収録中何度かTRONという言葉が口から出そうになって「ここで話すと説明が長くなる・・・」と我慢してました。
カーリーブラケットだよ
ありがとうございます。編集時に「あー、しまった」と思ったのですが恥ずかしいので字幕ナシでスルーしようと…。やっぱり気づかれましたか 笑
私はブレースと呼んでます
繁体字、簡体字、新体字{旧当用漢字(現新体字)}、の問題ですね。
いままで新字という言葉でしか見たことなかったんですが、新体字っていうんですね!
@@masuo64 旧字体、新字体、拡張新字体。
CJK統合漢字がある一方でハングルに12000もの無駄なコードが割り当てられている。
母音と子音個別のコードとそれを組み合わせたいわゆるハングル文字の両方があってハングルだけ使うことを考えても文書によって文字コードがぐちゃぐちゃになる。
漢字を捨てられるのならベトナムのようにローマ字表記にしておけばUS(ベトナムはフランス?)キーボードやアプリがそのまま使えて一番良かった。
漢字が必要な時は中国語を引用してくれば事足りる。
そして日本語と中国語の漢字に別々のコードを割り当てることができた。
ハングルについては、Unicode 1.0時代にユニコードコンソーシアムがやらかしちゃった影響が大きいですね。それがなければ、Unicode 2.0で11172文字も登録することにならなかったか、登録するにしてもBMP外に登録したでしょう。
CJK統合漢字については、当初「世界中の全ての文字は16bitで表せられる」という妄想でUnicode 1.0を作っちゃったのが悪かったと思います。最初から、当初ISO/IEC 10646の案で設計されていた4オクテット固定長コード、あるいは可変長にしておけば、CJK統合漢字なんて発想もしなくて済んだはずです。
常用ハングル2600字で理論組合せ11000字だそうです。常用文字のみに個別コードを割り当て、その他は字母組合せ方式にすればコードポイントが大分節約できてたのにね。
@@早川眠人 それをねじ込んだ理由が日中が大量の漢字を入れるならうちも同じ数のハングルをとゴネたためですからね。
おかげでMSは早々にサロゲートペアなるシフトJISの再発明をやらかすしUTF-8が標準になってやれやれですよ。
結局任意記号にファイルパスのセパレータを割り当てたマイクロソフトの悪行ってことだな。いやMSがパクったCPMのせい?
CP/M由来説が濃厚そうですね。階層ディレクトリがなかったのでオプションに "/" を先に割り当てたと考えると辻褄があいます。