文字コードを深掘りする。文字化けはなぜ起こるのか?【文字コード1】#92

แชร์
ฝัง
  • เผยแพร่เมื่อ 26 ธ.ค. 2024

ความคิดเห็น •

  • @yurucom
    @yurucom  ปีที่แล้ว +19

    【参考文献】
    ◯プログラマのための文字コード技術入門
    amzn.to/46c6jqf
    ◯「カタカナは20文字だけ」「没アイテムで宝箱がカラッポに」 ファミコンハードの限界に挑んだ制作者たち ねとらぼあ
    nlab.itmedia.co.jp/nl/articles/1801/07/news008.html
    【サポーターコミュニティ加入はこちらから】
    yurugengo.com/support
    【おたよりフォーム】
    forms.gle/BLEZpLcdEPmoZTH4A
    ※皆様からの楽しいおたよりをお待ちしています!

  • @ihatovoihatovo1732
    @ihatovoihatovo1732 ปีที่แล้ว +148

    以前、吐噶喇列島の島に住んでいました。住居表示は鹿児島県鹿児島郡十島村〇〇島〇〇番地 となっていました。

  • @mudaso-heavy-user
    @mudaso-heavy-user ปีที่แล้ว +188

    言語沼の件あってのこのシリーズ、エモい

  • @TonyStark_85
    @TonyStark_85 ปีที่แล้ว +92

    5:54 「ぬるぬる」なんて頻繁に言わないと言ったすぐあとに「ぬるっとしちゃう」が堀元さんの口から発されている

  • @nanoriKYDO
    @nanoriKYDO ปีที่แล้ว +49

    繧繝 同じ色を濃から淡へ、淡から濃へと層をなすように繰り返す彩色法(デジタル大辞泉より)
    初期のDQでは「モンスター」が使えない(「モ」が無い)ので「まもの」と表記したとか

  • @koi506
    @koi506 ปีที่แล้ว +43

    昔、フォント作成PJに関わったことがあります。
    文字コードは設定されてても第1水準から作っていくので、最初は無い無い尽くし。
    第2、第3と進むとだいぶスレてきて高頻度を優先的に作る方式になりました。

  • @magical_hippopotamus
    @magical_hippopotamus ปีที่แล้ว +96

    「ほっけ」を漢字で表すと魚編に花で「𩸽」なのですが、これはサロゲートペアといってUnicodeの中でも1文字16bitに収まらなくて拡張された少し特殊な字の1つです。扱いに注意が必要と言われていました。
    文字コード回でほっけのTシャツを着てくる堀元さん、流石ですね。

    • @taturou
      @taturou ปีที่แล้ว

      サロゲートペアを処理するコード書いたことありますが、あれはイヤだった。UTF8が発見されて良かったです。日本語は3バイトになりがちでムカつくけど。

  • @nandemotsukuruyo
    @nandemotsukuruyo ปีที่แล้ว +31

    14:55
    ちなみに「ク」も「エ」も未収録なのでゲーム会話中では「ドラゴンくえすと」と表示されます。

  • @sabak7390
    @sabak7390 ปีที่แล้ว +41

    弁が3つの文字が合流していたのは初耳。ぜんぶ「弁える」の意味だと思ってた。
    智弁和歌山の弁はもとは辯で、弁護士や弁論と同じ源だったんですね。
    久しぶりに面白かった脱線話でした。

  • @yu100nabeyan
    @yu100nabeyan ปีที่แล้ว +22

    2人とも緑Tシャツお揃でかわいい

  • @Fnak202
    @Fnak202 ปีที่แล้ว +109

    初代ドラクエで採用されたカタカナは 20 文字+「ド」の 21 種類で、「リ」「ヘ」は平仮名で代用するため、収録文字数は 19 文字となっています。
    ちなみに、その 20 文字の中に「ク」は入っていません。(物語中に「クエスト」という単語は出てこない。)
    有名な話では、「ダースドラゴン」というモンスターは、アイデア段階では「ダークドラゴン」という名前だったというのがあります。
    また、水野さんが仰っていた呪文「メラ」はスタメン張っていたという話ですが、実は初代ドラクエに「メラ」は登場していません。
    初代ドラクエに登場した攻撃呪文は「ギラ」「ベギラマ」の 2 種類だけで、「メラ」が初登場したのはⅢですね。

    • @subratte256
      @subratte256 ปีที่แล้ว

      また初代ポケモンでは「り」「へ」以外のひらがな・カタカナと「゛」「゜」「…」「ど」「ィ」「円」「!」「?」「 」とプログラムの仕様で生まれた終端文字なるもの(透明)、0~9、A~G辺りまでのアルファベット(背景のチップとして使用していたりもする)で256文字分(1文字当たり1byte)になっていたりします。よくバグらせると゛だらけになったりアネ゛デパミ゛みたいた名前が生まれたりするのもプログラムで「が」や「ぱ」を疑似的に再現していたからこそ生まれていたりしていると考えられます。(「と」の上に「゛」をつける普通バージョンだと上のポケモンのステータスなどの表示に影響が出るため?「ど」は1byteの大きさに収めるための文字でポケモンのステータス画面でのみ見られます。)

  • @184a-xx8km
    @184a-xx8km ปีที่แล้ว +53

    15:30
    ポケモンはバーチャルコンソールも含めるとと全シリーズから最新作にポケモンを移送できるんだけど、
    GBは「ヘ」の平仮名とカタカナの文字コードが同じで、移送するときに他の文字で判断して文字コードを平仮名かカタカナどっちかに変換する機能がついてたりするらしい。
    ポケモンっていうゲームだけ容量が少なかった時代の遺産がまだ残ってるんだよね

  • @ポメ西
    @ポメ西 ปีที่แล้ว +84

    ドレミの歌以外で
    「『喇』は『喇叭』の『喇』」って言うことあるんだ

  • @squandered3589
    @squandered3589 ปีที่แล้ว +22

    「円マーク円以外に使わんしね」
    元も同じ記号ですね。海外通販で円表記だと思って買ったら元だった、
    といったケースがあり、問題になっています。

  • @kiji-siro
    @kiji-siro ปีที่แล้ว +26

    パソコンで文字を入力していると文字コードにに入ってない文字が〓(下駄記号)になって出てくることがあります。これは活版印刷の時、必要な活字がないとき不要の活字を上下さかさまにして仮置きし、その底面がゲラ刷りしたとき〓に見えたので、〓が文字コードに存在しない文字の代替文字になった。ちなみにこれを「下駄を履かせる」というそうです。

  • @mudaso-heavy-user
    @mudaso-heavy-user ปีที่แล้ว +35

    ドラクエの話だと、ダークドラゴンを出そうとしたけど容量的にカタカナのクが使えないからダースドラゴンになったって話があった気がする

    • @masuo64
      @masuo64 ปีที่แล้ว +7

      むだそすん!

    • @mudaso-heavy-user
      @mudaso-heavy-user ปีที่แล้ว +3

      @@masuo64 カタカナの話ね、ひらがなは使えるんやでwww

  • @thesaito2721
    @thesaito2721 ปีที่แล้ว +41

    コナンくん「札幌に住んでるのに円山動物園ではなくてわざわざ旭山動物園…? 妙だな…」

  • @xitianzhenwu6756
    @xitianzhenwu6756 ปีที่แล้ว +28

    外来語の音訳であることを示すために、口偏を使ってたので、トカラ(奄美地方の言葉が由来)に漢字を当てる際に、音を表す声符に口偏を付けて吐噶喇となっています
    喇叭も同様

    • @あああ-v8f6y
      @あああ-v8f6y 8 หลายเดือนก่อน

      はえー勉強になる

  • @チキン南蛮-r4p
    @チキン南蛮-r4p ปีที่แล้ว +8

    瓣(花弁・安全弁)と辯(雄弁・大阪弁)は分かりやすいけど
    正しいか否か分ける/弁えるを意味する辨(弁別・勘弁)に該当する漢字だけ
    区別するのかなり難しくね?
    弁当は物理的な境や蓋なので瓣かと思いきや辨だし
    弁証法・弁護士・弁舌・弁論・弁説・詭弁・弁解・弁明
    は一見全部コトバ関係なのに最初と最後だけ辨で違う。
    さらに弁理士や弁償するの弁は
    辨(わきまえるの意)ですらなく4文字目の辦(処理するの意)
    そしてダメ押しのように5文字目の辮(編むの意、弁髪)まである。
    一周まわって一緒にしてくれた先人に感謝かもしれん、
    全部バラバラのままだったらきっと自分は発狂してた…

    • @Konata_Love17
      @Konata_Love17 2 หลายเดือนก่อน +1

      流石にそこまで深い話は出来なかったか…

  • @nanaki1006
    @nanaki1006 ปีที่แล้ว +16

    繧繝(うんげん)、後学のために調べてみました。雛人形の載ってる畳の縁に付いてるカラフルな模様のあれ。

  • @doridoriization
    @doridoriization ปีที่แล้ว +88

    難読語の漢字は書けるがその意味を知らない水野氏と漢字を図形と認識するもその違いが曖昧な堀元氏。よいコンビである。

  • @koolongkoolong
    @koolongkoolong ปีที่แล้ว +62

    水野さんは文字コードを文字化けの原因として認識しているし、横隔膜はしゃっくりの原因として認識している

    • @haine102
      @haine102 ปีที่แล้ว +6

      ただし、横隔膜がどこにあるかわからないし、しゃっくりのメカニズムもわからない。

  • @kirirei_sliyou
    @kirirei_sliyou ปีที่แล้ว +31

    ドラクエ1の攻撃呪文はギラとベギラマしかないです(キメラがいるのでメラは出せるけど)
    「ダークドラゴン」というモンスターを実装しようとしたところ、「ク」が使えなかったので「ダースドラゴン」という謎の名前になったそうです。
    なぜかドラクエ3になって「ク」が使えるようになったあとも「ダースリカント」という新モンスターが登場したので、「ダース」という架空の形容詞を冠したモンスターは2体います。

  • @Irix.5674
    @Irix.5674 ปีที่แล้ว +14

    自分も違いをちゃんとは理解していないから説明ができないんだけど
    文字コードとエンコードは別物なのに混同されて一緒くたに
    扱われることが非常に多い。
    UTF-8 や Shift_JIS はエンコードで正確には文字コードではない。
    UTF-8 は文字コードである Unicode のエンコード方式のひとつ、
    Shift_JIS は文字コードである JIS コードのエンコード方式の
    ひとつです。

  • @mudaso-heavy-user
    @mudaso-heavy-user ปีที่แล้ว +14

    楽しみに待ってました

  • @りゅう-g1e
    @りゅう-g1e ปีที่แล้ว +18

    ドラクエの「ク」は初代には無い文字で、ダークドラゴンをダースドラゴンとして登場させたのは有名な話ですね。

  • @和歌山みかん-z7p
    @和歌山みかん-z7p ปีที่แล้ว +35

    ISO感度はISOの初期の規格であるISO100に基づく規格なので関係あります

  • @じゅっぱ-v4j
    @じゅっぱ-v4j ปีที่แล้ว +37

    幽霊文字の回楽しみすぎる…。漢字字典(≠漢和辞典)読んでると定期的に語義未詳の字が出るし、それがUnicodeとかでも起きるのは結構自然な結果でもあるよなぁ。幽霊文字クリシェはきっと折り目が線に見えた妛とか誰もミスの原因をしらないという彁とかかな?

    • @人生パラドックス
      @人生パラドックス ปีที่แล้ว +4

      Unicodeは、2バイトコードと4バイトコードがある。
      アラビア文字は、4バイトコードで表現し、日本語は、2バイトコードで表現している。

    • @kumamushi3
      @kumamushi3 ปีที่แล้ว +1

      予想通りでしたね!

  • @tenrai3065
    @tenrai3065 ปีที่แล้ว +17

    半角カナの呪縛とか、EBCDICやEUCとか、shift-JISはなんでシフトなのかとか、コードページってなにとか、最初の文字コードは5ビットだから32文字だぜとか、超漢字ってあったよねぇとか、文字コードのネタはそれだけでチャネル作れるほどありそうです。

    • @Q0rx5kn5oSE
      @Q0rx5kn5oSE ปีที่แล้ว +3

      ゆる文字コード学ラジオ待ったなし

  • @Konata_Love17
    @Konata_Love17 2 หลายเดือนก่อน +1

    2人とも想像が膨らみすぎて色々話が脱線するの好き

  • @fx-702p
    @fx-702p ปีที่แล้ว +10

    「包摂基準」は「包摂規準」と書くべき、みたいな話をJIS漢字の委員会の人が言ってた気がするんだけど、ずっと混用されて続けてる(総務省や法務省も基準を使ってる)。

  • @よしだ-g8v
    @よしだ-g8v ปีที่แล้ว +2

    5:58
    「ぬ」要らない言うてたのにぬるっとしちゃう堀元さん

  • @ファタス
    @ファタス ปีที่แล้ว +12

    Bと13では、鋼の錬金術師のお話に、存在しないはずの13号倉庫がある!?→昼見に行ったら実際はB倉庫でペイントされたBが1と3の組合せみたいなフォントで夜暗かったせいもあって、13号と勘違いしたってオチの話があったはず

    • @senkobayashi1307
      @senkobayashi1307 ปีที่แล้ว +4

      ありましたね、単行本のおまけに入っていた気がします

  • @koi506
    @koi506 ปีที่แล้ว +10

    文字コードが同一でもフォントによって文字が違うことはあり得ます。
    主流のアウトラインフォントではあまり見られませんが、ビットマップフォントではあえて嘘字を作成することがあります。
    ドット数の限界を超えた画数に対応できず、見た印象で漢字を識別するという区別のしかたをしてもらうためです。「感字」と呼んでいました。
    旧字でも新字でもない「そのフォント以外無い漢字」を表示するので、字を調べる用途では注意が必要です。

  • @PhodraX4
    @PhodraX4 ปีที่แล้ว +12

    10:35 吐噶喇の喇を説明するのに喇叭を例示してるのに喇叭の喇を説明するのに吐噶喇の喇って言っちゃうの実に水野さん

    • @Aros417
      @Aros417 ปีที่แล้ว

      循環参照だ

  • @JackieMatthews610318
    @JackieMatthews610318 ปีที่แล้ว +1

    32:29 今、堀元氏と全く同じ反応してから、1933(昭和8)年に弁理士資格取った父が言ってたことを思い出した。当時ガキンチョだった私には何のことやらさっぱりわからんかった。「弁理士とはな、弁護士と違って『ことわり(理)をわきまえる(弁=辨!)』仕事なんだ」…その後「弁護士は喋るばっかり」とか謎のdisりをしていたのも「辯」からだったのか…と、多分半世紀弱ぐらいで初めて納得しました‼️
    ちなみに父、早稲田大学政治経済学部卒。ソニーの創業者、伊深大氏と同窓だったとよく自慢しておりました。

  • @furusatonotkokyou
    @furusatonotkokyou ปีที่แล้ว +5

    30:11
    常用漢字の中でも、後から追加された「遡」とかは常用漢字でも点2個ですね

  • @やまけん-x1n
    @やまけん-x1n ปีที่แล้ว +4

    トカラ列島は十島村ですね。
    日本で1番長い市町村だったり、日本で唯一領域外に役場あがある市町村だったりと雑学に事欠かない土地です。

    • @やまけん-x1n
      @やまけん-x1n ปีที่แล้ว +1

      領域外に役場がある市町村は他にもあった・・・

  • @ellnore_pad
    @ellnore_pad ปีที่แล้ว

    北海道出身にして現役プログラマーである俺得回。
    そして、お二人の切り口が自分にはない視点からの切り口で、国際通貨某のワイルドカード的な記号に対して「単語と同じだね」って言う話に繋がったのが凄く面白くて新鮮だった。
    ちなみに「おささる」とか「おささっちゃう」はある程度否定的なニュアンスというか、不都合であるみたいな意味合いが含まれてることが多く、
    「押すつもりはないのに(構造上の欠陥とかで)意図せず押してしまう」みたいな時に「(押そうとしてないのに)押ささっちゃうんだよこれー!!」とか言いますね。

  • @たらんぽす
    @たらんぽす ปีที่แล้ว +2

    毎回堀元さんの「○○さる」がそれで合ってるか...?ってなっちゃう...
    人に説明する時は
    「○○さる=○○できる」
    or
    「自分の意思・行動とは反して起きてしまうこと、自分が無関係なことを言いたい」と言ってます。(これで合ってるか分かりませんが)
    「コントローラー握った時にボタン押ささっちゃってさ〜」
    だと
    「コントローラーを握った時に、(押すという意思は無かったが結果)押してしまった」
    的な感じになります。
    よく使うのは「書かさる(さらない)」
    「このペン書かさんないなと思ってたけど、紙にグリグリやってたら書かさったよ」

    「このペン(自分の行動とは関係なく)書くことができない状態だったが、紙にグリグリしてたら書けるようになった」
    「○○さる(さらない)」は自分の行動と関係なく最終的に起こったことを言っている感じがするので視点?が自分ではなく物にあるのかなあ?という感じがします(学がないのでこれで正しいか分かりませんが)。
    「洗濯機に服入れる前にボタン押ささった」
    だと、気付かずに押したわけではないんだなという感じがします。逆に
    「洗濯機のボタン押ささんないな」
    だと実際にはポチポチ押しているんだなという感じがします。

  • @田中舘
    @田中舘 11 หลายเดือนก่อน +1

    自分は青森出身で「〜〜ささる」を「〜〜しようとしていなかったはずが、なぜか〜〜してしまう」という意で使用ささるのですが、これは「〜〜を自然にしてしまう」の応用と考えました。

  • @KIKKOMANamawa
    @KIKKOMANamawa ปีที่แล้ว +5

    以前コンビニでバイトをしていた時、住所の代筆を頼まれたのですが
    「岐阜県揖斐郡」って普段書かない漢字ばかりで手に汗握った思い出があります

  • @Bisco-le1rt
    @Bisco-le1rt ปีที่แล้ว +10

    ダルい駄菓子屋のおばちゃん「はい、じゃあおつり30万¤!」

  • @24852
    @24852 ปีที่แล้ว +14

    私の年収は¤0です。
    これでうまく誤魔化せたな。

  • @maruneko35
    @maruneko35 ปีที่แล้ว +3

    待ってました。絵文字や異体字セレクタのややこしい話が出てくることに期待。

  • @tatsutakaraage2662
    @tatsutakaraage2662 ปีที่แล้ว +16

    6:00 あーここほんと面白いw
    コンビ芸なんよw 円熟味増してるわーw

  • @yoshi46-319
    @yoshi46-319 ปีที่แล้ว +14

    文字コード制限で、いまも影響が残っているのは円記号とバックスラッシュの問題ですね。windowsのフォルダの区切りが円マークなのは見にくいと個人的には思います。ちょっと話は違いますが、波ダッシュも話がややこしいですね~。

    • @ぱわふる-e6z
      @ぱわふる-e6z ปีที่แล้ว

      アスキーアートをロゴにしてるツールとかも、ロゴが円マークだらけになって悲しくなるよね

    • @masuo64
      @masuo64 ปีที่แล้ว

      波ダッシュ、win7だかwin8で打たれたテキストだと、未だに変なフォントになるのに、打った本人は気づいてないんですよね。

  • @hykathon
    @hykathon ปีที่แล้ว

    33:25 サロゲートペアの話への布石ですね。
    こういう伏線を見つけるとワクワクしますね!!

  • @ameatokua
    @ameatokua ปีที่แล้ว +5

    ゆる言語学ラジオの内容が入ります。 27:1033:49
    水野さんの話が面白いので、聞き入りますね。

  • @jyozu
    @jyozu ปีที่แล้ว +4

    ファミコンが若い人にも知られていたら、導入で伝えようとしていた
    収録できている文字のイメージがつきやすいんですけどねぇ。

  • @あるテューバ吹き
    @あるテューバ吹き ปีที่แล้ว +7

    𦚰(肉月に刀三つ)を脇(肉月に力三つ)と間違われるとご先祖様に申し訳なくなるので本当につらかったけどJISレベル4で収録されて歓喜したことは懐かしい。

  • @ツグミヤトラ
    @ツグミヤトラ ปีที่แล้ว +9

    祖母が祖父のことを「お父さん」と呼ぶのを「じいちゃん」でしょ!って訂正してたのを思い出した

  • @----___----___----___----___--
    @----___----___----___----___-- ปีที่แล้ว +13

    International Organization for Standardization の略ならIOSやろがいと思ってググったら
    明確な由来がなく、私が世界統一した際は滅ぼそうと決めた

    • @francescogatti3002
      @francescogatti3002 ปีที่แล้ว +2

      iOSが世界を席巻すると未来予知したのかもしれない。

  • @haine102
    @haine102 ปีที่แล้ว

    「ぬるぬるとか言えなくて良い」の後にさっそく「ぬるっと」って言い出しちゃう堀元さん。

  • @TokumeiResearch200X
    @TokumeiResearch200X ปีที่แล้ว +3

    最近はsjis(≒ms932)とUTF-8とUTF-8(BOM)くらいを気にすれば良いけど、古いものだとEUC-JPとか気にしたりしてましたね
    あと文字コードのこと調べてると英語圏の人が文字コードの事なんも考えてないんだろうなと思うことがよくある

  • @hy7207
    @hy7207 4 หลายเดือนก่อน +1

    19:48 実は中国元も円マークです。

  • @roadevery9434
    @roadevery9434 ปีที่แล้ว +4

    さらに合流した弁の字は元々は違う字としてあったと言う話もありますね

  • @atsushigrizlupo8479
    @atsushigrizlupo8479 ปีที่แล้ว +1

    「この文字とこの文字は同じである」と判断する仕事は本当に面倒です。
    「これはデザイン差なので同定してよい」とかいう言葉が飛び交います。
    ちなみに総務省の包摂基準はけっこう緩いです。

  • @tenkawakiirobou
    @tenkawakiirobou ปีที่แล้ว

    やっと来た!楽しみに待ってました

  • @murayan68k
    @murayan68k ปีที่แล้ว +6

    ドルとポンドは当時から基軸通貨としての立ち位置があったので独立させたほうが都合良かったとかじゃないのかな

    • @francescogatti3002
      @francescogatti3002 ปีที่แล้ว +1

      その理屈だと円も必要やろ!ってなりそうな。円も強かったんやで、今じゃ考えられんが。

    • @ねじまきどり
      @ねじまきどり ปีที่แล้ว

      ASCIIが制定されたのは1963年、
      そのISO版が数年後くらいじゃなかったっけ。
      まだ円が強い時代じゃなかったよ。
      JISコードだと0x5Cに\の代わりに¥が
      割り当てられていていろいろ不便だった。

  • @halyur33
    @halyur33 ปีที่แล้ว +2

    このチャンネルでプロジェクトヘイルメアリーに出会い、火星の人を絶賛読書中の私には文字コードの話題はめちゃめちゃタイムリーです
    ちなみに道民ですが、【押ささる】は
    ・つい押したくなってしまう
    よりもどちらかというと
    ・(誤って手が触れて)押してしまう
    の方がニュアンスちかいかな~と思ってます

  • @メタ物
    @メタ物 ปีที่แล้ว +8

    文字コードにないエピソードで、声優の朴璐美さんの璐が出せないから王路で代替しているのをよく見かける。

    • @passute
      @passute ปีที่แล้ว

      野球好きなら
      李承燁の火へんに華とか
      李机浩の木へんに凡とか
      そういう話かな

    • @_tatibana1243
      @_tatibana1243 ปีที่แล้ว

      鬼滅の刃のネズコも字が出せなくて代替しているのを見ましたね。
      鬼滅ファンから誤字として指摘を受けるのか。名前が出る全ページに※で注釈が付いていた

  • @bicks123
    @bicks123 ปีที่แล้ว +3

    昔QuizKnockのチャンネルで、「東大生なら文字化けしてても読める」ってやってましたね。

  • @HigashiJuicy
    @HigashiJuicy ปีที่แล้ว +2

    地元の新潟では「タオルなど長めの布などの先端が、地面に引きずられている」という現象を【しびいている】と言っていました。
    標準語にはこの言葉が存在しなくて困る

    • @haine102
      @haine102 ปีที่แล้ว

      ポケモンの細長い電気タイプのシビ◯◯ってそれもかかってそうだな

  • @h.t3996
    @h.t3996 ปีที่แล้ว +1

    文字コードって昔からいろんな種類があった。
    半角
     BCDコード→ASCIIコード(Unix、PC)
          →EBCDICコード(IBMなどのメインフレーム)
    全角(日本語独自規格)
     ASCII系→Shift-JIS(PC)、EUC(Unix)
     EBCDIC系→IBM漢字、JEF(富士通)
    世界共通
     UTF-8
    異なる文字コードの場合は必ず文字変換を行い、変換不能な文字コードがあると文字化けします。そもそも文字コードを間違えてファイルを開くと文字化けしまう。
    初期の頃のメールで半角カタカナが文字化けしたのは、PC側がShift-JISでメールサーバがEUCだったためで、Shift-JISは半角カタカナを1バイトで割り当てているのに、EUCでは半角カタカナが2バイトで割り当てられていました。今はメールサーバがUTF-8なので、Windows側がShift-JISでも半角カタカナの文字化けはなくなりました。
    文字コードの中には改行コードもあります。OSによって改行コードも変わるので、エンジニアをしているとトラブル対応の際に改行コードも意識します。

    • @michihirokabata2519
      @michihirokabata2519 ปีที่แล้ว

      昔の半角カタカナ等の文字化けは、iso-2022-jp (いわゆるJISコード)で送ると宣言していながらそれに定義されていない文字を使うからで…
      最近はメーラーのデフォがUTF-8だから化けてないけど、iso-2022-jpで送れば化ける可能性があります。

  • @takpon9261
    @takpon9261 ปีที่แล้ว

    これ期待してた、超待ってた

  • @zr258
    @zr258 ปีที่แล้ว +2

    データベースの回で、「朝涼」とかの項目名をすべて番号づけるための表を別で作って、本体の表には番号の数字しかないっていう状態が、今考えると文字コードに似ているな、と。

  • @tambaren
    @tambaren ปีที่แล้ว +2

    ドラクエの世界で出てくる、アレフガルドという地名は
    パッケージで説明されるけど、アとフが収録されてないせいでゲーム中では言及されない

  • @Liggy1020
    @Liggy1020 หลายเดือนก่อน

    直角の直とか
    広島県呉市の呉とか
    同じ文字でもフォントセットが日本語か中国語かで
    同じ字であるはずなのに形が違うものが表示される字ってあるよね。

  • @火星の人-s2r
    @火星の人-s2r ปีที่แล้ว +7

    中国では「¥」は人民元を表します。中国出張後の旅費清算では注意が必要です。

    • @早川眠人
      @早川眠人 ปีที่แล้ว +6

      RMBやJPYで明示しましょう

    • @atsushigrizlupo8479
      @atsushigrizlupo8479 ปีที่แล้ว +1

      私の年収は¥100万しかありません。

  • @ぽいむぽいむぴぴむ
    @ぽいむぽいむぴぴむ ปีที่แล้ว +2

    弁当の弁は「配膳する」から分けるの意味の「辨」みたいですね。

  • @クララ-d2k
    @クララ-d2k 4 หลายเดือนก่อน

    繧繝は繧繝模様、畳の繧繝縁の時しか使わない気がします。暈繝でもよいはずです。

  • @gorotlavis2495
    @gorotlavis2495 4 หลายเดือนก่อน +1

    Bと13のくだりはアニメ版のハガレンの怪談話回で見たことありますね

  • @ゆうた-m4e
    @ゆうた-m4e 5 หลายเดือนก่อน

    ドラクエの容量削減の逸話だと、「ダースドラゴン」の一件があります。
    本当は「ダークドラゴン」としたかったところ、容量削減のために、ストーリー進行に問題がない、片仮名の「ク」を削除したらしいです。

  • @pozo20
    @pozo20 ปีที่แล้ว +4

    最近知った、洗浄は洗滌と書いてで"せんでき"と読んだけど"せんじょう"と読まれる事が多く滌が常用漢字に入らなかったため、洗浄と書かれるようになったとか
    漏洩はもともと、ろうせつと読むけど曳の"えい"にひっぱられてろうえいと読むとか
    は関係ないですね

  • @Twilingal
    @Twilingal ปีที่แล้ว +1

    「押ささる」は便利

  • @yt-system1372
    @yt-system1372 ปีที่แล้ว +3

    辻とか樋口の「樋」は、戸籍上明確に別字と扱われ、圧倒的に一点之繞の方が多いと思われますが、これを電子媒体で表示できない(CSSでfont-variant-east-asian:jis90;を指定してやればWEB上の表示はできますが)のは、非常に問題だと思います。斉藤の「斉」渡辺の「辺」は、非常に多くの字体が別字として扱われることに比べると非常に不合理を感じます。

    • @早川眠人
      @早川眠人 ปีที่แล้ว +2

      IVSの異体字セレクタU+E0100〜U+E01EFを使いましょう

    • @yt-system1372
      @yt-system1372 ปีที่แล้ว

      @@早川眠人さんありがとうございます。いろんなサイトで調べてみましたが、なかなか難しそうです。使い方をやさしく解説したページをご存じでしょたらお教えください。

    • @早川眠人
      @早川眠人 ปีที่แล้ว

      @@yt-system1372
      「IMEパッドで異体字セレクタを利用する」でggr

  • @Y.M_archive
    @Y.M_archive ปีที่แล้ว +1

    13:30 サーティーワンアイスクリーム?

  • @いあ158
    @いあ158 3 หลายเดือนก่อน

    通販での贈答品の熨斗を作る仕事をしたことがあって、コードにない特殊字を手書き(絵)として数種類、その個別のPCのみに覚えさせて印字できるようにしてたのを思い出しました。今だと1字だけオリジナルフォントを作る感じでしょうか。あと「辻」も悩まされました。お客様に手書きで文字を書いていただくのですが、点一個なのかどうなのかとか、そもそもお客様が違いを認識しておられない場合どうするのか?とか勝手に変えてしまってクレームになるとマジでややこしいので。。。渡「辺」もや「斉」藤もややこしいですがこちらはお客様自身が文字の違いを理解してる場合が多いのでまだマシでした。

  • @showUmiracle
    @showUmiracle 5 หลายเดือนก่อน +1

    24:22 アフォーダンス九大プレ模試で出た‼️一般語彙とは言わせない‼️

  • @moonsnowknight
    @moonsnowknight 6 หลายเดือนก่อน

    漢字は字体が問題になるけれど、実はアルファベットにも字体の違いがあってこちらはグリフ(?)の違いとして扱われていますね。小文字aに角のあるものとないもの、gがめがねのレンズ2つになっているのと、1つのもの…。
    漢字の書体字典なんかみると、同じ漢字なのに少しずつ異なるものがいくつも並んでいます。時代や地域あるいは人によって形が異なっていたのでしょう。康煕字典で字体を統一したことがあったようですが、これは印刷用に造られた字体に思います。書道やってる人は気づくと思うけれど、筆で書くときは少し変わった形なることがありますね。
    しんにょうが1点か2点で意味が変わることはないので同じ字としてもいいと思うのですが、漢字の簡略化なんかの歴史が関係してきて基準を決めにくいのでしょうね。

  • @shindy_jp
    @shindy_jp ปีที่แล้ว +2

    ペアルックっぽいことに気が取られて内容が頭に入ってこない!

  • @ツチノコ情報館
    @ツチノコ情報館 3 หลายเดือนก่อน

    ドラクエの話題で言うと後発のRPGである桃太郎伝説は「きんぎんパールプレゼントのオニ」というギャグキャラを出したいが為に容量が倍になったという逸話があります。

  • @keisukesugi5085
    @keisukesugi5085 ปีที่แล้ว +1

    弁のほかにも芸とかも合流してますね

  • @user-pi1er7zx3m
    @user-pi1er7zx3m ปีที่แล้ว

    13:12 なんだその認識あったのかという驚き

  • @user-pi1er7zx3m
    @user-pi1er7zx3m ปีที่แล้ว +2

    辯、お前どっかで会ったことあるな…?
    あ、弁髪の弁だ!!と思ったけど弁髪の弁は辮でした。
    誰だお前!!

  • @furusatonotkokyou
    @furusatonotkokyou ปีที่แล้ว +2

    8:26
    葛の下の方の形違うのは、旧字体・新字体じゃなくて異体字じゃなかったっけ…?

  • @呉羽誠司-l6b
    @呉羽誠司-l6b ปีที่แล้ว +1

    昔のPCは第二水準漢字ROMが別売りとかあったな。懐かしい話だ。

  • @subratte256
    @subratte256 ปีที่แล้ว

    28:18 スペルチェックは含まれますかね?

  • @haine102
    @haine102 ปีที่แล้ว +1

    言語が理系っぽくて、文字コードが文系っぽい逆転現象。

  • @user-pi1er7zx3m
    @user-pi1er7zx3m ปีที่แล้ว

    24:15付近
    「押ささっちゃう」に限れば「つい押したくなる」とかで文字コスト大して変わらず変換出来ない?と思うけどネイティヴにとっては違うのか?

    • @user-pi1er7zx3m
      @user-pi1er7zx3m ปีที่แล้ว

      あと「押ささる」を「自分のせいではないけど押されちゃう」的な意味だと理解してたから、「押ささっちゃう」だと「ちゃう」の重複みたいな感覚にならないの?と変な疑問が湧いた。

    • @user-pi1er7zx3m
      @user-pi1er7zx3m ปีที่แล้ว

      それから「声に出して読みたい日本語」って「声に出ささる日本語」ってこと?
      あれ?声に出すだっけ口に出すだっけ?
      ん?声に出すにせよ口に出すにせよこの時の「に」って何の用法の「に」だ?

  • @his58enc8odk310
    @his58enc8odk310 11 หลายเดือนก่อน

    13とBの話はハガレンで似たような話を扱った回があったな。
    軍の倉庫で存在しない13番倉庫が現れる噂があったけど、Bがデザイン上、1と3に見えただけだってやつ

  • @tatsuaki.takahashi
    @tatsuaki.takahashi ปีที่แล้ว +3

    Zをパージしてしまうと Zamenhof の回が作れなくなってしまって困るのでは? > 水野さん

  • @マイくれ
    @マイくれ ปีที่แล้ว

    29:41 肉と宍、裏と裡なんかも同じものみたいな

  • @HashimotoHobbyCh
    @HashimotoHobbyCh ปีที่แล้ว

    文字コードのISOもカメラのISOもディスクイメージのISOもキーボードのISOも会社が掲げてるISO14001?とかも全部 国際標準化機構ですよー。

  • @anjiros
    @anjiros ปีที่แล้ว +1

    6:00 サンドウィッチマンばりの掛け合い

  • @ねこ-x3j
    @ねこ-x3j 10 หลายเดือนก่อน

    「おささる」についてですが、積読チャンネルでチャン(堀本)さんが紹介されていたテッドチャンの小説、予期される未来に出てくるランプが光ったら1秒後に必ずボタンを押してしまう玩具に当てはまりますね。
    でも現実で自分の意思とは関係なく行動してしまうことって?と思うので、道民の方はどういうシュチュエーションでこの言葉を使うのかすごく気になります。

  • @user-pi1er7zx3m
    @user-pi1er7zx3m ปีที่แล้ว

    30:29 「文字コードの世界では一緒」34:27 「同じ文字コードに対応している」が具体的にどういうことなのか、もう一足踏み込んだ説明が欲しかったかも。
    「フォント毎にどちらかの字形が充てられる」ということ?
    文字コードが同じか違うかに何の意味があるのかが示されていないような…聞き逃し?常識無さすぎるだけ?

  • @gunhasirac
    @gunhasirac ปีที่แล้ว

    中国語学べばこのチャンネルの考察の深さ10倍深くなりそう、と弁の話面白がりながら思った

  • @あるテューバ吹き
    @あるテューバ吹き ปีที่แล้ว +2

    Bと13は金田一かコナンかぬ~べ~で見たことある気がする。