ขนาดวิดีโอ: 1280 X 720853 X 480640 X 360
แสดงแผงควบคุมโปรแกรมเล่น
เล่นอัตโนมัติ
เล่นใหม่
这一期的时长和工作量,都是1期堪比3期长。而且为了尽量简明,在视频做出来后,我们还忍痛删了2分多钟已经做好的片段......总而言之,希望能通过这样的方式,给大家简明、清晰地讲清楚关于文字显示和乱码的原理。如果你喜欢本期视频,记得给我们点一下订阅和喜欢,真的做累死啦_(:з」∠)_
删了2分钟?别啊,做个导演剪辑版另外放出来呗
这期很牛逼
這一期真的很厲害
太不容易,幸苦了,又学到了新的知识
我就说怎么割了这么久😋
超级喜欢那一句:“就把乱码当作是计算机发展史为我们所绽放的一朵朵烟花吧”
覺得麻煩了點就.....(笑
大疵花
紅色按鈕的那種嗎?
@@laughlife6827 密码是六个0那种
觉得麻烦也是放大呲花😅
作為資工領域,不得不說真的做的淺顯易懂
那是,重點是剪輯更是到位
不要太自以為是了
@@RE-xv5sr閣下是什麼領域
这期视频做的太棒了!!!我一直很困惑为什么会有这种中文乱码😂不知道怎么感谢你们,就送你们一首诗吧!锟斤拷�⊠斤拷�⊠锟拷�⊠锟斤�⊠锟斤拷共勉😎吕严中尉!
😂
手持两把锟斤拷 口中疾呼烫烫烫 脚踏千朵屯屯屯 笑看万物锘锘锘
@@百合仙子 怎麼解的?
@@dasing2 你应该能直接 google 到解释(这诗是我道听途说来的)。简单来说后几个是 Windows 中文编程时容易出现的东西。
我就知道有这个@@百合仙子
06:00 說錯了, 電腦中文漢字在當時80年代, 由 IBM 台灣子公司主導和倚天等台灣本土其他公司合作下, 將原本 DOS 加入中文和各種文書處理應用程式. 當時台灣的字碼叫 BIG-5 (CP950), 日本就使用 NEC PC-9801 DOS/V 為主的 JIS因BIG-5 由台灣商業主導, 很多異體字,舊字,俗字和非常用字都沒有, 最後要由其他海外國家(如香港,星馬泰) 自行追加(海字集)作BIG-5 碼的補充.因80年代大陸因沒有相關標準, 直至80年代後期,由當時大陸政府, 要求 Microsoft 幫助 使用當時唯一大陸使用的GB2312中文電碼, 所以第一套正式支援的簡體中文系統, 要在 Win3.1 才正式出現.後因大陸商業使用發現文字量不足夠, 再修改擴充為 GBK, 但因大陸官方規定只能用 GB2312, 導致身份證明文件電子化時, 很多人被自願改姓名.
不明觉厉
不是說錯,是不可以辱華,明講台灣比中國發展的早。
@@b116310 笑死,各種自古以來為起手式的共共無法接受😂
都特別說 "中國台灣"了,一切說到台灣任何優點的 都會被模糊化吧~但是謝謝你的補充~讓邏輯更完整~
@@HanShengLai 问题是,台湾后劲不足。。而且,台湾所谓的“正统文字”,也有严重问题。
目前看過解釋最清楚的動畫,製作一定很辛苦!不過還是有個小錯誤。Unicode最初對待漢字的確是把不同寫法的字全部整併成一個編碼,但實際應用大有問題,各地漢字書寫差異太多,也有新舊寫法的不同,如果全部都統一編碼會造成不同地區的人閱讀時可能被迫使用非本地的文字外觀,或是沒辦法呈現文字的新舊標準,所以後來編碼就改用Han Unification Rule把不同外觀的相同漢字全部拆開編碼
比較麻煩的是字體上因為同一個編碼,導致會顯示出不正確的寫法因為重複性高,很多中文字體本身自帶日文,或是日本字體自帶中文結果編碼共用字體顯示的寫法也不是該國正確寫法了
其實漢字的原理去細分那些寫法的不同是很沒意義的。那些細部的差別其實根本是美術字型不同的程度,連異體字都算不上。
@@g863210xie 舉些簡單的例子傳統漢字固有寫法已存在差異的像是群羣、裡裏、曹曺、夠够、麵麪、館舘、為爲、線綫、畫畵、並竝日本新体字和中國簡体字存在差異的例子像是実实、変变、庁厅、図图、辺边以上這些都是相同文字在各政權的不同書寫標準,要說是異體字也算不上,但讓學A版本的人去適應B版本的書寫標準又覺得隔應,如果只能共用相同字符,那要套哪種標準才能維持中立並忠實記錄傳承?又如何記錄漢文歷史上的各種文獻用字差異?
@@g863210xie錯誤,因為當地人真的不是這樣寫,你在日本當地用台灣寫法是會被當成寫錯的,他們自成的教育體系也都有規定筆畫怎麼寫只是unicode終究是歐美體系主導的編碼所以對於漢字重視程度沒那麼高(另一方面當然漢字太多也是原因,不過萬國碼總字符本來就超多了我覺得漢字也只是其中一小部分而已
@@Dark-M-Snake 其實對看久的人來說是書寫差異,日本人就有毛病糾結,你不去特別學日本漢字他也不會管你,漢字種類形式繁多,很多時候是書寫習慣的派別,在意那一筆一劃的彎曲程度,不如去在意部首有沒有正確,日本人很死板的10月11日下午5點交作業就只能10月11日下午5點,先做完提前交不行,提前10分鐘不行,叫他講原因不知道,還不如現在計算機勒,問日本人看不看的懂點頭,那看得懂就好了糾結什麼鬼青和⾭臺灣人都沒很在意了,覺得兩一書寫一篆刻或電腦顯示字符,大篆小篆裡一堆也大小不一,字型骨架對就好,反正本來日本漢字本來就是表意用,有閒功夫去在意字型,不如學日本早期去翻譯長到爆的英文單字
这期的科普视频终于解决了我十多年以来的困惑🤣
看了这期视频之后,突然觉得公制和英制两套单位也没那么混乱了
习惯问题
@@dodomakudo1783 英制的進位問題確實麻煩 習慣用也不會喜歡
@@OwO-meow-UwU 就跟现在的乱序键盘一样……用习惯了没啥感觉……
文字乱码我可以忍,但是为了人类发展,请大家看到用英制单位的人就像往它嘴里灌翔。再把它头打爆。
突然想到當年秦始皇統一了
大推! 這主題只要有被電腦亂碼搞過的一定都會覺得超有趣的
這集真的太有料 辛苦柴知道的各位了
這麼優秀的影片,製作團隊實在是太厲害了講解幽默,原理簡單易懂動畫也毫不馬虎五體投地尚不足一表我的敬佩之意
五体?你的其他物件呢?
很有意思!
作为科班出身的同学,非常感谢你们做出这期视频,我已经不下N次在工作中要向不同的部门说明文件保存的编码问题以及在页面写上一堆跟业务毫无关系的编码提示,仍然避免不了有些同事的【编码病】。甚至于打算跑路考公,试题里面居然还会在不提供具体编码集的情况下问我一个中文字符占几个字节,问我是1个,2个,还是4个,6个。我很想大骂一句把8个的选项或者直接来个E钝角的选项塞出题人嘴里。然而这种误解根深蒂固,当我向多年的好友吐槽这种情况的时候,好友说【肯定是占2个啊】。😊😊😊😊😊😊😊😊现在他坟头草两丈高了
繁體這邊對GB碼比較不熟悉我們都是用大五碼BIG-5所以那個錕斤拷 今天我也是第一次見
我想到一个好办法,我们可以用一个小棍,蘸上黑水,在一个白色的平面物体上把这些文字画出来,这样不管拿给谁看都不会出现乱码了。
這樣不就點陣化了嗎?不如用白紙。
@@oishibaking 我想白色的平面物體應該就是白紙。
🤣png
图画也是編码吧?还是说不是?
那怎么做字体,每有一种字体就画一张画吗?怎么定义这个画的分辨率?怎么方便信息交换?编码编码就是为了方便电脑处理减少存储带宽成本才出现的东西
終於解開20多年來的"外星文"之謎_很用心製作的一集_加油鼓勵_讚!!
這集真的很足料😎😎😎😎讚啦
辛苦了 這期真的做得太好了
柴知道太棒了!永遠支持柴知道!
写过c 的人都会遇到过著名的”烫烫烫…”,据说有人看到这个乱码惊慌的拔掉了计算机电源🔌 😂
用c處理字串真的是惡夢
烫烫烫烫。。。屯屯屯屯。。。
道理上没错,毕竟0xCC和0xCD在x86里的定义差不多都是终止当前程序的意思,所以CPU遇到这些就直接让程序闪退了,可不是烫烫烫嘛(强行解释
錕斤拷錕斤拷錕斤拷
手握两个锟斤拷,口中直呼烫烫烫(
這期很棒! 加油呀!
補充一點,台港澳地區在用的繁體字編碼叫BIG-5,大陸網站載來的軟件就常常無法正常顯示作為一個碼農,每每要編譯C語言程式時,還得換編碼真挺麻煩,偏偏微軟就選BIG-5編繁體中文哎呀python真香
BIG5是不是看起来像韩文一样,字之间插空格一样?
@@mmorpgfans 用BIG-5看UTF-8的時候會出現很多生辟字或框框,其他我就不清楚了
可是python對於文件的編輯和儲存會使用ANSI也就是系統預設.....明明他自己的程式碼.py只允許utf-8然後就導致github上面有些python寫的軟體,存取設定檔會有亂碼問題,非常優秀
谢谢,这的确让我们更加明白了字符集编码,作为业余编程爱好者,算是第一次这么系统的知道字符集编码!
"這題我會" 好可愛😂
这期做的是最好的一期❤
非常好的視頻,感謝團隊的努力。 能否再出一集關於使用者平時輸入時需要注意的地方,及遇到亂碼時如何應對呢。
繁體古早bif5大五碼,微軟擴充叫CP950,也不是UTF8解。寫python 踩過坑。另外,英文還有一個UTF7的也很坑,跟預設的UTF8差一丟丟,幾乎正常解但就是幾個拉丁美洲字母會出亂碼。以上都血淚史。
手持两把锟斤拷,口中疾呼烫烫烫。脚踏千朵屯屯屯,笑看万物锘锘锘。
我太喜歡生僻字,甚至我每天使用幾些𱁬𪚥或者有趣的漢字。每次打字就候遇到這個“�⊠”的問題哈哈
这期节目太棒了!!!感谢柴司!!!
第一次看你們的影片,看一半就讓我訂閱了。感謝分享。
这期的质量好高,我看得非常认真。
因為演算法知道這個影片因為這個影片訂閱了這個頻道🤣很喜歡這個影片,內容非常有趣謝謝柴~
感谢~
整部影片的圖示動畫真的超專業,有夠厲害
这期视频真的是干货啊太赞了
计算机专业人士给你点赞啦😜
回復“文字編碼”即可獲得錕斤拷一份
烫烫烫!!!!!!
口口口口
美味锟斤拷?
原來是這樣啊!學到了,這邊能不能看到最後片尾所説的文本啊?也想知道那些因爲篇幅沒有放進去的小知識
柴知道这期做得很详细,棒!
这集很棒!干货不少
論锟斤拷信息崩塌,與量子糾纏波函數坍縮之關係:不打開文件箱子,你不知道其中信息或貓是死是活.
清晰易懂,太感謝了。
加強訓練,自我提升早晚有一天能從一堆錕金銬中看出原始內容
小时候在盗版横行的网络蛮荒年代,南极星属于是电脑必装软件之一了
哇喔,這真的是太讚了,不枉費我在凌晨2點打開他
做得非常好,很淺顯易懂! 我之前有段時間做mod就想了解這個UTF-8是個啥,後來花了很多時間勉強懂了個皮毛,看完影片後總算有了個大概的了解! 非常感謝!
1.記事本那段,是微軟及各家自己的程式不用unicode的方式編碼,2.win7亂顯示那段,是記事本程式設計不良問題(自作主張亂猜編碼)和語言無關,要罵的是各家軟體公司
解释的简直太清晰了!感谢
厲害 感覺得出來 你們已經盡力 用簡潔明瞭得方式 說明了 文字輸入 與遇到得問題
中国台湾在哪里我地图找不到这个区域
柴司最高 超愛你們的影片 超優質❤
很棒 鲲斤铐
2天后 回来感谢柴司 因为你们做了这一期视频,使我一个不懂网页代码的人知道如何把我那个下载的本地网站乱码改好。现在我已经可以正常的浏览那个网站了,非常感谢。再也不会�了。柴司最棒了,龙图图小姐姐最棒了, 老板最棒了。
做得很好,虽然很多专业术语听不懂 但看得出来找了很多资料 有用心
第一!昨天在微博看了视频,今天再看一次。(❤ ω ❤) 柴柴
烫烫烫这个和 vc 调试有关,在 debug 时,编译器在进入一个函数时,会把位于栈上的缓冲区都先给用 0xCC 填充了(同时 CC 又是 INT 3 的机器码),这样如果有一个字符串变量没有被初始化的话,在调试的时候就会看到它在 IDE 里被显示成了 “烫烫烫...”。这是因为烫的 GBK 编码为 CC CC。
是台灣,不是中國台灣。你去台灣是要乘搭國際線、要簽證的。
@21-gi1ex 無所謂,但來台灣記得帶簽證
那個猜猜看真的笑死我了XD我就真的把最常用的那幾個全部試一遍才開的了。
我以前在印刷店工作也會遇到,因為附近很多學校,然後就出現一些學生沒轉檔導致版面跑了,甚至亂碼的情況,也有明明螢幕看沒問題,但印出來變亂馬的
我們需要秦始皇XD
以前玩各式各樣的遊戲都看過這些問題,通常上網查一下都能找到解決方案,到直到今天才搞清楚是怎麼一回事😂
UTF 8 共有 10FFFF 個 Code Point,可由1~4個 Byte 組成,而且任何一個 Byte 都能夠得到到底是頭還是尾.但 GB18030-2000 的字庫超出了 10FFFF。
這動畫真的很用心 不給讚真的很對不起我的良心
锟斤拷....這是我討厭用WINDOWS 的原因....
這種視頻風格,總讓我想起了當年的迴型針還有混亂博物館,但最主要的風格就是迴型針了。
錕斤拷很好笑XD 當時編碼問題最有感的可能是你去下載人家使用RPG製作大師製作的遊戲 或者是某些其他冷門遊戲時候文字不會正確辨識導致打開來從遊戲視窗到內容文本都是一大堆空白鍵跟方框當時在資源點分享處通常這類遊戲旁邊都還會告訴你去下載一個編碼轉換器去開遊戲這轉換器安裝完後執行就會有一個視窗提示你先指定遊戲啟動的本體程式exe然後再選擇適合的語系編碼 確定後這程式也會替你建立一個捷徑在旁邊 這捷徑幫你跳過前面啟動轉換器~選擇的所有過程接下來就會看到一個顯示正常文字的遊戲了(前提是選對編碼那個轉換器就是讓當時的電腦不需要去系統控制台切換語言重開玩其他國家遊戲的最好辦法而且這東西能適配各種程式上 例如影片提到的word錕斤拷在還沒被後面步驟覆蓋編碼訊息前 用轉換器讀原檔選對了也能顯示出來原內容我記得我有一段時間 還下載過另一支類似的編碼轉換工具不過這個編碼轉換工具手動啟動後會縮小在系統列內當瀏覽網頁 或者開啟文字的文件檔遇到錕斤拷 就可以在系統列把工具叫出來 然後叫他進行翻譯文件檔甚至可以叫他輸出一份編碼轉換完成的新文件這段時期則是我喜歡去爬簡體小說網站的時期
locate em...忘了印象深刻的是果沒用的話,繁中的確定會變成 耗
柴柴辛苦了。解决了我多年的疑问
还记得小时候买盗版游戏碟 出来的就都是锟斤铐😂 好像还有各种注音符号。。。
说了这么多,但是没有提及文本文件是怎么利用BOM (byte order mark)来识别编码的啊。
扩充字符那档事还没结束呢,目前电脑已经可以支持9万个汉字,可是必须安装扩充机码和字体。这还没完呢,另外有团体宣称汉字有14万个😂另一件事情,2019年坐飞机去缅甸,才知道他们的视窗刚刚支持缅文,真可怜。那时候的网页翻译的缅文老是出错,现在好很多了
质量太高了,赞赞赞
有个软件能大概率帮你转换字符集,Locale Emulator
第一种解决方案让我瞬间就爱上了它...
送一大堆錕斤拷來告白笑死
很喜欢这篇的内容,可以说是干货等级了
我住在用繁體中文的地方,每次打開從網路上下載的簡體檔案上都會變成一堆奇怪的文字😂😂
这么夸张吗?但是大陆下载繁体字文档一般都是正常显示呀
你的电脑系统繁体中文可能默认是BIG5编码,大陆的简体中文一般是GB2312或者GBK编码,二者并不完全兼容,确实会出现乱码。希望以后都切换到utf-8,这样就能解决大多数问题。
@@John-mu6hc 對啊,我是要用word打開選程其他編碼才能看得懂
謝謝你!讓我多少了解亂碼的問題 !
这期后期工作量有多大,做过后期的细思极恐!
問8:33 是指中國跟台灣的中文標準交換碼??還是只是硬要在台灣前面加一個中國而已??
可能b站不過審
视频要在大陆平台过审就得加
@@greenjobs2153 本來只是好奇詢問,結果聽起來有點難過 真的是資訊封鎖啊~ 只有黨想給你看的 你才能看到有點淡淡的哀傷~
我喜歡1
我也用winamp 不過是用最終版的
终于看到这种系统性的科普了,以前对于这类知识只是有一些碎片的印象,不知道相互之间的矛盾与联系。
终于知道昆斤拷是怎么来的
我来评论区就是想说 这里面的调研 设计 文案 工作量是极度庞大的 但是想说这么精良的作品和认真的态度 让我立即关注!@柴知道 感觉要和Vox一样了好想认识这个团队呀!
做得太用心啦
這文章跟影片,簡單易懂…🥰
UTF-8其实也不适合作为通篇汉子的编码方式,因为一个汉字基本上都是占用3个字节
其实也就是 1MB 能存的汉字从50万个变成了33万个而已,再加上现在的电脑早就不是在 MB 级别的存储单位上死抠的水平了……
當年香港特區政府,在Big5之上擴展字元集, 成為HKSCS(Hong Kong Supplementary Character Set), 收集了香港地名和香港用粗口
8:34 中國台灣 管不到的中國台灣 哈哈
人家說不定也是迫於無奈這樣講😂
人家主要戰區在大陸的網站 講台灣會被說台獨 講中國台灣就是愛國 中國麻 不意外
人家也要生存
請問UTF-8與UTF-16 有何差別?哪個是全世界最普遍使用的…?
差別在於使用的位元組數量不同。UTF-8使用1到4個位元組來表示一個字元,而UTF-16則使用2或4個位元組來表示一個字元。UTF-8向後兼容ASCII,而UTF-16不兼容,UTF-8比UTF-16更加靈活,可以表達更多的字元。UTF-8是世界上最普遍使用的Unicode字符編碼方案。
@柴知道ChaiKnows Official Channel 谢谢柴知道,首先非常肯定这个视频,其次希望制作一个关于字符相关的视频连载视频。1. 讲明白了,字符,字符集,字符编码,码位,之间的有关系。2. 如何解决乱码的问题。(Windows/Linux操作系统各一期)
Unicode 不能不提 Nokia 的供獻,由他開始大力推廣
以前用C++编程的时候经常出现屯屯屯屯 烫烫烫烫也很有意思哦 😅 要不要扩充讲一下
還有口口口
感谢这视频作者🙏🏻🙏🏻🙏🏻我终于明白了什么是电脑语言😂🎉🎉🎉
老實說,許功蓋才是編碼的惡夢,他所搞的可不只亂碼這麼簡單
不只亂碼這麼簡單...--> 解決了造成亂碼的問題, 還有什麼其他問題存在?
@@dasing2 有些系統會把'\'作為跳脫字元,也就是在字串中讀到時要做特殊處理的,然後這三個字的BIG5編碼尾段剛好與'\'相同,所以程式默認的的編碼不對時,會直接當機甚至資料損壞。
錕斤拷錕斤拷者,電腦亂碼也。萬國碼含蘊甚廣,他碼難及,故轉譯事中,常有疏漏。若一擴展字符僅萬國碼所載,傳以八位信使碼而譯以漢字內碼擴展規範,即現佔位符,若「錕斤拷錕酵」者也。
这视频剪辑得加工资哦
辛苦辛苦~真的做的很棒!!!
以前最常處理的就是簡體字的GBK,要轉成Unicode,但偏偏台灣Windows預設都愛存BIG5…一不小心還得另外轉Unicode。
这个视频做的太好了 三连鼓励
终于知道我为啥改名了。。。
换另一个方式来表达:平面是边界。码位就是方块,然后区分出区块。而字符,就是各种生物🙃
这一期的时长和工作量,都是1期堪比3期长。而且为了尽量简明,在视频做出来后,我们还忍痛删了2分多钟已经做好的片段......总而言之,希望能通过这样的方式,给大家简明、清晰地讲清楚关于文字显示和乱码的原理。
如果你喜欢本期视频,记得给我们点一下订阅和喜欢,真的做累死啦_(:з」∠)_
删了2分钟?别啊,做个导演剪辑版另外放出来呗
这期很牛逼
這一期真的很厲害
太不容易,幸苦了,又学到了新的知识
我就说怎么割了这么久😋
超级喜欢那一句:“就把乱码当作是计算机发展史为我们所绽放的一朵朵烟花吧”
覺得麻煩了點就.....(笑
大疵花
紅色按鈕的那種嗎?
@@laughlife6827 密码是六个0那种
觉得麻烦也是放大呲花😅
作為資工領域,不得不說真的做的淺顯易懂
那是,重點是剪輯更是到位
不要太自以為是了
@@RE-xv5sr閣下是什麼領域
这期视频做的太棒了!!!我一直很困惑为什么会有这种中文乱码😂
不知道怎么感谢你们,就送你们一首诗吧!
锟斤拷�⊠
斤拷�⊠锟
拷�⊠锟斤
�⊠锟斤拷
共勉😎吕严中尉!
😂
手持两把锟斤拷 口中疾呼烫烫烫 脚踏千朵屯屯屯 笑看万物锘锘锘
@@百合仙子 怎麼解的?
@@dasing2 你应该能直接 google 到解释(这诗是我道听途说来的)。简单来说后几个是 Windows 中文编程时容易出现的东西。
我就知道有这个@@百合仙子
06:00 說錯了, 電腦中文漢字在當時80年代, 由 IBM 台灣子公司主導和倚天等台灣本土其他公司合作下, 將原本 DOS 加入中文和各種文書處理應用程式. 當時台灣的字碼叫 BIG-5 (CP950), 日本就使用 NEC PC-9801 DOS/V 為主的 JIS
因BIG-5 由台灣商業主導, 很多異體字,舊字,俗字和非常用字都沒有, 最後要由其他海外國家(如香港,星馬泰) 自行追加(海字集)作BIG-5 碼的補充.
因80年代大陸因沒有相關標準, 直至80年代後期,由當時大陸政府, 要求 Microsoft 幫助 使用當時唯一大陸使用的GB2312中文電碼, 所以第一套正式支援的簡體中文系統, 要在 Win3.1 才正式出現.
後因大陸商業使用發現文字量不足夠, 再修改擴充為 GBK, 但因大陸官方規定只能用 GB2312, 導致身份證明文件電子化時, 很多人被自願改姓名.
不明觉厉
不是說錯,是不可以辱華,明講台灣比中國發展的早。
@@b116310 笑死,各種自古以來為起手式的共共無法接受😂
都特別說 "中國台灣"了,一切說到台灣任何優點的 都會被模糊化吧~
但是謝謝你的補充~讓邏輯更完整~
@@HanShengLai 问题是,台湾后劲不足。。而且,台湾所谓的“正统文字”,也有严重问题。
目前看過解釋最清楚的動畫,製作一定很辛苦!不過還是有個小錯誤。
Unicode最初對待漢字的確是把不同寫法的字全部整併成一個編碼,但實際應用大有問題,各地漢字書寫差異太多,也有新舊寫法的不同,如果全部都統一編碼會造成不同地區的人閱讀時可能被迫使用非本地的文字外觀,或是沒辦法呈現文字的新舊標準,所以後來編碼就改用Han Unification Rule把不同外觀的相同漢字全部拆開編碼
比較麻煩的是字體上因為同一個編碼,導致會顯示出不正確的寫法
因為重複性高,很多中文字體本身自帶日文,或是日本字體自帶中文
結果編碼共用字體顯示的寫法也不是該國正確寫法了
其實漢字的原理去細分那些寫法的不同是很沒意義的。那些細部的差別其實根本是美術字型不同的程度,連異體字都算不上。
@@g863210xie 舉些簡單的例子
傳統漢字固有寫法已存在差異的像是群羣、裡裏、曹曺、夠够、麵麪、館舘、為爲、線綫、畫畵、並竝
日本新体字和中國簡体字存在差異的例子像是実实、変变、庁厅、図图、辺边
以上這些都是相同文字在各政權的不同書寫標準,要說是異體字也算不上,但讓學A版本的人去適應B版本的書寫標準又覺得隔應,如果只能共用相同字符,那要套哪種標準才能維持中立並忠實記錄傳承?又如何記錄漢文歷史上的各種文獻用字差異?
@@g863210xie錯誤,因為當地人真的不是這樣寫,你在日本當地用台灣寫法是會被當成寫錯的,他們自成的教育體系也都有規定筆畫怎麼寫
只是unicode終究是歐美體系主導的編碼所以對於漢字重視程度沒那麼高(另一方面當然漢字太多也是原因,不過萬國碼總字符本來就超多了我覺得漢字也只是其中一小部分而已
@@Dark-M-Snake 其實對看久的人來說是書寫差異,日本人就有毛病糾結,你不去特別學日本漢字他也不會管你,漢字種類形式繁多,很多時候是書寫習慣的派別,在意那一筆一劃的彎曲程度,不如去在意部首有沒有正確,日本人很死板的10月11日下午5點交作業就只能10月11日下午5點,先做完提前交不行,提前10分鐘不行,叫他講原因不知道,還不如現在計算機勒,問日本人看不看的懂點頭,那看得懂就好了糾結什麼鬼青和⾭臺灣人都沒很在意了,覺得兩一書寫一篆刻或電腦顯示字符,大篆小篆裡一堆也大小不一,字型骨架對就好,反正本來日本漢字本來就是表意用,有閒功夫去在意字型,不如學日本早期去翻譯長到爆的英文單字
这期的科普视频终于解决了我十多年以来的困惑🤣
看了这期视频之后,突然觉得公制和英制两套单位也没那么混乱了
习惯问题
@@dodomakudo1783 英制的進位問題確實麻煩 習慣用也不會喜歡
@@OwO-meow-UwU 就跟现在的乱序键盘一样……用习惯了没啥感觉……
文字乱码我可以忍,但是为了人类发展,请大家看到用英制单位的人就像往它嘴里灌翔。再把它头打爆。
突然想到當年秦始皇統一了
大推! 這主題只要有被電腦亂碼搞過的一定都會覺得超有趣的
這集真的太有料 辛苦柴知道的各位了
這麼優秀的影片,製作團隊實在是太厲害了
講解幽默,原理簡單易懂
動畫也毫不馬虎
五體投地尚不足一表我的敬佩之意
五体?你的其他物件呢?
很有意思!
作为科班出身的同学,非常感谢你们做出这期视频,我已经不下N次在工作中要向不同的部门说明文件保存的编码问题以及在页面写上一堆跟业务毫无关系的编码提示,仍然避免不了有些同事的【编码病】。甚至于打算跑路考公,试题里面居然还会在不提供具体编码集的情况下问我一个中文字符占几个字节,问我是1个,2个,还是4个,6个。我很想大骂一句把8个的选项或者直接来个E钝角的选项塞出题人嘴里。然而这种误解根深蒂固,当我向多年的好友吐槽这种情况的时候,好友说【肯定是占2个啊】。😊😊😊😊😊😊😊😊现在他坟头草两丈高了
繁體這邊對GB碼比較不熟悉
我們都是用大五碼BIG-5
所以那個錕斤拷 今天我也是第一次見
我想到一个好办法,我们可以用一个小棍,蘸上黑水,在一个白色的平面物体上把这些文字画出来,这样不管拿给谁看都不会出现乱码了。
這樣不就點陣化了嗎?不如用白紙。
@@oishibaking 我想白色的平面物體應該就是白紙。
🤣png
图画也是編码吧?还是说不是?
那怎么做字体,每有一种字体就画一张画吗?怎么定义这个画的分辨率?怎么方便信息交换?编码编码就是为了方便电脑处理减少存储带宽成本才出现的东西
終於解開20多年來的"外星文"之謎_很用心製作的一集_加油鼓勵_讚!!
這集真的很足料😎😎😎😎讚啦
辛苦了 這期真的做得太好了
柴知道太棒了!永遠支持柴知道!
写过c 的人都会遇到过著名的”烫烫烫…”,据说有人看到这个乱码惊慌的拔掉了计算机电源🔌 😂
用c處理字串真的是惡夢
烫烫烫烫。。。屯屯屯屯。。。
道理上没错,毕竟0xCC和0xCD在x86里的定义差不多都是终止当前程序的意思,所以CPU遇到这些就直接让程序闪退了,可不是烫烫烫嘛(强行解释
錕斤拷錕斤拷錕斤拷
手握两个锟斤拷,口中直呼烫烫烫(
這期很棒! 加油呀!
補充一點,台港澳地區在用的繁體字編碼叫BIG-5,大陸網站載來的軟件就常常無法正常顯示
作為一個碼農,每每要編譯C語言程式時,還得換編碼真挺麻煩,偏偏微軟就選BIG-5編繁體中文
哎呀python真香
BIG5是不是看起来像韩文一样,字之间插空格一样?
@@mmorpgfans 用BIG-5看UTF-8的時候會出現很多生辟字或框框,其他我就不清楚了
可是python對於文件的編輯和儲存會使用ANSI也就是系統預設.....
明明他自己的程式碼.py只允許utf-8
然後就導致github上面有些python寫的軟體,存取設定檔會有亂碼問題,
非常優秀
谢谢,这的确让我们更加明白了字符集编码,作为业余编程爱好者,算是第一次这么系统的知道字符集编码!
"這題我會" 好可愛😂
这期做的是最好的一期❤
非常好的視頻,感謝團隊的努力。 能否再出一集關於使用者平時輸入時需要注意的地方,及遇到亂碼時如何應對呢。
繁體古早bif5大五碼,微軟擴充叫CP950,也不是UTF8解。寫python 踩過坑。另外,英文還有一個UTF7的也很坑,跟預設的UTF8差一丟丟,幾乎正常解但就是幾個拉丁美洲字母會出亂碼。
以上都血淚史。
手持两把锟斤拷,口中疾呼烫烫烫。脚踏千朵屯屯屯,笑看万物锘锘锘。
我太喜歡生僻字,甚至我每天使用幾些𱁬𪚥或者有趣的漢字。每次打字就候遇到這個“�⊠”的問題哈哈
这期节目太棒了!!!感谢柴司!!!
第一次看你們的影片,看一半就讓我訂閱了。感謝分享。
这期的质量好高,我看得非常认真。
因為演算法知道這個影片
因為這個影片訂閱了這個頻道🤣
很喜歡這個影片,內容非常有趣
謝謝柴~
感谢~
整部影片的圖示動畫真的超專業,有夠厲害
这期视频真的是干货啊太赞了
计算机专业人士给你点赞啦😜
回復“文字編碼”即可獲得錕斤拷一份
烫烫烫!!!!!!
口口口口
美味锟斤拷?
原來是這樣啊!學到了,這邊能不能看到最後片尾所説的文本啊?也想知道那些因爲篇幅沒有放進去的小知識
柴知道这期做得很详细,棒!
这集很棒!干货不少
論锟斤拷信息崩塌,與量子糾纏波函數坍縮之關係:
不打開文件箱子,你不知道其中信息或貓是死是活.
清晰易懂,太感謝了。
加強訓練,自我提升
早晚有一天能從一堆錕金銬中看出原始內容
小时候在盗版横行的网络蛮荒年代,南极星属于是电脑必装软件之一了
哇喔,這真的是太讚了,不枉費我在凌晨2點打開他
做得非常好,很淺顯易懂! 我之前有段時間做mod就想了解這個UTF-8是個啥,後來花了很多時間勉強懂了個皮毛,看完影片後總算有了個大概的了解! 非常感謝!
1.記事本那段,是微軟及各家自己的程式不用unicode的方式編碼,
2.win7亂顯示那段,是記事本程式設計不良問題(自作主張亂猜編碼)
和語言無關,要罵的是各家軟體公司
解释的简直太清晰了!感谢
厲害 感覺得出來 你們已經盡力 用簡潔明瞭得方式 說明了 文字輸入 與遇到得問題
中国台湾在哪里我地图找不到这个区域
柴司最高 超愛你們的影片 超優質❤
很棒 鲲斤铐
2天后 回来感谢柴司 因为你们做了这一期视频,使我一个不懂网页代码的人知道如何把我那个下载的本地网站乱码改好。
现在我已经可以正常的浏览那个网站了,非常感谢。再也不会�了。
柴司最棒了,龙图图小姐姐最棒了, 老板最棒了。
做得很好,虽然很多专业术语听不懂 但看得出来找了很多资料 有用心
第一!昨天在微博看了视频,今天再看一次。(❤ ω ❤) 柴柴
烫烫烫这个和 vc 调试有关,在 debug 时,编译器在进入一个函数时,会把位于栈上的缓冲区都先给用 0xCC 填充了(同时 CC 又是 INT 3 的机器码),这样如果有一个字符串变量没有被初始化的话,在调试的时候就会看到它在 IDE 里被显示成了 “烫烫烫...”。这是因为烫的 GBK 编码为 CC CC。
是台灣,不是中國台灣。
你去台灣是要乘搭國際線、要簽證的。
@21-gi1ex 無所謂,但來台灣記得帶簽證
那個猜猜看真的笑死我了XD
我就真的把最常用的那幾個全部試一遍才開的了。
我以前在印刷店工作也會遇到,因為附近很多學校,然後就出現一些學生沒轉檔導致版面跑了,甚至亂碼的情況,也有明明螢幕看沒問題,但印出來變亂馬的
我們需要秦始皇XD
以前玩各式各樣的遊戲都看過這些問題,通常上網查一下都能找到解決方案,到直到今天才搞清楚是怎麼一回事😂
UTF 8 共有 10FFFF 個 Code Point,可由1~4個 Byte 組成,而且任何一個 Byte 都能夠得到到底是頭還是尾.但 GB18030-2000 的字庫超出了 10FFFF。
這動畫真的很用心 不給讚真的很對不起我的良心
锟斤拷....這是我討厭用WINDOWS 的原因....
這種視頻風格,總讓我想起了當年的迴型針還有混亂博物館,但最主要的風格就是迴型針了。
錕斤拷很好笑XD 當時編碼問題最有感的可能是
你去下載人家使用RPG製作大師製作的遊戲 或者是某些其他冷門遊戲時候
文字不會正確辨識導致打開來從遊戲視窗到內容文本都是一大堆空白鍵跟方框
當時在資源點分享處通常這類遊戲旁邊都還會告訴你去下載一個編碼轉換器去開遊戲
這轉換器安裝完後執行就會有一個視窗提示你先指定遊戲啟動的本體程式exe
然後再選擇適合的語系編碼 確定後這程式也會替你建立一個捷徑在旁邊 這捷徑幫你跳過前面啟動轉換器~選擇的所有過程
接下來就會看到一個顯示正常文字的遊戲了(前提是選對編碼
那個轉換器就是讓當時的電腦不需要去系統控制台切換語言重開玩其他國家遊戲的最好辦法
而且這東西能適配各種程式上 例如影片提到的word錕斤拷
在還沒被後面步驟覆蓋編碼訊息前 用轉換器讀原檔選對了也能顯示出來原內容
我記得我有一段時間 還下載過另一支類似的編碼轉換工具
不過這個編碼轉換工具手動啟動後會縮小在系統列內
當瀏覽網頁 或者開啟文字的文件檔遇到錕斤拷 就可以在系統列把工具叫出來 然後叫他進行翻譯
文件檔甚至可以叫他輸出一份編碼轉換完成的新文件
這段時期則是我喜歡去爬簡體小說網站的時期
locate em...忘了
印象深刻的是果沒用的話,繁中的確定會變成 耗
柴柴辛苦了。解决了我多年的疑问
还记得小时候买盗版游戏碟 出来的就都是锟斤铐😂 好像还有各种注音符号。。。
说了这么多,但是没有提及文本文件是怎么利用BOM (byte order mark)来识别编码的啊。
扩充字符那档事还没结束呢,目前电脑已经可以支持9万个汉字,可是必须安装扩充机码和字体。这还没完呢,另外有团体宣称汉字有14万个😂
另一件事情,2019年坐飞机去缅甸,才知道他们的视窗刚刚支持缅文,真可怜。那时候的网页翻译的缅文老是出错,现在好很多了
质量太高了,赞赞赞
有个软件能大概率帮你转换字符集,Locale Emulator
第一种解决方案让我瞬间就爱上了它...
送一大堆錕斤拷來告白笑死
很喜欢这篇的内容,可以说是干货等级了
我住在用繁體中文的地方,每次打開從網路上下載的簡體檔案上都會變成一堆奇怪的文字😂😂
这么夸张吗?但是大陆下载繁体字文档一般都是正常显示呀
你的电脑系统繁体中文可能默认是BIG5编码,大陆的简体中文一般是GB2312或者GBK编码,二者并不完全兼容,确实会出现乱码。希望以后都切换到utf-8,这样就能解决大多数问题。
@@John-mu6hc 對啊,我是要用word打開選程其他編碼才能看得懂
謝謝你!讓我多少了解亂碼的問題 !
这期后期工作量有多大,做过后期的细思极恐!
問
8:33 是指中國跟台灣的中文標準交換碼??
還是只是硬要在台灣前面加一個中國而已??
可能b站不過審
视频要在大陆平台过审就得加
@@greenjobs2153 本來只是好奇詢問,結果聽起來有點難過 真的是資訊封鎖啊~ 只有黨想給你看的 你才能看到
有點淡淡的哀傷~
我喜歡1
我也用winamp 不過是用最終版的
终于看到这种系统性的科普了,以前对于这类知识只是有一些碎片的印象,不知道相互之间的矛盾与联系。
终于知道昆斤拷是怎么来的
我来评论区就是想说 这里面的调研 设计 文案 工作量是极度庞大的 但是想说这么精良的作品和认真的态度 让我立即关注!@柴知道 感觉要和Vox一样了好想认识这个团队呀!
做得太用心啦
這文章跟影片,簡單易懂…🥰
UTF-8其实也不适合作为通篇汉子的编码方式,因为一个汉字基本上都是占用3个字节
其实也就是 1MB 能存的汉字从50万个变成了33万个而已,再加上现在的电脑早就不是在 MB 级别的存储单位上死抠的水平了……
當年香港特區政府,在Big5之上擴展字元集, 成為HKSCS(Hong Kong Supplementary Character Set), 收集了香港地名和香港用粗口
8:34 中國台灣 管不到的中國台灣 哈哈
人家說不定也是迫於無奈這樣講😂
人家主要戰區在大陸的網站 講台灣會被說台獨 講中國台灣就是愛國 中國麻 不意外
人家也要生存
請問UTF-8與UTF-16 有何差別?哪個是全世界最普遍使用的…?
差別在於使用的位元組數量不同。UTF-8使用1到4個位元組來表示一個字元,而UTF-16則使用2或4個位元組來表示一個字元。UTF-8向後兼容ASCII,而UTF-16不兼容,UTF-8比UTF-16更加靈活,可以表達更多的字元。UTF-8是世界上最普遍使用的Unicode字符編碼方案。
@柴知道ChaiKnows Official Channel 谢谢柴知道,首先非常肯定这个视频,其次希望制作一个关于字符相关的视频连载视频。
1. 讲明白了,字符,字符集,字符编码,码位,之间的有关系。
2. 如何解决乱码的问题。(Windows/Linux操作系统各一期)
Unicode 不能不提 Nokia 的供獻,由他開始大力推廣
以前用C++编程的时候经常出现屯屯屯屯 烫烫烫烫也很有意思哦 😅 要不要扩充讲一下
還有口口口
感谢这视频作者🙏🏻🙏🏻🙏🏻
我终于明白了什么是电脑语言😂🎉🎉🎉
老實說,許功蓋才是編碼的惡夢,他所搞的可不只亂碼這麼簡單
不只亂碼這麼簡單...
--> 解決了造成亂碼的問題, 還有什麼其他問題存在?
@@dasing2 有些系統會把'\'作為跳脫字元,也就是在字串中讀到時要做特殊處理的,然後這三個字的BIG5編碼尾段剛好與'\'相同,所以程式默認的的編碼不對時,會直接當機甚至資料損壞。
錕斤拷
錕斤拷者,電腦亂碼也。萬國碼含蘊甚廣,他碼難及,故轉譯事中,常有疏漏。若一擴展字符僅萬國碼所載,傳以八位信使碼而譯以漢字內碼擴展規範,即現佔位符,若「錕斤拷錕酵」者也。
这视频剪辑得加工资哦
辛苦辛苦~真的做的很棒!!!
以前最常處理的就是簡體字的GBK,要轉成Unicode,但偏偏台灣Windows預設都愛存BIG5…一不小心還得另外轉Unicode。
这个视频做的太好了 三连鼓励
终于知道我为啥改名了。。。
换另一个方式来表达:平面是边界。码位就是方块,然后区分出区块。而字符,就是各种生物🙃