。【文字故事】文字編解碼的由來● 電腦還沒被發明之前,文字就只是文字,全球網際網路還沒被發明之前,文字的字符編碼,也沒那麼重要 !!
● 話說很久很久以前,電腦文字是由美國制定出來的,他們覺得一個字節(一個字節總共有256個編碼)可以囊括英語世界裡所有的字母、數字和常用特殊符號,全部只用了前0~127個編碼,這就是美國發表的【ASCII 字符編解碼器】。
◆ 下圖是 ASCII 字符袋碼表 000~127個編碼(這就是我們熟知的 內碼表)。
圖片來源:https://zhuanlan.zhihu.com/p/38333902
● 後來在歐洲的電腦文字建構時,法國人說:我需要在小寫字母加上變音符號(如:é),德國人說:我也要加幾個字母(Ä ä、Ö ö、Ü ü、ß)。於是,歐洲人就將【ASCII 字符編解碼器】沒用完的編碼(128~255)用在歐洲自己特有的符號編碼,後來稱之為【擴展字符集】。
◆ 下圖是 ASCII 字符袋碼表 128~255個編碼(這就是我們熟知的 內碼表)。
圖片來源:https://zhuanlan.zhihu.com/p/38333902
● 等到大中華電腦文字建構時,256個字符編碼哪夠 ?我泱泱大中華,漢字起碼也得N多萬吧,就連小學生都得要求掌握兩三千字。中國大陸最後拍板:一個字節不夠,那我們就用多個字節來為漢字編碼吧,但是,當年中國大陸還那麼窮,字節那麼貴,三個字節傷不起,那就二字節吧,先給常用的幾千漢字編個碼,等以後國家強盛了人民富裕了,咱再擴展唄---,這就是中國大陸發表的【GB2312 字符編解碼器】。香港及台灣同胞一看,竟喊出動物羊駝的小名【草泥馬】,怎麼只有簡體字,還讓不讓我們這些使用繁體字的有一條活路呢 ? 於是港台同胞也自己弄了個繁體字編碼---大五碼【Big-5 字符編解碼器】。
● 當時,同一時間,全世界每個國家,也正在為自己的文字編碼傷腦筋。
● 最後,微軟發話了:顧客就是上帝啊,你們的編碼我都得滿足啊,這樣吧,賣給美國國內的系統就【預設使用ASCII 編解碼器】吧,賣給中國大陸的系統就【預設使用GBK編解碼器】吧,賣給韓國人的系統就【預設使用EUC-KR編解碼器】,...但是為了避免你們誤會我微軟賣給你們的系統功能有差異,我就統一把你們的預設編碼都顯示成【ANSI 編解碼器】吧。---本故事純屬虛構,但「ANSI 編碼」確實只存在於Windows系統。
● 轉載自【每日頭條】資料來源:KKNews https://kknews.cc/zh-tw/code/442kg42.html
原文網址:https://kknews.cc/code/442kg42.html
● 補充:
◇ GBK 是在 GB2312 標準 基礎上擴充後,並兼容 GB2312 的標準(好像還不是中國大陸標準),專門用來解決中文編碼的,是雙字節的,不論中英文都是雙字節的。另外,如果是外國人瀏覽你的 GBK 網頁,需要下載中文語言包才能正確顯示文字,GBK 包含全部中文字符。瀏覽 UTF-8 編碼的網頁,則不需要下載中文語言包,立即能正確顯示文字。
