其實還是很感謝您的整理,不過前面網友的意見也不是隨便提的,
首先您在前面有提到這編碼是給人讀的依據如下,
個人認為以常用->罕用順序作為這編碼是給人讀的證據似乎有點薄弱?
還是您手頭上有UNICODE組織對此作法的說明?
引用:
作者FLYFLY4
然而我發現,拉丁字母系列的 "block" 的排序,就完全是常用字母或連結字在前,
相對罕用的拉丁字母連結字等等在後。
所以不只是給機器讀,也是給人讀的。文書軟體排序的判讀方便性是有差別的。
|
使用UNICODE編碼的意義在於文字儲存到檔案中時,每個文字都有獨一無二的編碼,
由於文字間編碼無任何衝突,使得您可以在一個純文字檔案中塞入各國語言而且還可以正常顯示(在系統與字型皆支援的情況下),
事實上若您本身有點計算機的基礎,直接看檔案的RAW DATA,
就可以看到這些文字所對應的UNICODE編碼是實際被儲存到檔案裡面,
電腦則透過讀取檔案中的RAW DATA與UNICODE表比對後,
配合字型將文字顯示在畫面上,使用者才能看到顯示在螢幕上的文字,
而非一堆亂碼,這代表這編碼真的是給電腦讀的,一般人幾乎不會有讀它的機會。
您所強調的「順位」問題自然也不那麼重要(我自己是認為根本沒差)
但話說回來,雖然一般情況下,人不會去讀這個編碼,但有時還是會有反查編碼的需要,
我自己的作法很簡單,直接在純文字編輯器輸入那個字,再去看它的RAW DATA找到編碼即可。
以上,若有說錯,歡迎諸位PCDVD的高手隨便鞭。
引用:
作者FLYFLY4
我覺得有些在雞同鴨講,但我覺得我前面累積的論述應該已經很清楚白話了。
再強調一次,這真的不是「編碼」的問題,這是 "unicode block" 萬國碼「區段」「順位」的問題。
而「區段『內』」「字元和符號」的「編碼排序」,「基本上」都沒有問題(雖然我還是可以挑出細骨頭,但或許會扯太遠了)。
|