*停權中*
|
正在嘗試編輯一份我「妄想」的「正體中文資訊交換標準碼」的文件檔,啟發自美國的"ASCII"。
我採用試算表格式來整理編輯這份表格,目前收錄有:
國語注音符號(包含有前一個版本所棄用的四個符號,以及聲調符號),
漢數字小寫ま∼十,
全字庫的 三十六個筆順序+五一七個部件+二一四個部首,然後再把這三個其中重複的拿掉,
臺灣傳統環境在用的全形正體中文標點符號數十個(直書和橫書都分開算),
八卦符號八個,
佛教萬字符號左與右旋兩個。
目前為止我整理出來有655個碼位。
當然我無法自己去無中生有那些文字與符號,文件編輯環境的關係,基本上都是要找別人已經做好整理的資料源,再重新整理過。
例如像是 Unicode最新標準版、CNS11643全字庫、中央研究院漢字構形資料庫(金文、甲骨文、楚漢簡帛文字)、教育部異體字字典 等等這些資料源。
至於 臺語注音符號 要不要收錄?這部分我還要再多想想。
一開始在彙整表格之前,我原以為我在初始階段整理出來的這些正體中文漢字部件與符號會超過1024個,結果沒有,只有五分之三的量而已。
畢竟根據十幾年前古早印象中所瀏覽過的中研院期刊文章所述,印象中這些有的沒有的漢字部件與符號加起來的數量是在一千多個∼兩千個之間。
我還在想,還有什麼極具「漢文化」代表性的文字與符號,可以收錄於表格中呢?
搞不好PCDVD網友提到的參考點子,是我之前想破頭都沒想到的,但又合理,這也有可能。
曾經我在MAC討論區發文詢問想找一個MAC環境原生圖形介面的Unicode字元轉碼和顯示查閱軟體,
但是被某些MAC進階電腦玩家給酸很大,建議我滾回去用MsWindows,MAC環境沒有人會有像我這樣的需求。
但運氣很好的,遇到有佛心網友提供了我沒想到的一些關鍵字和自然語言去搜尋,然後我就發現了符合我描述需求的軟體原來早就存在了。
|