瀏覽單個文章
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
引用:
作者silent
這不是寫程式給機器讀的嗎?當然是用有規律可循的的排序方式,怎麼會是靠常不常用?


情境舉例,這裡以 unicode "block" 的排序為例,
unicode這個美國組織 把
"CJK Unified Ideographs Extension A"(相對「不常用」的漢字,碼位相對在前)這個"block"
擺在 "CJK Unified Ideographs"(相對常用的漢字,碼位相對在後)「之前」。
這樣會造成一個狀況,當文書套裝軟體例如試算表使用排序功能時
(試算表預設依據unicode碼位區段來排序)
就會出現罕用漢字被排在在前,常用漢字被排在後的狀況。
我使用試算表軟體來協助編輯注音輸入法表格檔(支援到將近有九萬五千漢字,橫跨至少三個 unicode cjk漢字 block),
需要的就是常用漢字在前,罕用漢字在後,於是這樣我就麻煩了,
還好後來還有發現一個中華民國cns116643<>美國unicode的對照表,
cns116643就是依照常用漢字在前罕用漢字在後的排序。
然而我發現,拉丁字母系列的 "block" 的排序,就完全是常用字母或連結字在前,
相對罕用的拉丁字母連結字等等在後。
所以不只是給機器讀,也是給人讀的。文書軟體排序的判讀方便性是有差別的。
舊 2021-09-27, 11:33 AM #10
回應時引用此文章
FLYFLY4離線中