公家機關網站 行政院國發會全字庫
https://www.cns11643.gov.tw
裡頭有一個筆順序查詢 頁面
https://www.cns11643.gov.tw/search.jsp?ID=12
簡單籠統來說,公家機關網站把收集整理出來九萬五千多個漢字,拆解後整理出35種筆順序(過往版本是36種,某天查詢介面網頁突然就消失了其中一種)。
原則上全字庫網站內的每個漢字的資料查閱頁面,會有一個「筆順序欄位」列出該漢字是由哪些筆順序所「依序組合」出來的。
然而我細查欄位內容之後又發現與「我第一時間所以為的」不一樣。
原來公家機關把35種筆順序又區分為五大類,筆順序欄位內列出的其實是「這五大類的的分類」的列出,而不是我一開始以為的35種筆順序的列出。
這下讓我傷腦筋了,我想嘗試看看根據全字庫網站,還有政府開放資料平臺所提供的全字庫資料打包檔內所提供的現有資料,能否拼湊出全字庫所列出的每個漢字,是由「35種筆順序其中的哪些」所組合出來的,這樣的列表。
目前為止我拼湊不出來!
如果將來有機會編製出這樣的列表的話,籠統來說就是又新增一種字根(筆順序)輸入法表格檔了!而且還有支援九萬五千多個漢字!
一個補充,因為是公家機關網站的關係,那九萬五千多個漢字對應的筆順序欄位內列出的資料是不是百分之百有校稿過的正確資料呢?其實是可以帶問號的。