引用:
作者lzarconlony1
以上恕刪∼∼∼
漢字是可以成為計算機基礎 而且會更有優勢
|
以下或許算是離題了∼∼∼
這是一篇曾經我看了PCDVD七八區過去某篇討論串之後,想要回應的內容,
但是當我完成回應文章之後,該篇討論串我已經找不會來,沈的太下面了。
於是就沒有發表在PCDVD的七八區了,但有貼在別的論壇。
所以趁這個機會補貼上來。當然,文章的內容都是政黨輪替之前的觀點,
現在的話或許會有小部分詞彙待修飾,但是基本概念不會變。
但我懶的修詞了。去年的思維,原文照PO:
---
關於中文資訊處理的平行世界想像:
我腦海中累積了有關"原生的""正體中文電腦"的"妄想/初始構想/嘴砲/雛形概念"。
(注意:我指的是"中文"的電腦,而不是"中文化"的電腦,差一個"化"字,差很多。)
這是一個相當於"砍掉重練"的,"純粹""為了爽"的(為了要建立"純中文"的電腦世界),
在既有"電腦硬體架構""之上","重新發明""軟體和作業系統"的"個人電腦"思路。
這是一個需要國家層級的資金和人力資源的大型研發計劃案,
(現在的中國國民黨,超級無敵霹靂非常的"有錢",在"假設"從頭到尾沒有人貪污,
所有資金"都有"確實用在"錯誤嘗試"與實驗的研發的"前提下",研發資金"絕對不會"是問題)。
這是一台純粹"只會認識""正體中文漢字系統"的作業系統軟體開發設計,
這個"正體中文漢字作業系統"的"底層",只認識"正體中文漢字(或著說字根/部件/部首)"而已,完全"不認識"拉丁字母、斯拉夫字母、韓文、阿拉伯文、日文漢字、中文簡化字、非洲伊索比亞文、等等全世界除了"現代正體中文漢字(中華民國教育部規範版本)"以外的其他任何文字系統。當然"底層""之上"會有所謂的"圖形界面",在圖形界面環境中,這時可以透過外掛函示庫軟體的方式,再去補上第三方的文字系統軟體。
原本的"底層"的指令模式人機界面,"只能接受"中文的輸入。
在我於199X世代,國∼高中生的學習個人電腦概論的階段,我古早印象中有一個叫做ASCII的東西,這是一個對照表,大致上就是把代表硬體的二進位碼,與現代英文字母和部分符號做了整理表格,有128組對照資料,然後現代的個人電腦系統軟體就是從這張表格開始發展。
好多年前,我印象中看網路文件,臺灣中研院,把現代的中文漢字作了總整理,
印象中好像是整理出大約不超過兩千個的中文漢字字根、部件、部首,
現代正體中文漢字(台澎金馬以及周圍一些小島所在使用的),
全都是從這不超過兩千個的中文漢字字根、部件、部首所組合出來的。
有沒有人想過,如果把這不超過兩千個的中文漢字字根、部件、部首和二進位碼做成一份對照表,會是什麼樣的一個情境呢?不得不承認,數量上確實會比ASCII多出不少。
但也就是那些了,因為中文漢字字根、部件、部首總量有一千多個,
其實有部分可以拿來被 當作/定義成 代表特殊意義的字元,就跟ASCII裡頭的某些符號字元同樣道理。
(當然對照表內的每個字元都要定義清楚,這個表格理論上"不會"被中文漢字系統以外的文字系統所擴充增補)。
額外穿插一下,英文字母26個,有區分大小寫,所以是52個,然而已經被列入字典的英文字彙總量有100多萬個,
中文漢字若拆字根,中研院已經研究出來了,就一千多個,已經被台灣政府單位列管的現代中文漢字,目前累積有九萬五千多個。
正體中文漢字字根和二進位碼對照表被正式定義與發行之後,
以從小在義務教育階段就學習中文漢字(也是其人生主要再用的母文字)的電腦使用者而言,理論上應該能很快地理解這個表格所列出的字根/部件/部首(不一定能夠背的滾瓜爛熟,但是看到後能很快理解),就像學習發音時,理解ㄅㄆㄇㄈ那樣。
"寫程式"怎麼辦?我不是程式開發者,只是單純的電腦使用者,這是個好問題。
我想到的是,"寫程式"憑什麼只能用"英文的邏輯"去寫?大學的國文系不是也會教中文漢字字句的一些更深入的邏輯思維嗎?那一千多個字根/部件/部首,不能拿來被賦予定義嗎?
總是可以從中挑出幾十個組合成字串啊?輸入字串的時候,不能以 字根/部件/部首 完全替代那些英文字串嗎?
,這需要另外去想一套程式語言的規範定義
(當然,是要從純中文的思考角度出發的,不要混雜英文的思維在裡頭),
開發 從 原始碼>可執行檔 的"編譯器"的團隊,在規劃原始碼的編寫規範的時候,就是完全用中文在思考。
再來想想鍵盤怎麼解決???已經有一個東西叫做倉頡輸入法(雖然我不熟悉倉頡輸入法,我只會注音輸入法),雖然中研院整理出來的字根/部件/部首有一千多個,但是身為純中文的鍵盤
(不會有任何英文字母和符號在鍵盤上,鍵盤按鍵定義也是砍掉重練,但總是有機會"沿用"某些"概念"),
我是覺得SUN type 7 的按鍵數量應該很夠了,畢竟傳統倉頡輸入法都夠塞了。
完全的筆畫最少的字根,數量應該也不多。
再穿插一下,看網路資料,發現unicode規範其實還是有BUG的,unicode組織的做法卻只是,另外寫一份文件來表示unicode規範裡頭某些碼位字元或著某些名稱資料有錯誤。
而"不是"直接在下一版的規範修正錯誤。
目前先妄想到這些,有機會繼續補文。
另外,我推論,可能會有某幾則回文會是某種形式的內容。
針對該種形式的回文內容,我已經準備好再回文的內容了,
到時複製貼上即可。
算是雜談:
腦海中浮現了一個想法,直覺前一篇寫的妄想,可以套用於198X世代最初,
台灣的個人電腦中文(化),剛開始發展的情境,畢竟"中國國民黨,超級無敵霹靂非常的"有錢"",個人電腦這種東西,本來就是砸錢研發出來的,所以資金"絕對不會是問題"(前提還是要用在該花的地方,而不是被貪污掉)。
也就是說,在"研發經費不是問題"的前提下,用2015年的"個人電腦"既有的軟硬體技術,
去思考198X世代最初,當時當下已經有的資源,怎麼去發展一個"純正體中文系統的""個人電腦"軟硬體出來。
當然至少要包含印表機(當代的極限可能也只有點陣和噴墨)、滑鼠(鼠身裡頭就是傳統的一顆滾球)、鍵盤(純中文印刷)、電腦喇叭、"區域"網路介接、
一台類似蘋果電腦系列外觀設計(古早機型)的主機,這樣的硬體組合。
軟體的部分,中文系統能夠處理的漢字數量,只能等於和大於清朝的康熙字典的收錄漢字量(印象中是四萬字出頭)。
big5真的是一個"很不堪"且遺害幾十年的規劃,居然比前一個朝代收錄的漢字量還少,比古人還要遜咖。
說實在的,給big5這個方案蓋章通過的台灣當時當下,最高資訊部門主官管,若已經過世了,
值得被拉出來鞭屍,因為他"沒有遠見"、不懂得長遠規劃、只看眼前。
該怎麼把我腦海中的妄想,盡可能完整的描述出來,還真的不容易。
---