引用:
作者Kavon
印象中有看過類似文章,當時有套編碼可以容納4萬個中文字,
這套標準後來好像在美國某圖書館。
|
應該是指CCCII,只是1個字要3個位元組,較佔空間,加上與英文不易相容,
所以未獲採用,前面所提字數較多的CNS11643不受青睞恐怕也是此原因,
雖然2位元組理論容量有65535字,但為與ASCII相容,很多空間其實不能用,
大概兩三萬以上的字數就非得用到3位元組不可。
http://zh.wikipedia.org/zh-tw/%E4%B...%8F%9B%E7%A2%BC
引用:
作者FLYFLY
提一個老梗吧,在漢字文化層面,我有一個思路是這樣的,
前朝大清帝國時代,那時代的紙本字典,我印象中看資料蒐錄漢字有四萬多個,
時代進步到下一個朝代,中華民國了,除了紙本之外,
還有所謂的電子/電腦這種東西出現了,可以把紙本上的漢字,再呈現於電子裝置上,
照理說,社會在進步,字典裡頭的漢字應該只會多,不會少才對,
所以漢字電子化之後,漢字量應該要等於或大於清朝時代的字典的量才對,
怎麼反而搞出了個big5變少了?
某種程度來說,這算是漢字文化開倒車。
我個人的觀念是,只要錢砸下去,198X的世代(那個世代不是有句俗話,
台灣錢淹腳目!?),硬體做不到,那就從頭開發硬體,
軟體做不到,那就開發軟體,絕對可以生出一個
專門處理四萬個以上的現代中文漢字的"軟""硬"體整合電腦設備的"原型",
然後再來研究該怎麼把這樣的設備普及化,民間化...
|
還要能與國際接軌才行,不然設計出來若只有台灣能用,恐怕也是白搭,
畢竟電腦不是台灣發明的......