PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 其他群組 > 七嘴八舌異言堂
帳戶
密碼
 

  回應
 
主題工具
艾克萊爾
Golden Member
 
艾克萊爾的大頭照
 

加入日期: Aug 2004
您的住址: 「 」
文章: 2,516
再次證明PCDVD果然是臥虎藏龍~
     
      
__________________
ぶ(∀゚ )人(゚∀&#65439人( ゚&#8704人(∀゚ )人(゚∀&#65439人( ゚&#8704
(↑一個因為疫情影響導致工作超閒不知做啥好的傢伙↑)
舊 2014-01-12, 09:00 PM #11
回應時引用此文章
艾克萊爾離線中  
asccpu
Master Member
 

加入日期: Jan 2002
您的住址: U.S.S AGC
文章: 1,669
引用:
作者FLYFLY
有沒有嘗試過以下的資源呢?

全字庫
http://www.cns11643.gov.tw/AIDB/welcome.do

全字庫注音輸入法表格檔2012 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
http://www.openfoundry.org/of/projects/1603

找找看說不定有現成的字形可用!?

另外,在WindowsXP環境要編輯unicode cjk - ext ABCD以及未來版本碼位字元的話,
印象中,得去改機碼(這得另外google資料了)。


都找了,這站及"教育部異體字",是我編排時必上的,
因為文件內容我自行加上了異體字一覽及電腦用字碼資料要由這2站取用(後面有成品樣本)

XP要用EXT. B是非常容易的,2000就比較困難。
XP要裝字型更新套件才可讓輸入法對到EXT. A及B,要用EXT C/D,只要把W8的mingliub.ttc裝上就行了(W7版只到C,沒有D),再裝14版的輸入法,XP就可用7萬多字了(不過EXTC/D仍要用U碼輸入,除非找第3方輸入法)


現在就以8F為準了。

下面是目前成品給各位,有些字用程式開會出錯,因此檔名用該字的U碼表示
https://drive.google.com/folderview...dk0&usp=sharing
 
__________________
辭源數位化計劃啟始於2014年1月。請拜訪成果。

此文章於 2014-01-12 09:18 PM 被 asccpu 編輯.
舊 2014-01-12, 09:14 PM #12
回應時引用此文章
asccpu離線中  
FLYFLY
*停權中*
 

加入日期: Sep 2001
您的住址: 廢鐵鎮
文章: 392
引用:
作者asccpu
都找了,這站及"教育部異體字",是我編排時必上的,
因為文件內容我自行加上了異體字一覽及電腦用字碼資料要由這2站取用(後面有成品樣本)

XP要用EXT. B是非常容易的,2000就比較困難。
XP要裝字型更新套件才可讓輸入法對到EXT. A及B,要用EXT C/D,只要把W8的mingliub.ttc裝上就行了(W7版只到C,沒有D),再裝14版的輸入法,XP就可用7萬多字了(不過EXTC/D仍要用U碼輸入,除非找第3方輸入法)


現在就以8F為準了。

下面是目前成品給各位,有些字用程式開會出錯,因此檔名用該字的U碼表示
https://drive.google.com/folderview...dk0&usp=sharing


注音就可以ㄍㄧㄣ到九萬五千個漢字了,所以我才會提供這個。
包含EXT A/B/C/D,和PUA區。
全字庫注音輸入法表格檔2012 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
http://www.openfoundry.org/of/projects/1603
舊 2014-01-12, 09:30 PM #13
回應時引用此文章
FLYFLY離線中  
kioko
Power Member
 

加入日期: Mar 2004
文章: 552
這裡神人好多!!
舊 2014-01-12, 10:16 PM #14
回應時引用此文章
kioko離線中  
SpiceAndWolf
*停權中*
 

加入日期: Nov 2013
文章: 17
我記得中文字有十幾萬字
光是異體字字典第五版就有106230字
很多字到最後因罕用
都得自行造字了
舊 2014-01-13, 11:46 AM #15
回應時引用此文章
SpiceAndWolf離線中  
asccpu
Master Member
 

加入日期: Jan 2002
您的住址: U.S.S AGC
文章: 1,669
引用:
作者FLYFLY
注音就可以ㄍㄧㄣ到九萬五千個漢字了,所以我才會提供這個。
包含EXT A/B/C/D,和PUA區。
全字庫注音輸入法表格檔2012 (搭配CNS11643中文全字庫規格的Unicode格式傳統注音輸入法對照表)
http://www.openfoundry.org/of/projects/1603

我不是使用注音輸入。

不過這資料確實比我過去收集的要全,
但可惜的是,有些字成方塊字,可能用到私人造字吧。
附檔是所有第2字面字列表

另外有沒有人有興趣參與這工程呢?
上傳的附加檔案
文件類型: rar U32.rar (112.9 KB, 3次瀏覽)
__________________
辭源數位化計劃啟始於2014年1月。請拜訪成果。
舊 2014-01-13, 11:53 AM #16
回應時引用此文章
asccpu離線中  
FLYFLY
*停權中*
 

加入日期: Sep 2001
您的住址: 廢鐵鎮
文章: 392
引用:
作者asccpu
我不是使用注音輸入。

不過這資料確實比我過去收集的要全,
但可惜的是,有些字成方塊字,可能用到私人造字吧。
附檔是所有第2字面字列表

另外有沒有人有興趣參與這工程呢?


如果“真的有”參考網址說明文字,
把表格檔用純文字編輯器打開來看“開頭”的“說明文件”區塊看完一輪的話,
照理說應該已經可以自行處理方塊字缺字的問題(說明文件都有寫解決流程)。
如果真的有照著說明文件去跑實體流程,理論上就可以在家用電腦單機環境上,
透過注音輸入法輸入編輯九萬五千個現代中文漢字。
舊 2014-01-13, 05:29 PM #17
回應時引用此文章
FLYFLY離線中  
SpiceAndWolf
*停權中*
 

加入日期: Nov 2013
文章: 17
引用:
作者FLYFLY
如果“真的有”參考網址說明文字,
把表格檔用純文字編輯器打開來看“開頭”的“說明文件”區塊看完一輪的話,
照理說應該已經可以自行處理方塊字缺字的問題(說明文件都有寫解決流程)。
如果真的有照著說明文件去跑實體流程,理論上就可以在家用電腦單機環境上,
透過注音輸入法輸入編輯九萬五千個現代中文漢字。


不過這樣還是有缺 而且這裡面有的是日文漢字之類的字體
而實際上光是目前教育部2004年公布的就有10萬又6230字
差了一萬一千字
像是之前念中文系時
聽說光是學校自己系上的就有了十多萬字
這種通常要跟教育單位的文學系所合作吧
之前搞辭賦學
出不來就是自己造字了
舊 2014-01-13, 05:51 PM #18
回應時引用此文章
SpiceAndWolf離線中  
FLYFLY
*停權中*
 

加入日期: Sep 2001
您的住址: 廢鐵鎮
文章: 392
引用:
作者SpiceAndWolf
不過這樣還是有缺 而且這裡面有的是日文漢字之類的字體
而實際上光是目前教育部2004年公布的就有10萬又6230字
差了一萬一千字
像是之前念中文系時
聽說光是學校自己系上的就有了十多萬字
這種通常要跟教育單位的文學系所合作吧
之前搞辭賦學
出不來就是自己造字了


現代中文漢字的部分,表格檔是2012年的舊版本了,
現在是2014年,表格有缺是正常的。

真的要找“”古代“漢字”的話,
這link還有一款目前已經沒再更新的單機軟體。
漢字構形資料庫
http://cdp.sinica.edu.tw/cdphanzi/
舊 2014-01-13, 06:00 PM #19
回應時引用此文章
FLYFLY離線中  
asccpu
Master Member
 

加入日期: Jan 2002
您的住址: U.S.S AGC
文章: 1,669
引用:
作者FLYFLY
如果“真的有”參考網址說明文字,
把表格檔用純文字編輯器打開來看“開頭”的“說明文件”區塊看完一輪的話,
照理說應該已經可以自行處理方塊字缺字的問題(說明文件都有寫解決流程)。
如果真的有照著說明文件去跑實體流程,理論上就可以在家用電腦單機環境上,


不是缺字,是我沒該字型,我又看了一次,沒出現的字都在第15字面,也就是我幾個月前所放出的"圖形字型"高碼版所使用的地區。
你是否有這區的字型?若可顯示,我附個15字面的文字檔,可否轉出來給我看看
,看要用PDF崁入字型方式,或輸出成圖片都可。

附檔:第15字面,單行16字列表
上傳的附加檔案
文件類型: rar P15.rar (112.8 KB, 0次瀏覽)
__________________
辭源數位化計劃啟始於2014年1月。請拜訪成果。
舊 2014-01-13, 09:58 PM #20
回應時引用此文章
asccpu離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是04:08 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。