PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   七嘴八舌異言堂 (https://www.pcdvd.com.tw/forumdisplay.php?f=12)
-   -   收到 新版CNS11643編修說明會開會邀請 有感 (https://www.pcdvd.com.tw/showthread.php?t=1180163)

oversky. 2021-05-14 09:08 PM

引用:
作者FLYFLY4
目前正在做一個嘗試,在 macOS 10.15 + FontForge.app 這個環境,
把 中華民國中央研究院漢字構形資料庫單機版套件內打包的罕用字(私人造字區)字形檔、
中華民國教育部標準楷書字形檔、中華民國行政院國發會全字庫正楷體,
重新混搭剪貼出六千六百多個臺灣社會環境常用的「正體字」出來。
漢字構形資料庫內的罕用字(「簡化字」除外)原則上幾乎都是一筆一畫全為獨立繪製再疊加成字的向量字圖。
教育部標準楷書、和全字庫正楷體則是目前一般常見的簍空向量字圖。
我個人過往繪製向量圖的經驗值趨近於零,只有操作過微軟小畫家繪製點陣圖的經驗。
總之就是嘗試看看能不能把漢字構形資料庫的罕用字向量字圖拿來重新剪貼再組合成常用字。
剪貼出來的成果「必須是」每一個字圖的每一個筆畫都獨立繪製,再疊加成字。
目前的規劃是先從教育部二一四個部首、全字庫五一七個部件開始嘗試重組起。
目前的...


剛剛看到的造字網站,
也許你會有興趣去連絡看看。

https://cjkfonts.io/blog/fonts

FLYFLY4 2021-05-14 09:32 PM

引用:
作者oversky.
剛剛看到的造字網站,
也許你會有興趣去連絡看看。

https://cjkfonts.io/blog/fonts


這個網站的內容乍看之下像是以香港繁體字為主,
然而我的編輯需求是「臺灣正體字」,還是有差異。
看到這個網站推廣的字型,把「骨」下方的「肉」的「部首變體」,
寫成跟「月」幾乎一樣,我就不太能接受了。
還有臺灣正體字的「溫」右上部件是 「囗+人」,
但這個網站範例的「溫」右上部件卻是 日or曰。

oversky. 2021-05-14 10:06 PM

引用:
作者FLYFLY4
這個網站的內容乍看之下像是以香港繁體字為主,
然而我的編輯需求是「臺灣正體字」,還是有差異。
看到這個網站推廣的字型,把「骨」下方的「肉」的「部首變體」,
寫成跟「月」幾乎一樣,我就不太能接受了。
還有臺灣正體字的「溫」右上部件是 「囗+人」,
但這個網站範例的「溫」右上部件卻是 日or曰。


引用:
「誰」就是一部以機器學習、深度學習為製作字體用途的工作站


引用:
中文字體製作是很花時間的,為了減輕製作時間,我們使用AI深度學習協助造字,製作後的字然後經過設計師後期調整及修正,整個過程可以縮短製作時間及減輕製作成本。


我看的重點是這個。
應該把你的精力集中在這個後期調整及修正,
不然要一筆一畫去刻實在太花人力時間了。
你說的字型寫法問題,只要一開始找臺灣正體字來做機器學習的基底,
AI應該就可以訓練出同風格的字型。
你看下面這一頁,

https://cjkfonts.io/blog/cjkfonts_handwriting4
引用:
cjkFonts 手寫4 是基於 清松手寫體4 透過AI深度學習造字,原本清松手寫體4大約有4千幾百字,使用AI已造了2萬7千字,但因為要時間後期製作,現在只釋出大約1萬2千字,其餘的字待有時間才再加入。

由於是電腦學習了字型的特點及風格後,每個字根據學習後的數據造字,所以字體的風格會跟清松手寫體4有輕微的分別。

今次是1萬2千字的版本,大約用了2個月時間完成製作。清松手寫體4的風格跟一般字變化比較大,在整過訓練過程中,要反覆檢視結果,然後再訓練,再檢視,直至大部份的字型跟原版接近才能開始後期製作。

FLYFLY4 2021-05-14 10:23 PM

引用:
作者oversky.
我看的重點是這個。
應該把你的精力集中在這個後期調整及修正,


「後期調整及修正」這部分就是要動用到繪製向量圖的數位繪圖技術。
我前文就有提到我只會操作微軟小畫家的點陣圖基礎而已,向量圖我只會剪貼而已。
如果我能夠把 二一四個部首、五一七個部件 全都整理出來(目前進度粗估 五分之四),
之後剩下的數千個常用正體字,基本上也都是 二一四個部首、五一七個部件的重組+微調+修正。
我已經把 常用正體字 依「部件」做好分類排序了,所以「重組」其實還好,基本上就是剪貼,
費工的依舊會是「微調+修正」。

FLYFLY4 2021-05-16 03:09 AM

這裡試試看當個伸手牌,有問有機會,目前為止我還搞不定的部件和部首至少還有:

我無法找出我認為可信任的官方公告(數位版)資料來確定中華民國教育部的這個部首「⼹」的目前「最新標準版本」教育部官方標準楷書寫法到底該怎麼寫/寫成什麼樣子?
https://www.cns11643.gov.tw/wordView.jsp?ID=75609
https://www.cns11643.gov.tw/wordView.jsp?ID=205120

我剪貼出來的部首「缶」樣貌為超粗體,我搞不定將之修飾為正常粗細的操作流程。
https://www.cns11643.gov.tw/wordView.jsp?ID=75834
https://www.cns11643.gov.tw/wordView.jsp?ID=84047

我剪貼出來的部首「竹」樣貌為超粗體,我搞不定將之修飾為正常粗細的操作流程。
https://www.cns11643.gov.tw/wordView.jsp?ID=75831
https://www.cns11643.gov.tw/wordView.jsp?ID=84044

我剪貼出來的部首「毋」很醜。
https://www.cns11643.gov.tw/wordView.jsp?ID=75631
https://www.cns11643.gov.tw/wordView.jsp?ID=83281

我剪貼出來的部首「艸」很醜。
https://www.cns11643.gov.tw/wordView.jsp?ID=75853
https://www.cns11643.gov.tw/wordView.jsp?ID=139882

我剪貼出來的部首「豸」太窄了。
https://www.cns11643.gov.tw/wordView.jsp?ID=75866
https://www.cns11643.gov.tw/wordView.jsp?ID=140580

我剪貼出來的部首「血、皿」太扁了。
https://www.cns11643.gov.tw/wordView.jsp?ID=84070
https://www.cns11643.gov.tw/wordView.jsp?ID=83575

我剪貼不出來「承」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=85333
https://www.cns11643.gov.tw/wordView.jsp?ID=80418

我剪貼不出來「臾」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=85819
https://www.cns11643.gov.tw/wordView.jsp?ID=80250

我剪貼不出來「秉」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=85798
https://www.cns11643.gov.tw/wordView.jsp?ID=80249

我剪貼不出來這個部件。(私人造字區碼位)
https://www.cns11643.gov.tw/wordView.jsp?ID=80198

我剪貼不出來「年」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=84001
https://www.cns11643.gov.tw/wordView.jsp?ID=80171

我剪貼出來的部件「夷、弗」很醜。
https://www.cns11643.gov.tw/wordView.jsp?ID=83818
https://www.cns11643.gov.tw/wordView.jsp?ID=83537
https://www.cns11643.gov.tw/wordView.jsp?ID=79969

我剪貼不出來符合教育部筆畫規範的兩種方向的佛教萬字符號
https://www.cns11643.gov.tw/wordView.jsp?ID=139811
https://www.cns11643.gov.tw/wordView.jsp?ID=205613

我剪貼不出來「丱」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=139587
https://www.cns11643.gov.tw/wordView.jsp?ID=79973

我剪貼不出來「甩」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=83567
https://www.cns11643.gov.tw/wordView.jsp?ID=79958

我剪貼不出來「戉」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=139613
https://www.cns11643.gov.tw/wordView.jsp?ID=79918

我剪貼不出來「毌」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=139584
https://www.cns11643.gov.tw/wordView.jsp?ID=79733

我剪貼不出來「丑」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=83040
https://www.cns11643.gov.tw/wordView.jsp?ID=79727

我剪貼不出來「丰」這個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=83044
https://www.cns11643.gov.tw/wordView.jsp?ID=79687

我剪貼不出來「孑、孓」這兩個部件。
https://www.cns11643.gov.tw/wordView.jsp?ID=79461
https://www.cns11643.gov.tw/wordView.jsp?ID=83022
https://www.cns11643.gov.tw/wordView.jsp?ID=79466
https://www.cns11643.gov.tw/wordView.jsp?ID=83023

其他的基本上我都組合出來了(但有部分字圖組合得還是有些許醜醜的)
我的需求是,這些部件和部首字元向量圖必須要以符合中華民國教育部國字(正體字)筆畫規範的方式「一筆一畫」的組合疊加出來。
必須在 fontforge.app 內完成編輯,不要丟給我中空字,筆畫風格需求為盡可能地接近中華民國教育部標準楷書(民國108年版本),
越接近越好,若能達到百分之百一致,那超棒的!(所以不用提示我Win9X系列內建的標楷體了,這個版本太舊了)
我在組合的過程中,會發現有些筆畫字圖在重疊時,會出現重疊處黑塊遮蓋的問題,我不會細部形容,總之我搞不定這個問題。
如果我能搞定以上問題,原則上我就可以進階到下一個階段,
也就是開始嘗試來組合出六千六百多個臺灣社會日常生活常用的國字/正體字了。

或許還有人說,不就拿 中研院漢字構形資料庫 來剪貼照抄就好了?
問題就是 漢字構形資料庫 的楷書、 跟 教育部標準楷書,依舊有筆畫、筆順、甚至風格上的差異。
簡單來說就是公家機關「不同調」,多頭馬車、各自為政。

四個舊版注音符號的部分,我有嘗試寫信給教育部,
請教育部補足這四個舊版符號的筆順演示向量圖檔,
很遺憾的是教育部的回信,就我的解讀,簡單來說就是「踢皮球」。

FLYFLY4 2021-05-16 04:37 AM

目前進度,「秉」字剪貼出來了。

FLYFLY4 2021-05-16 04:26 PM

目前進度,「臾」字剪貼出來了。

oversky. 2021-05-16 04:30 PM

貼出來看看效果如何。

FLYFLY4 2021-05-16 04:55 PM

1個附加檔案
引用:
作者oversky.
貼出來看看效果如何。



我全部都是從 中研院漢字構形資料庫楷體、全字庫正楷體、教育部標準楷書 剪貼而來。
但我剪貼得不夠精準,畢竟我沒有數位向量圖美工專業。
細修調整得更精緻更接近中華民國教育部標準楷書,需要數位美工專業。

單一字圖,每一筆畫全為獨立繪製再堆疊而成。

FLYFLY4 2021-05-16 05:00 PM

1個附加檔案
還在編輯中的畫面,517部件的部分


所有的時間均為GMT +8。 現在的時間是11:33 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。