PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 其他群組 > 七嘴八舌異言堂
帳戶
密碼
 

  回應
 
主題工具
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
https://language.moe.gov.tw/
教育部語文成果網 系統維護中 已經好幾天了,
這網站底下一大堆國語文資料,
現在需要引用,卻沒得查閱!

twitter一堆沒去官網查過資料就自以為的臺派,
我手癢想要回文卻發現我要引用舉證資料的官網下線中,
唉!
     
      
舊 2023-01-19, 04:25 PM #531
回應時引用此文章
FLYFLY4離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
twitter社群也有人在使用中共國標碼(GB18030)規範字形
https://twitter.com/FRabbitBox/stat...4670083/photo/1


我會覺得 漢字並非僅限漢語使用 是有那麼些 廢話(這樣太難聽了,改成 多此一講)的意味,
而且連老美都早就知道了。
https://unicode.org/charts/PDF/U4E00.pdf
 
舊 2023-01-20, 02:56 PM #532
回應時引用此文章
FLYFLY4離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
一個細節,去年十一月份,中華民國行政院數位發展部全字庫,號稱把四百多個重複的字元給關閉了。
https://www.cns11643.gov.tw/files/files/重碼字形關閉清單_公告版1111103(1).pdf
遙想好幾年前,有佛心網友留言提醒我,我依據全字庫的資源所編輯的注音輸入法表格檔,
裡頭有重複字元。我交叉比對之後抓出兩個字元,都有另一個字形完全重複的碼位。
印象所及全字庫的官網自2009上線十幾年來,中華民國政府機關一路拖到去年十一月,
才終於清掉了一定數量的重複字元。清掉重複字元這種「稽查動作」,
照理說網站上線三年內就應該清理的差不多了才對。
中華民國中央政府機關卻可以一拖十幾年,拖到執政黨都可能快要輪替兩次了,
說真的難怪中共規範的國標碼(GB18030),
可以如此悠哉的在臺灣社會體制內溫水煮青蛙現在進行式。
舊 2023-02-07, 12:43 AM #533
回應時引用此文章
FLYFLY4離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
豎心旁
https://www.cns11643.gov.tw/wordView.jsp?ID=270646

糸字旁
https://www.cns11643.gov.tw/wordView.jsp?ID=937528

言字旁
https://www.cns11643.gov.tw/wordView.jsp?ID=938051

這三個部首偏旁在過去行政院全字庫建立民用公共網站的這十幾年來,
如頁面內所示右半邊的全字庫楷體、宋體,兩款字形,其實是「筆畫不一致」的,
我201X世代後半發現之後就反映過了,行政院全字庫拖到今年,
終於把至少這三個字元的全字庫楷體、宋體兩款的筆畫修正成一致了。
當然,全字庫將近九萬五千字元之中,有筆畫瑕疵的不只這三個字元而已,
還有「一大堆」待修正的字元。
行政院全字庫修正的進度就是「龜到極點」。
難怪中共國標碼(GB18030)規範可以在臺灣社會體制內,
好整以暇的溫水煮青蛙現在進行式。
舊 2023-03-02, 02:51 AM #534
回應時引用此文章
FLYFLY4離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
中華民國中央研究院旗下有一些有關中文斷詞研究的專案,
例如新版的中文詞彙網路
https://lopentu.github.io/CwnWeb/#download
有設計成電腦資料庫的模式呈現,
相關資料也都公告在網站上,讓你下載取用。
然後我發現,如果我想要嘗試進階加值應用這些「中文資料」,
我必須「先學會英文」,因為其資料庫內容都是在「英文環境」中來建構的。
身為一個中文的母語母文字使用者,
當我嘗試要進階的應用自己的的母語母文字的時候,
卻反倒先得學好「外文/外語」,
才會有相對應的技術能力來加值應用自己的母語母文字,
我會覺得這是一種悲哀。

這個網站的網頁版,下中文詞彙關鍵字串查詢之後,
呈現出來的資料內容,是對中文詞彙基礎教育有幫助的「資料」,
我當然會偷懶,想要直接下載整套「懶人包」,在本機直接查閱比較方便,
就像中華民國教育部國語辭典公眾授權網,
可以下載試算表格式的辭典資料檔懶人包那樣,
可是這套專案採用的是 Python 程式語言技術框架,
也就是如果想要直接探索整個「中文」資料檔的「內容」,
例如 pyobj,那就必須先具備一定的英文程度和程式開發能力。
我沒有這樣的英文程度和成開發能力,
所以我沒有辦法把這個「中文」資料庫的內容解析出來,
明明中文是我的母語母文字,
卻因為這個中文資料庫所隔的那層皮是英文的,導致我解析不了它,
遺憾!
舊 2023-03-03, 12:47 AM #535
回應時引用此文章
FLYFLY4離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
關於「食」的偏旁部件模式,一個細節,
全字庫
https://www.cns11643.gov.tw/wordView.jsp?ID=938849
我還記得我的國民小學階段(198X末∼199X初),
學校老師教給我的「食」,人的下方是「點畫」。
時間一晃眼來到200X世代前半,出現讓我納悶的狀況,
為什麼有部分官方文件的「食」,人的下方是「短橫畫」,
跟我在國小的國語課學的「不一樣」!?
很後來我自己主動在教育部官網查閱資料,才發現,
原來1998年,中華民國教育部國字標準字有筆畫改版,
「食」的中間筆畫,從「點畫」被改成「短橫畫」。
1998年我還是高中生,臺灣體制內教育環境「完全沒有」主動告知我,
「筆畫被改版了」這件事。
更多的問題來了,中華民國旗下的所有各級「政府機關部門」,
「並沒有」在1998年之後的一小段時間內全都同步改版,於是近二十年來,
各級「政府機關部門」多頭馬車各自為政,新舊版本混用。
臺澎金馬領域範圍「又沒有」中國大陸美國加拿大等國家來得大,
政府機關沒有在短時間內同步規範,實屬「不合理」。
例如中華民國行政院數位發展部「全字庫」這個單位,
拖到二十多年後的今天,才終於把「食」的點畫,
修正成跟中華民國教育部國字標準字同步的短橫畫。
「全字庫」還「不是」一次就到位的修正,
全字庫一開始只有修正「正楷體」,「正宋體」沒有修正,
然後我去留言反映問題,過了一週的工作天之後,
全字庫才把「正宋體」也修正,
全字庫有夠「被動」,很會「事情做半套」。
臺灣社會之所以會被「中共的規範」溫水煮青蛙現在進行式,
中華民國政府機關的「被動」、「事情做半套」功不可沒。
舊 2023-03-07, 01:09 PM #536
回應時引用此文章
FLYFLY4離線中  
oversky.
Junior Member
 

加入日期: Feb 2013
文章: 719
1947 年版國語辭典是「短橫畫」



1981 年版國語辭典是「點畫」



1982 常用國字標準字體表是「短橫畫」

此文章於 2023-03-07 01:40 PM 被 oversky. 編輯.
舊 2023-03-07, 01:36 PM #537
回應時引用此文章
oversky.離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
結果發現「全字庫」在我的貼文當下依舊還是「做半套」,
全字庫「食」的部件,人的下方還是「點畫」
https://www.cns11643.gov.tw/wordView.jsp?ID=80430
https://www.cns11643.gov.tw/img/component/484.jpg
唉∼∼∼
公家機關真的「很被動」。
舊 2023-03-07, 01:51 PM #538
回應時引用此文章
FLYFLY4離線中  
oversky.
Junior Member
 

加入日期: Feb 2013
文章: 719
教育部4808個常用字說明.pdf
https://www.google.com/url?sa=t&rct...eilBO6KUOfcFo1r
為能正確呈現標準字體,建議您安裝「教育部標準楷書」字形檔。
舊 2023-03-07, 02:15 PM #539
回應時引用此文章
oversky.離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
早就安裝了。
若真的要刁起來 教育部標準楷書 其實也不是百分之百正確的,
簡單來說就是 ,
教育部自己公告的最新版範本,
也都會「不符合」教育部自己公告的最新版規範。

引用:
作者oversky.
教育部4808個常用字說明.pdf
https://www.google.com/url?sa=t&rct...eilBO6KUOfcFo1r
為能正確呈現標準字體,建議您安裝「教育部標準楷書」字形檔。
舊 2023-03-07, 02:38 PM #540
回應時引用此文章
FLYFLY4離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是01:31 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2024。