瀏覽單個文章
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
一個狀況有問有機會,盡量嘗試描述問題,希望問題不會被誤解。

我想找一份現成既有的懶人包彙整資料集文件,
呈現的內容「是要」針對/面向中華民國國語/正體中文漢字的母語/母文字者,
而「不是」針對/面向學習中華民國國語/正體中文漢字的外國人。
我嘗試以下情境舉例來問,
「同義詞」
https://dict.revised.moe.edu.tw/dictView.jsp?ID=55758
例詞:「贊成」「同意」。
教育部國國語辭典群(簡編本、修訂本)很零碎的東查西查應該可以找到不少同義詞。
但在多個同義詞之中,理論上應該會有其中某一個詞彙,
是所謂「最基本」的詞彙、或者所謂的核心詞彙,
其它同義詞彙、或相似詞彙,都是延伸詞彙。
我想從中華民國教育部國語辭典群(簡編本、修訂本)之中,
把「最基本」的詞彙、或者所謂的核心詞彙,有效率的萃取出來,單獨列表。
那是否已經有現成的、已經萃取出來的懶人包電子文件檔存在?可以下載?

這份彙整資料集文件裡頭所收錄的詞條,我會希望是以連續兩個字,
或連續兩個字以上的詞條為主,而不是收錄一個字的詞條。
如果現階段網路上「完全沒有」我描述所需要的彙整資料集文件存在,
那「教育部國語辭典公眾授權網」所下載的資量檔,
有沒有既有的文書軟體的操作技巧(圖形介面操作優先),
可以「有效率的」把我描述所需求的資料淬取出來?
我有試著自己先google關鍵字,找到這份彙整資料集,
參考指引、技術報告及字詞表等文件下載
https://coct.naer.edu.tw/download/tech_report/
三等七級詞語表(Excel 格式)
基礎詞彙表(Excel 格式)
然而這份彙整資料集「不是」面向母語者的,
是面向學習中文的外國人的。

我試著再找一個類型比喻,中華民國教育部成語典
https://dict.idioms.moe.edu.tw/
輸入關鍵字串「成章」來搜尋,會找出一堆成語詞條,
目前為止可以找到其中兩個成語詞條被標示為「主」(主條成語),
其它(副條成語、參考詞語)沒有標示,
我需要的就是被標示為「主」的成語詞條。
(這裡只是比喻,我沒有要在這一則提問中詢問萃取出所有主條成語)
 
舊 2022-12-07, 11:44 PM #492
回應時引用此文章
FLYFLY4離線中