瀏覽單個文章
oversky.
Junior Member
 

加入日期: Feb 2013
文章: 752
引用:
作者FLYFLY4
流行語言請在民間的娛樂文化作品集裡頭出現就好,
例如 臺灣在地的PTT鄉民百科、Komica Wiki 這類型的場合,
就是 流行語言 彙整的很不錯的場合。
當代官方的國語辭典,從來就不該也不能蹚網路次文化流行語的渾水。


什麼是次文化,什麼已經變成主流文化?
你是怎麼判斷分類的?
科學的方法是收集每年各種媒體內容分析辭頻。
看看牛津怎麼做的。

https://www.storm.mg/article/4023173
引用:
「牛津語言」透過檢視全球新聞內容來評估年度代表字的使用頻率,該語料庫表示,他們會收集每天更新的新聞內容,提供逾145億個單字供詞典編纂者搜索分析。牛津語言也表示:「對於詞典編纂者而言,鮮少有單一主題對語言造成如此巨大的影響,並在這麼短的時間內成為我們日常溝通的重要一環。隨著醫學突破與疫苗推出的報導全年不斷出現,牛津語言的英語監測語料庫追踪了疫苗相關詞彙在全球激增的情況。」


去看看去年各辭典新加的字
https://www.timeout.com/news/these-...you-know-122921

http://asbc.iis.sinica.edu.tw/
引用:
「中央研究院漢語平衡語料庫」 (簡稱 Sinica Corpus)第 4.0 版,為一包含一千多萬目詞的帶標記平衡語料庫。本語料庫中每個文句都依詞斷開,並標示詞類標記。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為 1981 年到 2007 年之間的文章,於2010年開始授權申請使用,而一千萬語料的查詢介面為2013年起提供查詢。語料庫共有 19,247 篇文章;1,396,133句數;11,245,330 個詞數 (word token) ;239,598 個詞形 (word type);17,554,089 個字數 (character token)。各主題其篇數如下:


中央研究院漢語平衡語料庫就只收集到 2007 年,
根本就不足反應現在語言使用的趨勢。
舊 2022-09-12, 09:08 PM #448
回應時引用此文章
oversky.離線中