跳去內容

三及第

出自維基百科,自由嘅百科全書

三及第粵拼saam1 kap6 dai2國際音標[saːm˥ kʰɐp̚˨ tɐi̯˧˥])係一種夾雜文言書面語(基於標準官話白話文)同埋廣東話嘅一種書寫文體。三及第早就嚮清朝出現,好似係招子庸作嘅粵謳,又或者邵彬儒作嘅《俗話傾談》都係用三及第嚟作嘅。[1]而呢種三及第喺 1940年代至到 1960年代嘅香港新聞紙好流行[2]。早期廣州新聞紙亦有[3],個作者可以隨意嚮一篇文用呢種文體嚟達到唔同嘅效果,用文言令讀者覺得格外嚴肅,用國語就較之為中性,用廣東話就覺得親切、市井。

問題

[編輯]

如果攞三及第噉嘅文字當做粵語語言資源訓練 AI 學粵語,就會出好似以下噉「唔鹹唔淡」嘅 output [4]

Output:「有一日,一只雞跟一隻兔兩兄弟把車開去自己屋企。突然間車就壞咗。」
純中文書面語:「有一天,一只雞跟一只兔兩兄弟把車開去朋友家。突然間車就壞了。」
純粵語白話文:「有一日,一隻雞同一隻兔兩兄弟揸車去朋友屋企。突然間架車就壞咗。」

例子

[編輯]

人物

[編輯]

(參考來源:[5]

  • 黃言情
  • 鄧羽公
  • 任護花(周白蘋)
  • 襯叔
  • 忠義鄉人
  • 林瀋
  • 陳魯勁(我是山人)
  • 高雄(經紀拉、三蘇)
  • 陳霞子
  • 林壽齡
  • 江之南
  • 黎彼得 (填詞人)
  • 黃霑

引咗

[編輯]
  1. https://hub.hku.hk/bitstream/10722/199783/1/Content.pdf
  2. Cantonese as Written Language, p127, Don Snow, Hong Kong Univsersity Press, ISBN 978-962-209-709-4
  3. 及第原著喺2016年3月4號歸檔。喺2008年6月2號搵到
  4. 大語言模型點樣令廣東話走出低資源語言嘅惡咒
  5. 台客聚:粵語文學兩大將原著喺2014年1月9號歸檔。喺2010年9月24號搵到

[編輯]

[編輯]