(beta 公測版本)
< 返回

《粵文書寫方式續探》

作者:擇言
日期:2019年12月26日

「粵文」係用粵語做基礎發展而成嘅書寫語言(written language)。大家好鍾意叫「粵文」做「寫口語」、「寫廣東話」。粵文一早已經去咗一個新階段,唔再係寫低口語咁簡單,已經成為咗一種書寫語言。

2014年2月,我用擇言名義寫過一篇〈粵文書寫原則初探〉(下稱〈初探〉)。經過 5 年時間,粵文繼續蓬勃發展,不斷有人加入粵文寫作嘅陣營,嘗試用各種方式去解決粵文書寫嘅各種問題。有賴各地粵語人口嘅堅持,粵文已經係一隻發展得非常成熟嘅語言。喺缺乏「大台」嘅情況下,幾個分屬唔同行政體、口音各異嘅粵語地區,用粵文溝通都冇太多阻滯。雖然話冇阻滯,但係粵文確實係有進步空間嘅。最為人詬病嘅,係粵文喺書寫上冇一錘定音嘅標準,結果係連最常用嘅字,寫法都會有分歧。我好明白就算冇大台,問題依然係需要共識嘅,亦有啲冤枉路係已經有人行過嘅要告誡新手;所以接住前排〈粵文發展方向嘅整理〉一文,今次我會整理一下現有問題,再改良書寫上嘅選字原則,同埋討論漢字以外嘅書寫方案。

〈初探〉提出嘅選字原則係:

如無本字,從眾從俗,寧同音假借,忌用生僻字

大原則基礎不變,但係必須深入闡述。目標好簡單:粵語詞寫唔出,我哋就幫大家揾個方法出嚟寫。呢個方法應該唔使接受嚴格訓練,所有人用直覺(intuition)就自自然然會揀出相近嘅寫法。我認為呢個方向係冇錯嘅,但係有好多 marginal case 未處理 — — 即係「有 bug」。首先我會 fix bug(除蟲),跟住喺最底我會再回應「砍掉重練」、「不如唔好用漢字」呢類建議。

你可能想話:啲字冇標準,揾一個人幫我哋定晒佢咪得囉!做乜要我睇咁多字,諗咁多嘢?話說台灣教育部用行政方式幫閩南語(台灣話)、客語每一個詞決定咗一個標準寫法。結果除咗教科書之外,冇人理佢哋。
我並唔係教育局,學者都唔係宗教領袖。香港呢種冇大台嘅環境,點樣先至做到嘢呢?就係要有原則,有默契。喺你創作、寫嘢嗰陣,大家唔可以秒秒鐘用腦電波交流,又要做到相似嘅用字決定。方法啱嘅話,你啲嘢就算未必 100%一致,但係都未至於相差太遠。好多人渴望一個嚴格規範標準,現實話我哋聽由上而下去設定標準係不切實際嘅。你諗下,每次打短訊都查完字典先准出街你會點?所以,有共同嘅原則,係緊要過「千字規範表」好多。我哋要共同原則,唔係規範。要原則,唔要規範。要原則,唔要規範。

改良揀字原則

具體實行上,「如無本字,從眾從俗,寧同音假借,忌用生僻字」呢十八隻字有好大嘅詮釋空間,令到大家以為淨係得理念,唔可以實踐。好似話,點決定有冇「本字」?有本字的話係咪繼續「從眾從俗」?俗字有幾個,點樣揀?「同音假借」嘅「同音」照顧緊邊個地區?「生僻字」點定義?我試吓畫公仔畫出腸,再展開啲之前略過嘅部份,希望可以減少大家嘅疑惑。

【如有本字,可寫本字】
例如「食 sik6」「飯 faan6」「有 jau5」「人 jan4」呢啲,係漢字圈共通嘅嘢,我哋係唔需要刻意創一個獨特嘅字去寫。另外一啲同其他漢語共通嘅詞,亦都唔使刻意整啲新寫法去凸顯自己唔同。記住「乜嘢係粵文」唔係靠異化去定義 — — 堂堂一隻上億人口使用嘅語言,唔使用「同普通話唔同」嚟定義自己。

【如有需要,可立新字】
留意上面嘅本字立場,係「可」寫,唔係「應」寫。有本字並唔一定應該用本字去寫。有時寫本字反而係造成混亂。
以下情況唔應該追求本字:

發音改變
例如弱化(「毋 mou4」「唔 m4」、「個 go3」「嘅 ge3」)、韻母有變化(「來 loi4」「嚟lai4」)、聲母變化或脫落(「質 zat1」「扤 at1」)、聲調變化(「個 go3」「嗰 go2」、「物 mat6」「乜 mat1」)、合音(「天光日 tin1 gwong1 jat6」「聽日 ting1 jat6」、「底物 dai2 mat6」「點 dim2」)

辨義需要
例如詞義分化(「嗰(指示代詞)」「個(量詞)」、「係(繫詞)」「喺(表位置)」),句末助詞(「啦laa1」「喇 laa3」),區分近音字、多音字(「仲 zung6」「重 zung6/cung4/cung5」、「冇 mou5」「無 mou4」)

外語借詞
漢字圈之間亦有借詞現象,例如經日語借入嘅「奸爸爹 gaan1 baa1 de1(頑張)」潮州話借入嘅「打冷 daa2 laang1(人)」、香港粵語橫向借用台山話嘅「地除 dei6 ceoi4(知道)」、普通話嘅「些些 se1 se1(謝謝)」「鳩鳴 gau1 wu1 (購物)」等等。寫出來源就會變成另一個唔同意思嘅粵語詞。我「今晚去打冷 laang1」(意思係「食潮州菜」)寫做「今晚去打人」,應該都會造成好多誤會。

好多人對「本字」有執着,覺得粵語嘅詞要用正確嘅字嚟寫,否則就係令書寫系統崩壞。事實上適當時候放棄原字,先至係漢字系統嘅正常生態。唔放棄的話,個系統就會有大量訓讀、生僻讀法,影響使用。

【如無本字,從眾從俗】
有好多詞可能係本字根本就唔係漢語,刻意追求一個「本字」冇咩意思。譬如近指代詞「呢 ni1/nei1」係侗台底層詞(對應嘅泰文係 นี่,鄰近嘅壯語、寮語都有對應詞)。如果已經有約定俗成嘅寫法,照用就得。例如近指代詞喺香港嘅俗寫係「呢 ni1」或者「依 ji1」(個人差)。毋需專登喺古書度揾近義嘅同音字。喺現有詞表入面,大部份字都屬於呢類,係現行用法嘅整理。

【寧願假借,忌用生僻】
從眾從俗係唔夠嘅,因為有時有多過一個候選,所以揀字嘅精神亦都要有共識,判斷邊個好啲邊個差啲。並非硬性規定,因為所有用法永遠係「民眾基礎」行先,多人用,一定好過 完美但係少人用 嘅寫法。

【如有競爭,共識優先】
好好彩至少喺香港粵語入面,大部份貌似有爭議嘅嘢,都係「已經起碼有一個寫法係所有人都會睇得明,而且冇歧義」。好似你用語音輸入打字,出咗「聽日我哋喺呢度食嘢」應該大家都接受。你自己寫可能「哋」會寫做「地」,「呢度」會寫做「lee道」,「喺」會寫「係」等等,但係「聽日我哋喺呢度食嘢」大家都未至於話抗拒。噉已經係好好嘅共識基礎。例如量詞「di1」有好多個寫法,「啲」「D」「的」「滴」「尐」都有人用。但係估計「啲」係爭議最細嘅一個,噉我哋就大可以用住呢個先。

就算過咗幾多標準化都好,總會有啲詞係定唔到落嚟。好似時不時有人問「『呢度』定係『依度』先至啱」。我哋有兩個接受度同樣係好高嘅寫法。好似話「A」嘅細楷,寫「𝗮」定係「𝑎」先至啱?「呢度」嘅意思,喺北京話書面語寫「這裏」定係「這裡」定係「這兒」?如果搞完一輪,都仲係有幾個寫法,同樣噉有民眾基礎、係同音字、唔生僻,噉可以點揀呢?即係兩個寫法都命不該絕,由得佢哋存在就可以。

香港嘅標準化已經大致成形,其他粵語區嘅情況據我所知都唔算太差。只得大約 100 個語素,係香港個個寫法大家都覺得差、覺得未夠好嘅。呢啲項目需要大家幫手推廣建議嘅寫法。

有一部份同一個漢字功能太多,用嚟寫幾個語素,例如:
「冧」 可以用嚟記「lam1(鍾意)」、或者「lam3(瞓低、倒下)」
「忟」 可以用嚟記「man3(時間趕)」、「mang2(躁、唔耐煩)」
「掂」 可以用嚟記「dim3(接觸)」、「dim6(直、OK)」
「咪」 可以用嚟記「mi1(音譯)」、「mi4(音譯)」、「mai1(microphone)」、「mai5(唔好)」、「mai6(唔就係)」

另外仲有啲連諧音字都好難揾嘅嘢。
keu4 leu1
kik1lik1kaak1laak1
he3 (一般寫做 hea)
kip1 (一般寫做 keep)
beu6

樂觀啲諗,如果只係得呢幾十個字要改良,噉作為書寫體嚟講,標準化程度已經相當完善。人係追求完美嘅。有 99% 好,就會有人問可唔可以去到 100%。所以跟住我會講吓漢字以外嘅書寫方案。
漢字以外嘅方案

有時,大概係寫一千字會有一次咁上下,大家會有啲講法想寫,但係又寫唔出,好多時係底層詞、擬聲詞,又或者係英文借詞。於是就有人質疑「用漢字寫粵語」呢個前設。呢一點可唔可以質疑呢?事實上鄰近有唔少地區有多於一套書寫系統:台灣有注音符號,日文有假名,韓文有諺文。粵文又得唔得呢?如果唔堅持樣樣嘢都造一隻漢字,自由度係咪更加大呢?答案肯定係「係」。

我哋就嚟睇吓:如果用漢字配搭其他系統,究竟有咩選擇,再傾返粵語係咪應該繼續用全漢字書寫。

諧音字、自創字書寫
例如「lift」呢個字進入咗粵語,當年有人就用「立」做聲旁,「車」做義旁,整咗個「𨋢」字出嚟。如果要全漢字書寫嘅話,好多借詞暫時係未有方法寫嘅。上表整理咗好多用漢字(或漢字嘅構字方式)處理英文借詞嘅做法。並明 bingming 喺佢嘅小說入面,用咗好多呢種處理方式,好似「feel」佢會寫做「㤇」,另外仲有好多得意用法。

漢羅並用
可以用漢字嘅就用漢字,其他嘅就用英文串法、各式粵語拼音。呢種用法最大嘅支持就係本來香港粵語就有大量英語借詞,與其夾硬揾隻漢字去寫,不如索性寫返個英文字落去。好似話下面呢句嘢:
阿 ger 叫我 present 上次嗰份 report。
ger 係 manager 嘅縮略,讀音係 zoe4(啫啫仔入面,第一個啫),present (pri4 sen1)同 report (ri6 pot1)都係英文。噉直接用返英文串法都好合理。

其他拼音文字
不過漢字同拉丁字母睇落好唔夾。於是又有人諗,要整得美觀,不如學東亞其他相似系統,去為粵語整一個方案。早喺民國初年就有人用注音符號去寫粵語嘅發音,其後又有好多官方或者民間嘅變體。其餘嘅方案仲有諺文書寫、假名書寫、自創文字等等方式。

下面我嘗試用其中幾種漢羅並用、其他拼音文字系統嘅做法,俾大家比對。

注意,呢度冇將其他「正字系統」放入嚟。「邇度尐虢礫緙嘞野你幫手keep住先,我等迆陣返來領。」呢種充斥偽正字嘅寫法相信唔會為大眾接受,亦難以推廣。

呢度啲 kik1 lik1 kaak1 laak1 嘢你幫手 kip1 住先,我哋 he3 陣返嚟拎。
呢度啲 kick-lick-kark-lark 嘢你幫手 keep 住先,我哋 hea 陣返嚟拎。
呢度啲 ㄎ丨ㆶㄌ丨ㆶㄎㄚㆶㄌㄚㆶ 嘢你幫手 ㄎ丨ㆴ 住先,我哋 ㄏㄝ 陣返嚟拎。
呢度啲킥릭칵락嘢你幫手킾住先,我哋해陣返嚟拎。
呢度啲キックリックカックラック嘢你幫手キープ住先,我哋ヘー陣返嚟拎。

如果想「工整」,用諺文一定係最好選擇。原因係韓語同粵語嘅音系有相近之處,都係 CVC 嘅構造,諺文又係方塊字,形狀都夾。但係可惜香港嘅韓文普及率極低,而外來系統夾極都有個譜,總會有嘢撞。一隻半隻字用其他系統輔助尚可,全部轉做輔助系統,並唔現實。

好似用純粵拼或純英文串法睇落都唔太可行。
ni1 dou6 di1 kik1 lik1 kaak1 laak1 je5 nei5 bong1 sau2 kip1 zyu6 sin1, ngo5 dei6 he3 zan6 faan1 lei4 ling1.
ni dou dee kick lick lark lark yeah nei bong sau keep chu sin, ngo day hea jun farn lei ling.

由文字發展嘅角度去睇,為粵語創造一套新表音文字必然係最「科學」嘅方法,亦都可以滿足最多嘅要求,但係發展上粵語區缺乏誘因(冇文盲,識字率極高,本身大部份字已經有得寫),亦缺乏條件(未有支持粵文書寫嘅公共行政機關,粵語學界未有共識)。而所謂「最理想嘅方法」,喺未有條件之前,最終只會係小眾嘅玩意。另外每一種創新嘅系統,都係衝擊緊用方塊字嘅系統,究竟應唔應該做?照睇大眾嘅意願係唔想,我哋嘅文字習慣未足以令我哋覺得要為咗唔夠 1% 嘅書寫不便去到放棄漢字。現行做法係以漢字書寫為基礎,而混合式書寫,暫時就只得漢羅並用係有實行(implement)嘅可能性。
因此最後我加埋呢句

【漢字可取,盡用漢字,如無漢字,考慮英數】

粵文用字標準化嘅框架
有以上原則之後其實並未完成。而係有咗原則之後,我哋可以建立返一個共識嘅列表。未有原則前,用邊個字好係鬥大聲,邊個惡、邊個扮到權威,隻字就留低。有原則之後,大家有得傾:有得判斷邊個字可取啲,甚至係為個別地區、群體度身訂造最好嘅書寫方式。

粵文並唔係香港嘅粵文。粵語係國際語言,文字嘅發展都要照顧返地域差異。粵文用字嘅標準,喺香港叫做相當穩定;但係放度成個粵語區,難免會有地區分歧。香港嘅粵語係「廣州音」系統,活躍人口最多,但係語音變化都比較多,同各地嘅粵語可能有出入。好似話「左」「阻」喺香港粵語係同音嘅,但係前者喺中古屬於「精組」,後者係「照組」,精照組嘅讀音喺部份粵語仲有區分。於是動詞嘅完成態(perfective)後綴寫「咗」對於一部份人嚟講就唔可以接受,因為發音上「唨」先至啱音。有時甚至同一地區,都按年齡分成兩種變體。好似香港有好多人覺得「梗」「緊」同音(或近音),所以會寫「食梗飯」「做梗嘢」。噉要照顧到幾遠?係要照顧唔同地方嘅廣州音系統?定係成個粵語區?定係包括埋全個漢字群體?回顧返我哋目的本身係以粵語為本,但係要照顧嘅人越多,受嘅制肘就越大 ,越唔可以靠直覺行事 — — 呢層係所有標準化都要面對嘅問題。又例如有啲字香港已經有慣用寫法(好似否定詞 m4 寫「唔」),呢個寫法早喺屈大均(1678)嘅《廣東新語》已經出現過。但係「吾」喺某啲地區係「ngo」或者「ngu」,唔夠直觀,所以會選擇用「毋」。

好彩呢個問題係有得解決嘅,就係承認肯定有一啲嘢係照顧唔到,唔強迫每個地方都用指定嗰套正字。香港習慣(其實亦係廣州話系統嘅習慣)同其他地區唔同嘅,只要做字元轉換就得。標準化唔係揀出一個正確寫法去取締其他寫法,而係要喺「保留自己特色」同「方便交流」之間攞返個平衡。列出容許範圍,接納地區變體,尤其重要。例如遠指代詞 go2 假定以「箇」作為建議用字,但係可以同時列出「嗰」為香港變體,另外接受「戈 go1」為澳門變體。

原理同處理中文嘅繁簡、地區轉換嘅 localisation (本土化)相同。成個粵語區嘅標準,可以由成個粵語區去諗,香港可以有香港嘅標準、其他地區可以各自按自己習慣制定標準。本來繁簡轉換入面,都有唔少字元係用呢個方式去轉換:同樣係「wan1 暖嘅 wan1」字,香港嘅右上角係「日」(温),台灣嘅右上角係「囚」(溫)。對應關係明顯嘅,一樣可以用呢個方式去處理。

按照以上原則,尤其係「從眾從俗」要揀邊一隻字、「同音假借」嗰陣點樣叫「同音」,唔同地區係會得出唔同嘅結果。有需要的話可以為每一個語素建立一個意見平台,列舉坊間現行用字,測試每個字嘅親密度、接受度,按評分揀出建議用字(規範字),排除非主流異體字(例如冇任何理據嘅「假本字」)。平台上面可以俾大家評分判斷睇唔睇得明、自己願唔願意用、鍾唔鍾意人哋用等等。慢慢建立一啲符合原則嘅寫法。大家亦無需要為求統一而放棄自己原有習慣。整理完出嚟,如果只係得一二百個異體字,社會應該係接受得到嘅。

泛粵語區嘅寫法交流,已經有「泛粵大典」去整理。

最後用一個例子去總結。複數量詞 di1 點樣寫?

如有本字,可寫本字
→「滴」
如有需要,可立新字
→ 語音分化,滴 dik6 發音唔同 di1,否決
如無本字,從眾從俗
→ 俗寫有「啲」「的」「D」「尐」
寧願假借,忌用生僻
→ 排除「尐」:生僻字
如有競爭,共識優先
→「啲」「D」更有共識,「的」寫 di1 接受度較低
漢字可取,盡用漢字
→ 排除 「D」
如無漢字,考慮英數
→ N/A

所以喺香港我會用「啲」。

全文 4432 字 (唔計英文、空格、標點)