美國加州聖地牙哥台灣同鄉會
San Diego Taiwanese Cultural Association
http://www.taiwancenter.com/sdtca/index.html
  2004 年 11 月

解決台語『有音無字』第一步
翰聲

臺灣語文推廣的困境

『談詩、唸詩也難免會討論到詩的表現工具─語言文字,尤其是臺灣詩。有人認為臺灣詩應該完全用羅馬拼音表達,不必再刻意去尋找或創造沒有相對存在的漢字。也有人認為臺灣詩應該完全用漢字表現,真正找不到的字應該創造。這一個課題也是今日臺灣語言推廣的困境。』這是一段筆者在報導討論詩的讀書會的片段紀錄。其實不只是詩,臺灣語言﹝註一﹞書寫的問題是全面性的不論是客語或台語,我們這一代不把他解決,將永遠沒有機會。

臺灣政府應積極的主導研究一套可行的語言系統,民主時代的政府要制定統一語言文字是較困難,但卻不是不可行。但聽任民間各行其是,更增加學習者的困難。香港政府積極為廣東話的語言文字標準化及電腦化的努力,值得臺灣政府做為借鏡。

事實上文字的使用並無新舊之分,用就是活的,不用就是死的。但是既存的語言文字卻不應讓它流失。因為每一個字或一句話,都有它的文化發展背景和歷史。不能妥善保存「媽媽教我們的話」而任它荒蕪,就有忘本之嫌。華夏文化在秦始皇統一文字之後﹝書同文﹞,固然方便統治,但是卻消滅了被統合者的人性,同時也阻礙甚至於消滅了許多文明的發展,北方黃河流域的拘謹文明把長江流域及南方活潑熱愛大自然直率的文化消滅殆盡。最可悲的就是被統合的民族不僅不知或忘了自己所源的文化,尚且一直支持甚至於極力幫助推廣消滅自己祖宗文明的文明,甚至指責要發揚固有文明的不是。這種現象在台灣尤甚。 事實上,書寫文字是超乎統獨議題的,創造一套可以把「媽媽教我們的話」寫下來,是無關政治的。它是關乎一個文明的記錄和歷史。

『臺灣語文書寫的戰國時代』

數十年來,關心臺灣語文書寫的問題又積極行動創造台灣文字的專家非常的多。又幾乎是每一個有心人都創造一套臺灣語文書寫系統或創造台語漢字。而這些臺灣語文書寫系統或新創台語漢字都是創造者吐心嘔血的作品,所以每一位創造者都非常珍惜自己的創作。所以聽說每一次召開台灣語文研討會,結果都是百花齊放,百鳥爭鳴,無法得到一個結論。筆者稱這個時代為『創造臺灣書寫語文的戰國時代』。臺灣語文書寫最大的問題在於有音無字的辭彙。為何會有這個問題存在?筆者在此略作分析。

為何會『有音無字』?

一、因久不用而失落或肇因於知識不足而草率使用替代字。
例:蠻狠無理的人叫『壓霸』報張雜誌皆用『鴨霸』

二、外來語
台灣受過多種外裔的統治,吸收了很多的外來語,如日語、西班牙語、或荷蘭語,再加上原住民語,台灣話的語種是非常的複雜。例:『麵包』台語發音為『pahn』如漢音『胖』,源自義大利語『pane』由日語引進。台灣北海岸的『三貂』為『三貂窟』縮簡詞,源自西班牙語的『Sandiago』

三、助語字或自創字
台語有極豐富的雙音形容語尾詞,大抵是先民或說者自創。例:軟ㄒㄩㄜㄒㄩㄜ, 硬ㄎㄨㄛ ㄎㄨㄛ,白ㄆㄠ ㄆㄠ,黑ㄒㄩㄣ ㄒㄩㄣ

四、因地域口音不同,產生同字異音或誤以為無字。

五、以訛傳訛而失字
這種情形大概不少。如『今晚』台語發音為『陰暗』。筆者以為是『今暗』之變音。 應如是書寫。這當然需要考證。

台灣話因為沒有正式制訂的書寫文字,以口相傳乃至於漸漸地失去原本正確的語音。這在人類語言文字的發展是很正常的。這在已拼音為主的語言是很平常的現象,以英文為例,莎士比亞時代的英語和現代已有很大的不同。英文是拼音的緣故,因為習慣改變了舊有的拼音,約定成俗,也沒不是什麼大不了的事。但是為了能正確紀錄所有的語音,的確需要創造一個系統。

解決『有音無字』的各種方案

『有音無字』的問題應該分兩方面進行:一是由台灣的大學台灣語文學系或研究所進行研究考據語源,另一方面在還沒有找到語源之前先進行創字先行使用。專家研究找失落的文字。確定沒有相對的漢字以前,可以用下列方法訂立書寫的文字:

一、採用日語的片假名及平假名 ─ 採用日語的形式漢字及片假名及平假名並用,『有音無字』的部份用片假名及平假名。

二、採用已有『有音無義』的漢字
唐代玄奘大師譯佛經有五種情形的字詞不翻譯而採用原音,因此創造了很多沒有字義的譯音字。佛經的翻譯是有一套規矩的,就是所謂的『五種不翻』是玄奘大師所訂的。這五種不翻譯的原則就是拿來做為現代翻譯外文的準則仍然是可通的。『五種不翻』就是:
﹝一﹞ 祕密之故不翻、
﹝二﹞含多義故不翻、
﹝三﹞此方所無故不翻、
﹝四﹞ 順於古例故不翻、
﹝五﹞為生善故不翻。
這許多新創的『有音無義』的字除了在佛經以外很少被應用,但有些已被收入在漢字國際UniCode標準碼。若運用這些既有字找出發音相容者,可以馬上在電腦上使用。

三、用羅馬拼音
優點是有英語教育,不必另學一種拼音符號。缺點是台語無法完全用二十六個字母完全表達,及造成學習英語發音的困擾,對於幼童尤然。

四、採用既有漢字但另訂台語發音

五、新創漢字

六、新創台語音標﹝台語注音符號﹞
作家楊青矗所著的《台華雙語辭典》、《台語注音讀本》、《台語語彙辭典》及 《台灣俗語辭典》、台灣古體詩《台詩三百首》等皆以新式注音符號標注。頗受歡迎。

七、其它方法

分析各種方案的長短處

前四者的好處乃是已有國際UniCode標準碼可用,馬上可以用電腦輸入印刷或顯示。新創漢字及新創台語音標的限制,源於許多專家意見不一,各持己見不易取得通識制定標準的新字,新創字也無法馬上或及時收載入國際UniCode標準碼﹝註二﹞。

以羅馬拼音式全面取代漢字的方法,中華人民共和國在建國初期就已經實施過,因為無法在日常生活上實際應用而捨棄。除非能發展一套能表達聲調的拼音字母系統,否則羅馬拼音式將極難推行。用拼音文字的語言有一個極大的共同特?就是單純的語調。例如英語、西班牙語等歐語系語言僅有重音和輕重音。

日語也可以完全用拼音表達,他們也曾經試著刪減官定漢字字數,但是最後不但放棄這個企圖,反而為了方便更增加官定使用的漢字。韓語則無法用拼音表達,他們的方法是創新字,一音一字,因此他們在二次大戰結束以後開始使用的新創文字比原先使用的漢字字數還要多,因為包含漢字及韓語專有的文字。

北京話有五種音調已經經過實驗運用,證明無法完全使用拼音文字。台語有八種音調,從理論上來說或從技術上而言應該是更為困難。除非是以語詞﹝phrase﹞為單元,不要以字為單元或有可能。因此筆者認為『全漢字』、『漢和』或『漢羅』併用的書寫文字方案是比較可行的方案。筆者認為日本能夠快速的吸引現代文明建立為現代化的國家,又能保持他們特有的文化這和他們的文字有極重要的關係。台灣要能和世界的文明接軌,在文字中加入一套拼音系統是有必要的。


解決台灣話『有音無字』標準化必要的第一步

一、終結『臺灣書寫語文的戰國時代』
解決台灣話『有音無字』標準化的第一步應該是『兼容並蓄』:由政府主導指定現有政府機構如教育部,中央標準局,行政院主計處電子處理資料中心或委託台語文學術機構進行蒐集所有國內外已出版的台灣語文作品,以編輯已創的新字。為了避免爭端,筆者建議凡已有出版的接應採納。將所有蒐集所得的新創漢字或拼音字編輯成冊,並且在教育部的電腦網際網路網址設立專門網頁公佈。同一網頁也應公開徵求新創字或考據所發現的字。事實上,台灣話內『有音無字』的數目極有限,多不過上千,常用字更只是數百字而已。

二、建立「台灣語文資訊交換碼」及訂定「台灣增補字符集」
蒐集所得的新創漢字或拼音字編輯成冊的同時,應同時建立「台灣語文資訊交換碼」及訂定「台灣增補字符集」。電腦已是現代文明的一部份。能將台灣語文用電腦儲存、輸入、顯現或印刷是極為重要的。這個工作其實也不難,台灣人才及工具都是現成的。以現有國家標準CNS11643為基礎,根據『CNS11643全字庫V4.0使用手冊』的說明,CNS11643可以接受創造新字,臺灣書寫語文『有音無字』的問題只需要一個政府統籌單位負責執行,一切困難應該都可以迎刃而解。

三、台灣語文加入國際統一編碼ISO10646/Unicode
在編訂「台灣增補字符集」的同時應向Unicode Consortium申請增補台灣文字符號,Unicode收集有全世界人類所創的所有文字符號,漢字歸入CJK字集內﹝即中文日文韓文字集﹞,藏文也有他的一頁,甚至澳洲原住民所創的語言字符都有他的一頁。將台灣語文加入國際編碼標準的好處是台灣語文將可用任何電腦系統來儲存、輸入、顯現或印刷。台灣語文也可檢簡單單的在網際網路上發表。

結語

筆者建議的解決台灣語言『有音無字』標準化必要的第一步的三部曲,非常的簡單可以馬上進行,雖然分為三部曲,事實上是一體的三面可以同時進行。解決『有音無字』首要收輯已創的『有音無字』新字詞並加註發音及例辭例句,新字或新符號應及時編定「台灣增補字符集」,並申請加列入國際UniCode標準碼。雖然筆者也曾數次向臺灣政府高級行政官員建言,積極促進臺灣語言文字標準化及電腦化,積極將臺灣語新字匯合編輯並向ISO申請編入 Unicode,總是不得其門而入。希望有心人共同努力推動。


附:他山之石─香港字與ISO10646
香港政府為語言文字標準化及電腦化已訂定「香港增補字符集」並提交國際標準化組織﹝ISO﹞,以供考慮納入ISO10646國際編碼標準﹝Unicode﹞內。目前「香港增補字符集─2001」內的4,818個字符﹝文字符號﹞中,已有4,783個字被收入ISO10646國際編碼標準的現行版本內。剩下的35個特別字符則暫被收入ISO10646國際編碼標準的私人使用區﹝PUA﹞內,準備在日後新版發行放在標準版內。(註:一年前草擬此文時,Unicode的版本是3.0,目前已正式公佈第四版了。所以「香港增補字符集」應該已全數正式收集入Unicode。﹞

﹝註一﹞臺灣語言:包括福佬話、客語、原住民語。
﹝註二﹞國際統一編碼Unicode:電腦基本上是處理數目、文字和圖形。每一部不同操作系統的電腦都有一套不同的運作規矩和基本數碼。每一個字,不論是英文字母,漢字,或符號都有一定的代號。因為太多不同的基本數碼,在不同的電腦系統之間交換資料一直是一個很大的挑戰。『國際統一編碼』就是一個大家同意的數碼標準。『國際統一編碼』現在幾乎已包括全世界所有人類所創的語言文字及通訊符號。新創台灣文字若能列入『國際統一編碼』幾乎所有的電腦都能馬上處理這些文字。目前Unicode已和ISO10646同步,兩者已合二為一。台灣的中文電子資料處理標準編碼是由中央標準局發行的CNS11643。

﹝10.29.2003 初稿, 10.20.2004 定稿 加州聖地牙哥﹞