另外,有韓國學(xué)者指出,在信息化時代,文字處理軟件都帶有繁簡轉(zhuǎn)換功能,所以根本沒有必要去統(tǒng)一什么字形。一位韓國媒體評論員尖銳地批評說:“為什么韓國的某些學(xué)者和某家報紙死抱著要統(tǒng)一漢字不放?”評論說,要么是這些所謂一流大學(xué)的教授們認(rèn)識一些漢字,但是卻不會說漢語,在遇到中國人的時候,想通過寫漢字來交流,可是對方并不明白,所以感到很郁悶所致,要么就是他們想通過提倡漢字教育來掙錢。
韓國《文化日報》也在一篇評論中稱,為了自身的便利,要求他國改變語言體系有些過分。相反,韓國教育當(dāng)局制定有效的漢字教育體系更符合人意。
【二】
漢字統(tǒng)一在計算機世界實現(xiàn)
在紙上書寫的漢字至今或許還遠(yuǎn)遠(yuǎn)談不到統(tǒng)一,但是在計算機上統(tǒng)一已經(jīng)實現(xiàn)了——中日韓統(tǒng)一表意文字(CJK Unified Ideographs),就是把分別來自中文、日文、韓文的漢字,按照共同的認(rèn)同規(guī)則,把本質(zhì)相同、形狀相同或稍異的表意文字(主要為漢字,但也有仿漢字如日本國字、略字、韓國獨有漢字)在ISO/IEC 10646的標(biāo)準(zhǔn)框架內(nèi),形成有序的集合,賦予一套統(tǒng)一的代碼。
也就是說,中日韓三國在寫法上有細(xì)微差異,但意思基本相同的文字,在計算機上的編碼是同一個虛擬的“漢字”,一個編碼;而字形不同的漢字,即使是同樣含義,也對應(yīng)著不同的編碼,比如繁體字的“壹”和簡體的“一”意義相同,卻必須有各自的編碼。
使用過Win95的人都有過這樣的經(jīng)歷:遇到繁體字的電郵和網(wǎng)頁時,打開會出現(xiàn)一片亂碼,其原因就在于那時臺灣使用的是BIG-5碼 ,而大陸的編碼標(biāo)準(zhǔn)是GB2312。假設(shè),內(nèi)碼(0000)對應(yīng)的漢字是(一),而在臺灣,內(nèi)碼(0000)對應(yīng)漢字是(十)的話,中文的漢字“一個”,在BIG5系統(tǒng)就可能變成了“十萬”。GB碼的漢字,在BIG5下,就變成了亂七八糟的符號和文字。
而在Win 2000和XP系統(tǒng)下,我們已經(jīng)幾乎忘卻了亂碼的煩惱,那是因為其包含了一個國際標(biāo)準(zhǔn)的通用多文種編碼字符集,其中的漢字編碼就是CJK——中國、中國臺灣、日本、韓國共同參與,由中國主導(dǎo)完成的。
實際上,這套多文種編碼字符集的創(chuàng)建、整合和最終成型,也經(jīng)歷了一個復(fù)雜的過程。
一方面,世界IT龍頭企業(yè)微軟發(fā)起制定Unicode標(biāo)準(zhǔn),似乎企圖完成一個古老的人類夙愿:修建一座有助于人類溝通的“通天塔”——一個涵蓋了目前全世界使用的所有已知字符的統(tǒng)一編碼方案。
同時,國際標(biāo)準(zhǔn)化組織(ISO)也在修建另一座通天塔——ISO10646,中文全稱為:信息技術(shù)——通用多八位編碼字符集。ISO10646國際標(biāo)準(zhǔn)定義了一個31 位的字符集,這是一個難以言喻的巨大編碼空間,總共達(dá)21億4748萬3648個碼位。
也許,即使搜羅地球上古今人類所有符號、所有文字,也不會有字符分配到第20位 100 萬碼位空間,而這還不過是31位空間的兩千分之一。迄今為止被定義了的,也不過其中的前16位子集,稱為基本多語言面 (BMP),包括 65534個碼位 (0x0000 到 0xFFFD),尚不及全部空間的萬分之一,但是已基本包含了世界上所有已知語言的字符,包括各種拼音文字和象形文字如阿拉伯文、藏文、漢字、彝字以及國際音標(biāo)符號等等。
目前,這兩座通天塔其實已經(jīng)合成了一座:1993年ISO10646與Unicode合作,制定了第二個方案,1993年成為正式的國際標(biāo)準(zhǔn),即ISO10646-1。兩個標(biāo)準(zhǔn)的字符對應(yīng)的編碼是完全一致的,兩者不斷擴充的文字編碼是繼續(xù)對齊的。
圖片報道 | 更多>> |
|