仡台語系人口總結 (截止2020年)

木蓼

<h5 style="text-align: right"><font color="#167efb"><b>作者:廖漢波 2020年6月23日 於泰國清邁 濠上坊·還自來居</b></font></h5> 我剛剛花了三天時間來對仡台(Kra-Dai)語系的人口進行統計(目前大體完成,不過還有一些西南台語的小方言數據還在繼續搜集輸入),付出的時間精力不亞於書寫一篇小論文。不統計不知道,一統計嚇一跳,還未完全統計,台語支人口居然已經九千七百八十五萬,接近一億,佔整個仡台語系總人口(約1億零2百萬)的96%左右。<br><br>緣起是,最近正在寫一篇文章,需要引述台(Tai)語人口,但我能夠看到最新的較為權威的數據也是1997年的8千萬以上,即Edmondson & Solnit的「the total number of Tai speakers is greater than 80 million」(1997:1),那是相當舊的數據了。苦於找不到其他可以相信的數據,只好自己動手了。<br> 這個統計中,橫欄先以國家地區、再以不同語言為單位,豎欄則從語支、語群、年份、參考文獻、參考網站為單位。所謂的語言,基本上參照的是ISO 639-3的劃分標準,即內部溝通和內部認同上均可以構成單一語言的群體,比如國內文獻中的壯語南部方言「德靖土語」區,會分佒壯和敏壯來分別統計。本統計也包含一些還未列入這個標準但已經有人研究並有人口數據的小語言,如位於湖南省的所謂「𦰡溪瑶话」,其實是一種很接近侗語的侗水語方言,未列入ISO 639-3,但因為有人口數據,也列入表中。有些語言在ISO 639-3上有代碼,如越南的Tày Tac,卻無法獲取人口數據,就暫時列入表中,待日後再增補。數據相信都是母語人口,不包括第二語言習得人口。真實的仡台語數據應該是只有更多,不會更少,理由如下。 一、 人口統計不計算中國和中南半島以外的仡台語人口,比如美國和法國等西方國家都有相當多的泰族、老族、白泰、黑泰、普泰等台語人口,雖然他們當中還有不少人還在傳承母語,但無法得知還能說台語的人數佔他們總人口的確切百分比,因此無法統計。<br>二、 不少語言的人口可能會因為調查的遺漏而導致數據偏低。比如,我最熟悉的佒壯,最近的出版物和權威網站資料上有七十七到八十七萬不等。但我很清楚一點是,作為迄今為止對佒壯進行最科學的調查,Jackson et al.(2012)對以下屬於佒壯的群體和人口均缺乏調查:廣西田陽縣的橋業(整個鄉只有一個北部壯語村)、巴別、洞靖等鄉鎮的主體居民,都是操佒壯德保話的人群;雲南省富寧縣的眾多天保人均為佒壯人群;廣西田林縣板桃鄉有很多德保話村落;還有天等縣、大新縣西部有大批操佒壯方言對人群,它們和兩縣主體居民(左江土語)有著明顯的差異。由於這些佒壯族群人口均沒有確切統計,因此我花了很長的時間來對這些鄉鎮的居民成分進行分析和統計,最終得出佒壯人口至少有一百一十萬的結論。這又牽涉到一個問題,即這些加入佒壯的人口,應該要從原來誤將他們統計成的北壯右江土語、桂邊土語和南壯左江土語人口當中扣除掉。<br>三、 在不少語言和方言中,我只能引用已經有統計數據的人口,但實際上有不少小語言會因為還沒有統計而無法加入。比如SIL在廣西靖西縣蹲點調查的成果Jackson et al.(2012)中為了設立佒壯和敏壯兩個ISO 639-3兩個代碼,對德靖台地這兩個人口較多的族群進行了比較詳細的統計,但對其他很小的支系,如儂安、左州(Zuozhou)、省(Sheng)、瑞(Rui)、決(Jue)、熬(Ao)、峒(Dong)、勇(Yong)等,均無最後公佈的人口數據。因此這些小支系,均沒有統計在ISO 639-3的16個「單一語言」的清單中,造成了他們人口數據的流失。也就是說,其實壯族雖然有將近2千萬人口,但我這個表加總的壯語人口只有1.5千多萬,雖然倒也接近已經很多地區已經放棄母語的事實,但也肯定包含了這些沒統計的小語言(或方言)的流失。<br> <br>四、 越南的台語人口也有同樣數據流失的問題。雖然Tay和Nung兩支因為ISO 639-3把它們列入兩個單一語言(實際上它們當然不是單一語言,但現在我是以ISO 639-3的現行代碼為准,因此只能沿用),因此它們人口很好統計。不過,越南的Thái這個官方承認的第二大少數民族(僅此於Tay)的語言,在ISO 639-3中卻無單一代碼,因此需要拆分成很多語言(Tai Dón [twh]、Tai Dam [blt]、Tai Daeng [tyr]、Tai Pao [tpo]、Tai Thanh [tmm]、Phu Thai [pht]、Tai Do [tyj]、Pa Di [pdi])來分別統計,所以我就不能直接採用越南官方統計的Thái的人口了。但這些官方民族身份上都是Thái的語言,人口加總起來只有不到174萬人,比越南Thái族人口1,820,950(2019年)少了8萬多人。不過,這也可以用部分人已經放棄民族語言來進行解釋。<br>五、 泰國和老撾的幾個大語言都有數據太舊或不統一、不準確等問題。比如,如果按照Ethnologue和MultiTree上的舊數據,泰語四大區域通行方言(中央泰語還是全國通行語)的母語人口如下:中央泰語有2千零20萬(2000 Ethnologue)、東北泰語(分佈在泰國的老撾語)有1千5百萬 (1983 SIL)、北部泰語為6百萬(1983 SIL)和南部泰語則有4百50萬 (2006 Mahidol大學數據)。如此一來,這四大泰語方言加總起來只有4570萬人口。可是,如今泰國人口已達約6980萬人(2020數據),也就是說,扣除這些泰語大方言,還剩下2410萬人口不是以泰語方言為母語的,這和實際情況相差太遠了。這是舊語言數據和新泰國總人口數據之間的矛盾。因此,我對這些語言我都進行了反復地核實和自己加總,一些詳情如下。<br><br>1. 中央泰語在不同的出處數據出入都很大,從2千萬到3千6百萬的數據都有。因此我先要確定同一個時期比較真實的人口數據比較,如2000年,泰國全國總人口為56281538人,而當年操中央泰語人口為20200000人,即0.358909879115244%的人口以中央泰語為母語。那麼最近的人口統計泰國總人口為69,799,978 (2020),假設人口增長速度與語言比例相當,那麼現在母語為中央泰語的人應該至少是69,799,978乘以0.358909879115244%,即25051901.666226676321461人。實際上,隨著現代化的推進,各族群後代轉用中央泰語為母語的人數越來越多,所以實際上以中央泰語為母語的人口應該是比這個數目多得多的。因此2505萬應該為其最低保險數據。<br>2. 北部泰語在常見的資料上都是1983年6百萬人口的數據,如Ethnologue (18th ed., 2015)依然採用了這個多麼老舊的數據,很不明白為何這麼多年過去了依然沒有更新。因此我採納了Joshuaproject的數據,即7,361,000。考慮到人口增長和比例,這個數據才比較可信。<br>3. 南部泰語人口在Ethnologue於2006年的數據是450萬,但距今已有14年。2018年泰國南部有9.454百萬人,泰國南部地區大約有52%的人口以南部泰語為母語,因此現在南部泰語母語人口的數據應該是500萬左右(實際上也有一些網站也列出有約5百萬)。<br>4. 老撾語的母語人口數據要分泰國和老撾來進行比較,因為所謂的老撾語包括老撾主體民族語言與泰國東北方言。據較新數據,這個Lao Language的總體人口應為約3千萬人("Lao (Laotien)". Inalco. 20 January 2017),這是整個仡台語系人口最多的語言了。不過,Ethnologue給予的老撾境內的寮語母語只有3百萬人,這應該是很舊的數據。我注意到了老撾總人口增長速度極快,十年前只有625萬人,但如今已達7,275,560人(2020年最新數據)(https://www.worldometers.info/world-population/laos-population/)。根據以往統計,老撾約有52%的人口是以老撾語為母語的,那麼老撾語母語人口至少應當為3,783,291人(仍未統計寮語取代其他語言成為母語的少數民族人口)。那麼,泰國境內的老語人口應當為3千萬減老撾這378萬人、柬埔寨境內的老族人口23000及越南境內的老語人口17532人,等於26,179,468人。根據最近數據綜合,整個泰東北地區人口約為3.288 千萬人,那麼泰東北話有2600多萬也是合理的。因此我自己採用了老撾的老語人口為3,783,291萬人、泰國的老語人口為這個數據26,179,468人的最低保險數據。<br><br>這麼一來,泰國境內四大泰語方言的總人口為63,593,098人,佔如今泰國總人口69,799,978 (2020)的91%左右,這才是比較符合現實的。實際上這個數據還是偏低的,因為如今泰國境內的非泰語語言和方言,除了南部的馬來語和東北地區南部的高棉語比較集中之外,其他大多已經很萎縮了。<br><br>總之,仡台語系人口已然過億,顯然是全世界的較大大語系之一;其中的台語(或Tai-Yay「偙侇」語)是發展得最大的語群。這個統計會繼續進行,一方面還有不少小語言人口數據還在搜集中,另一方面,語言人口有時候會擴大(如泰國、老撾境內越來越多少數族裔會集體轉用各自的國語作為母語),有時候會萎縮(如中國、越南、緬甸等國的仡台語人群會因為越來越多後代轉用各自國語作為母語而丟棄民族語言),加上人口的增長或減少等,總之這個數據會一直有變化,日後也應該定期或不定期給仡台語人口的統計進行更新才是。<br>