2024/03/25
記者
Cemedas Dumalalrath(江子芊)/Kawa(施俊銘) 台北市

善用AI科技平台研發應用 族語學習新進展

除了產業的數位轉型,族語學習也隨著科技發展有了新的進展。像是近期國科會就讓AI學習太魯閣族語,現階段已經可以用太魯閣族語翻譯童話故事,更能用AI進行簡單的對話。

透過大量的語料蒐集、資料整理,再讓人工智慧「AI」進行學習,以太魯閣族語講述並翻譯而成的童話故事「小紅帽」,就這樣誕生了。

(國研院國網中心佐理研究員 黃孟琦:
到目前為止,我們已經蒐集了十二小時左右的人聲資料,跟一百萬字左右的羅馬拼音 ,到現在的話已經可以初步做出一個語音合成的功能,跟文字翻譯的功能,也就是中文轉太魯閣語,跟太魯閣語轉成中文的部分,然後也串接後端,就是跟一般的ChatGPT。)

也就是說,在ChatGPT上用族語跟AI聊天,已經可以實現!而為了復振族語,國科會近年展開《以包容為導向之科技計畫》,其中在「原住民族語言人工智慧科技平台研發與教育應用」子計畫中,整合了國網中心、高師大、陽明交大、原語會以及相關語言學會合作進行開發,然而太魯閣族語具有單一性的特性,而且語料相對其他族語豐富,對現階的AI學習來說,較為容易。

(太魯閣族語學會理事 Miming Karaw 太魯閣族:
老人家才是真正的語料人,使用這個語言的才是真正的語料人,那我們太魯閣比較慶幸的就是,文面耆老他們在的時候,這個(族語)聖經就已經產出來了,所以說非常地精準。)

國網中心也表示AI模型開發前期,講求資料單純,中文跟族語的對照翻譯語句,就不能太長,而語音的蒐集也需要字正腔圓,來降低AI模型訓練的難度。

(電訪 原語會董事長 Mayaw·Kumud 阿美族:
我們先還是要搶救瀕臨(危)的族群(語言),包括泰雅族的克里奧語,這些都是在語言的多元化中,我們必須尊重,那但是要先做一些的規範,那之後我們會再跟原民會提出相對的階段性的報告,那預算上,我們會提出適當預算,會再跟原民會,特別是教育部、文化部、國科(會)這邊來提出。)

雖然瀕危語言相較太魯閣族語更難蒐集基礎資料,但原語會仍期盼透過跨部會力量及科技輔助,讓族語教學與學習更上一層樓。

而國科會也將提供原住民族語言學會、原語會還有族語相關單位團體辨理AI族語教育訓練與推廣,提升服務能力與能量,使服務模式多元化,未來也可推廣到全台各族語言別,達到族語深化與永續落地的目標。