Spowda knkla snalu seejiq AI gmquring rmngaw kari ST
除了產業的數位轉型族語學習,也隨著科技發展有了新的進展。像是近期國科會就讓AI學習太魯閣族語 ,現階段已經可以用太魯閣族語翻譯童話故事,用AI進行語音合成,也可在ChatGTP上,使用太魯閣族語進行簡單的對話。
透過大量的語料蒐集、資料整理,再讓人工智慧「AI」進行學習,以太魯閣族語講述並翻譯而成的童話故事《小紅帽》,就這樣誕生了。
(國研院國網中心佐理研究員 黃孟琦
Sapah gqringan ttgsa patas samaw klwaan
黃孟琦
到目前為止,我們已經蒐集了12小時左右的人聲資料,跟100萬字左右的羅馬拼音, 到現在的話已經可以初步做出一個語音合成的功能,跟文字翻譯的功能,也就是中文轉太魯閣語,跟太魯閣語轉成中文的部分,然後也串接後端,就是跟一般的ChatGPT。)
也就是說,在ChatGPT上用族語跟AI聊天,已經可以實現!而為了復振族語,國科會人文處近年展開《以包容為導向之科技計畫》,其中在《原住民族語言人工智慧科技平台研發與教育應用》子計畫中,整合了國網中心、高師大、陽明交大、原語會以及相關語言學會,合作進行開發,然而太魯閣族語具有單一性的特性,而且語料相對其他族語豐富,對現階的AI學習來說,較為容易。
(太魯閣族語學會理事 Miming Karaw Truku
Qmpringan Kkrana Kari Truku Taywang(QKKTT)
Miming Karaw Truku
老人家才是真正的語料人,使用這個語言的才是真正的語料人,那我們太魯閣比較慶幸的就是,文面耆老他們在的時候,這個(族語)聖經就已經產出來了,所以說非常的精準。)
國網中心也表示AI模型開發前期,講求資料單純,中文跟族語的對照翻譯語句,就不能太長,而語音的蒐集也需要字正腔圓,來降低AI模型訓練的難度。
(電訪 原語會董事長 Mayaw·Kumud 阿美族
Bukung qmpringan pntgaya pkrana kari ST
Mayaw·Kumud Amis
我們先還是要搶救瀕臨(危)的族群(語言),包括泰雅族的克里奧語,這些都是在語言的多元化中,我們必須尊重,那但是要先做一些的規範,那之後我們會再跟原民會提出相對的,階段性的報告,那預算上,我們會提出適當預算,會再跟原民會特別是教育部、文化部、國科(會)這邊來提出。)
雖然瀕危語言相較太魯閣族語更難蒐集基礎資料,但原語會仍期盼透過跨部會力量及科技輔助,讓族語教學與學習,更上一層樓。而國科會也將提供原住民族語言學會、原語會還有族語相關單位團體,辨理AI族語教育訓練與推廣,提升服務能力與能量,使服務模式多元化,未來也可推廣到全台各族語言別,達到族語深化與永續落地的目標。
