|
【校園記者許紹萱、公事中心胡世澤、深耕計畫辦公室傅惠筠報導】國立臺灣師範大學深耕華語文研究,創立獨步全球的華語文數位學習平臺系統,每個平臺都包含教學與學習功能,同時嘉惠華語學習者與教師。這些平臺不只獲得國際一流期刊的認可,也受到臺灣和全世界的華語文教學領域的青睞。
臺師大華語文與科技研究中心(Chinese Language and Technology Center),以發展成為國際頂尖華語文教學與研究中心為目標,針對語言學、心理學、學習科技和測驗評量等技術進行跨域整合。回顧2018年在華語語言學習的基礎知識、學習平台以及教材教法上,都有突破性的發展,也產出豐碩的研究成果。
多元的華語文學習平臺 整合華語聽說讀寫
華語文與科技研究中心積極拓展華語文科技的新視野,研發的華語文聽說讀寫各學習平臺,已推廣至海內外的國際學校與教育中心,包含:韓國、新加坡、中國大陸、香港、印尼及泰國等。
而該中心所推出的網站Cool Chinese Plus(http://www.coolchinese.org/plus/),整合適合入門者的華語聽說自動診斷與教學系統(SmartPinyin慧聽慧說)、華語文全字詞數位教材編輯模組(eMPOWER)、華語文寫作自動評分與回饋(AES-Han)、及中文閱讀能力適性評量與適性文本推薦系統(SmartReading),並結合行動載具的應用,讓學生的學習不再受時空限制,提升教學的效能,至今累計使用人次已超過37,000人。
該中心期望將數位化學習商品從學術端推廣到產業端,再從商品獲利投資回學術端,提升研發品質,形成正向循環。
華語文與科技研究中心也持續耕耘華語文學習的核心科技,在2018年成果大豐收:
語音科技
針對強韌性語音辨識技術,研究團隊已有顯著的突破,成功發展出創新語音特徵統計圖正規化、和調變頻譜非負矩陣分解技術,來降低戶外雜訊及多語言摻雜等的影響,提高發音辨識的效能。
此外,研究團隊也持續探究利用Sequence-to-Sequence Generation Framework和融合強化學習(Reinforcement Learning)技術來增進學習性語音摘要的技術。目前團隊也努力提升華語錯誤發音偵測診斷技術,不滿足於偵錯與診斷華語的單音節與雙音節發音的高準確度,朝向句子與段落等大單位自動偵錯與診斷邁進。
讀的科技
由於華語學習課外讀物的主題涵蓋範圍廣泛,且針對不同年齡層也有不同的語言撰寫特色,研究團隊目前利用從深層學習領域中快速崛起的「表徵學習技術」,自動從語料中抽取新穎的可讀性特徵,以研發出精準度更高的文本可讀性分級模型來為書籍的難度進行自動分級。
另外,華語文與科技研究中心還將開發創新壯舉-閱讀心得自動評分,目前已蒐集超過三千份心得。未來團隊將利用Word2Vec,將巨量語料轉換成巨量語意空間,並搭配機械學習演算法來分析心得的優劣及合理性。
同時,研究團隊也在研發閱讀測驗的自動命題系統,利用節錄式的自動摘要技術為文章進行摘要,接著剖析自動摘要的結構後,產生題目資訊,最後針對正確答案產生數個高誘答選項。此項技術能協助測驗研發人員快速建立試題,大幅降低研發過程中所耗費的時間與人力。
寫的科技
目前研究團隊已經為大型考試,發展出高準確度的寫作自動評分技術,能夠偵測用字風格的寫作特徵。初步驗證用字風格特徵,對於寫作文本之能力等級評估之實用性,在國中教育會考的五個題目中,只運用此一特徵便能達到0.88至0.97的鄰接一致率。
此外,團隊已研發的KNGED,在句法錯誤以及錯別字偵測與校正方面,表現得十分穩定,目前則在發展一個偵測華語文寫作詞彙語意錯誤的架構,為新一代語意偵錯模型進行細部設計與優化。
而針對輔助學習者寫作困難方面,團隊也發展以Tree Kernal為基礎的句法相似度測量方法,提供寫作問題即時反饋的機制,並提供適合學生句法及詞彙程度的寫作輔助建議。
視覺化學習輔助系統
研究團隊積極應用最新科技,開發VR學習系統及3D 虛擬情境創作工具來幫助華語文學習,例如:VR華語文沉浸式體感學習系統、CoSpaces虛擬實境及體感學習之情境式華語文學習模式、3D 虛擬情境創作工具應用,並將相關的研究成果發表在期刊及研討會論文上。
語料庫科技
華語文與科技研究中心持續華語語料庫的廣度與深度,期望能更真實地表徵語言的面貌,截止目前,已建構大型網路語料庫-繁體:13億詞、大型網路語料庫 -簡體:19億詞、商務中文:1千4百多萬詞、科技中文:2千6百多萬詞、二語寫作語料庫:180萬字。
另外,團隊已研發出口語語料自動標記工具,能夠在斷詞、詞性、句法、情緒向度與等級等各層面之文本,自動標記。且目前已建構YouTube口語中文語料庫:超過3百萬詞,以及學術英文口語語料庫:超過6百萬詞。
人工智慧科技
臺師大的華語研究也搭上人工智慧(AI)浪潮,正積極開發有感知面的人工智慧系統,具備情緒辨識並可同理及幽默地回應,給予學習者個人化與適性化的主動指引,相較傳統數位學習,人工智慧能讓學生在學習情緒與學習動機上獲得較大的滿足。研究團隊亦透過機器學習及跨領域合作,正在逐步研發語言自動理解與生成,能主動回應或提醒、了解學生想法的前後文與意圖,並進行有意義的對話。
華語文與科技研究中心擁有全臺最大的學生之學習與測驗資料庫,將華語學習者的學習軌跡,做大數據分析、將資料轉換為可執行的見解。此學習分析,不只運用學習歷程資料與社群軟體互動形式,也會利用具體有形的機器人形式,進一步給予學習者適性化的主動協助與指引,可望彌補傳統教育模式的不足。