|
|
【公事中心胡世澤、心測中心李奕璇、曾厚強報導】各國中小都大力推動閱讀,但有時孩子翻了幾頁書,乾脆擺到旁邊,吵著家長要陪讀,可能狀況是書本難度超出孩子閱讀能力,無法理解內容而無法啟發看書的興趣。如今在科技潮流、大數據的幫助下,國立臺灣師範大學宋曜廷教授團隊接受科技部補助,研發了「SmartReading慧讀,會讀」系統,可以分析書本內容難度及分級,也可以立刻精確測得學生閱讀能力,甚至系統會自動推薦適合孩子閱讀程度的書籍,從小養成孩子閱讀習慣。系統在研發完成後,已有臺灣8個縣市、30所國中小陸續採用,同時也已經推廣到香港和印尼等海外地區。
大數據結合自然語言處理技術讓閱讀材料難度透明化
坊間書商在訂定文章的適讀年齡時,常仰賴專家的經驗法則,因此無法精準掌控文章的結構是否會超出小孩在認知上的負荷,甚至是文章中的用字遣詞或知識概念過於困難,無法與目前在學校所學的知識銜接的上,使得小孩要不斷的推論、猜測,無法自己進行閱讀和理解,到最後只能讓家長進行陪讀的工作。假如一篇文章可以讓小孩自己讀就可以讀懂,使小朋友從小就培養自學的能力,相信對於增加小朋友閱讀的成就感及閱讀動機將有很大幫助。
因此,到底科普雜誌到底有多科普?大眾衛教有多大眾?兒童讀物小朋友真的都看得懂嗎?到底要如何推估文章真正適合閱讀的年齡?臺師大宋曜廷教授團隊致力開發出一套能自動分析中文文章可讀性的系統(Chinese Readability Index Explorer,簡稱CRIE),CRIE是一套結合閱讀心理學、語言學、自然語言處理及機械學習演算法的多功能文本可讀性分析系統,利用潛藏語意分析技術從社會、自然及體健等教科書共計5611篇文章萃取出一到十二年級的「知識概念空間」,並結合平衡語料庫、Gigaword等多個大型語料庫中數億詞彙,用來評量文章中詞彙之間的關係,以及詞彙的難度。CRIE不但可以同時預測不同領域文章的可讀性,其模型的準確率更高達82.07%。透過CRIE,可以對所有的閱讀材料,進行有效的難度分級,輕鬆達到文本難度分級的目標。
透過CRIE針對科普雜誌和兒童讀物分析發現,多數科普雜誌和兒童讀物撰寫的內容超過所指定閱讀年齡層的兒童,有高估兒童閱讀能力的現象。
適性測驗技術讓學生閱讀能力和閱讀困難明確化
良好精確的診斷測驗,是發掘學生學習困難並進行適性教學的首要工具。 要準確地測量學生的閱讀能力,傳統上需要透過大量的閱讀測驗才能達成,但是過量的題目卻會造成學生作答上的疲乏,降低測驗的信效度。改善現有工具的限制,宋教授團隊採用適性測驗的技術,研發出一套可全面診斷學生閱讀能力表現的閱讀評量工具,稱為「國語文閱讀能力適性評量」 (Diagnostic Assessment of Chinese Competence,簡稱DACC) 。DACC為電腦化適性測驗(computerized adaptive testing),此測驗形式的優點為受測者接受測驗的長度(即施測的題數)可以不需太長,但又不會犧牲測量的精確性。
DACC施測時,測驗系統先依據受測者的年齡,從題庫中選擇難度適中的試題進行施測,再根據受測者的反應情形給予適當難度的試題。若答對的題目較多,下一題便選擇較難的試題施測;反之,若答錯的試題較多,則接下來出現的試題便較為簡單。藉由此方式精簡學生作答的測驗題目數量,減少學生因作答上的疲乏而亂答的機率,同時又能維持相當高的測驗信效度。DACC採電腦化測驗,藉由電腦強大的運算能力,可立即得知測驗結果,省去人工計分的麻煩。除此之外,DACC除了能夠衡量學生的整體閱讀能力以外,系統亦提供了學生能力的垂直(學生能力到那一年級)與水平(那些向度不會)能力診斷。當學生完成DACC後,系統可即時估計出學生整體閱讀能力的表現,也更進一步地診斷學生在「字詞彙知識」、「句意理解/字面理解」、「摘要主旨」、「推論理解」、以及「省思評鑑」等五大向度的表現。此測驗結果可用來瞭解學生在各向度能力表現的強弱,並將其能力和同年級同儕的平均能力數值比較,以針對特定能力進行加強,提供個別化差異教學。截至2015年11月止,已有一萬多位中小學生完成DACC的評測,施測範圍遍及全臺北中南東各區域,香港,大陸等,其相關結果已回饋予各校教師,為後續閱讀教學提供寶貴的資訊,進一步達到適性教學的目標。
整合讀者能力和讀物難度的適性閱讀系統,讓閱讀活動精緻化
「SmartReading慧讀,會讀」系統整合了「智慧型文本分析器-CRIE」的讀物難度分析技術,以及「閱讀能力適性測驗-DACC」的讀者能力測量技術,可讓孩子透過本系統達到適性的閱讀。本系統有四項特色,第一,學生及書籍的適性配對:系統能夠精確的測量孩子當下的閱讀能力,並根據該數據推薦適合孩子閱讀程度的書籍,讓孩子能夠迅速找到感興趣且又符合自身能力的讀物。第二,設定閱讀計畫:透過本系統的功能,可讓孩子對感興趣的書籍進行閱讀規劃,自行設定每本書籍預計閱讀的時間。第三,讀後摘要自動評量:系統可透過自然語言的技術比對學生所寫的摘要與書籍重點的相關程度,讓孩子可自行評估對閱讀書籍的理解程度,並掌握閱讀計畫的達成狀況。第四,適當的鼓勵機制:當孩子按照既定計畫完成閱讀目標,並在書籍的讀後評量達到合格的水準,系統會給予適當的積分進行累計,家長或教師即可透過累計積分給予適當的獎勵。透過本系統的四項特色功能,有效激勵孩子逐步養成自我規劃、自主閱讀以及自行調整的閱讀習慣。
SmartReading目前已經在臺北市、臺東縣、苗栗縣、臺南市等地大規模採用,國外的教學機構如:香港、印尼等也都已經展開研究合作,未來將成為全球性的閱讀平臺。透過SmartReading的適性推薦功能,能有效地帶起孩子對閱讀的興趣,在現今閱讀資訊飽和的時代,協助孩子進行更精緻的適性閱讀,有效弭平成就落差,帶動孩子的適性發展。
網址:http://smartreading.net/SmartReading/Pages/Home.aspx
附件:適性閱讀系統的研發與應用
大數據結合自然語言處理技術讓閱讀材料難度透明化
科普雜誌到底有多科普?大眾衛教有多大眾?兒童讀物小朋友真的都看得懂嗎?到底要如何推估文章真正適合閱讀的年齡?這是一個值得重視的研究議題。臺師大宋曜廷教授團隊致力開發出一套能自動分析中文文章可讀性的系統(簡稱CRIE),CRIE是一套結合閱讀心理學、語言學、自然語言處理及機械學習演算法的多功能文本可讀性分析系統(如下圖一所示),其系統所採用的可讀性模型整合三大類的可讀性指標:一、採用「詞彙類」、「句法類」、「語意類」和「文章凝聚類」等多元的語言特徵指標,從不同的面向來去評量文本內容的結構。二、利用潛藏語意分析技術從社會、自然及體健等教科書共計5611篇文章萃取出一到十二年級的「知識概念空間」,可用來評量特定領域文章知識的難度。三、使用Google的Word2vec從教科書、平衡語料庫、Gigaword等多個大型語料庫以機率模型的方式去訓練出近60萬的詞向量表,用來評量文章中詞彙之間的關係。透過三大類的可讀性指標所訓練的可讀性模型讓CRIE不但可以同時預測不同領域文章的可讀性,其模型的準確率更高達82.07%。透過CRIE,可以對所有的閱讀材料,進行有效的難度分級,輕鬆達到文本難度分級的目標。
.jpg)
圖一 針對不同類型的讀者用不同的模型來分析文章的可讀性
透過CRIE針對科普雜誌分析發現,預設給一到四年級所閱讀的新小牛頓雜誌共計49篇中,教師判定有26篇而本研究模型則認為有42篇都需要超過國小五年級的讀者才能夠理解。相同的結果也發生在預設給五到九年級所閱讀的少年牛頓雜誌,教師判定有18%而可讀性模型則認為有32%認為書商所訂的適讀年級並不合適。這樣的子結果顯示本研究的可讀性模型與教師的標準較為一致,顯示書商在訂定科普雜誌的難度時有部分不合適,這將導致讀者無法獨立閱讀的情況發生。
適性測驗技術讓學生閱讀能力和閱讀困難明確化
適性教學是教育工作者長久以來致力達到的目標,但在追求此目標前,首先遇到的議題便是:如何準確地測量學生的能力。
要準確地測量學生的閱讀能力,傳統上需要透過大量的閱讀測驗才能達成,但是過量的題目卻會造成學生作答上的疲乏,降低測驗的信效度;同時,測驗題目的命題也須耗費大量的人力及經費成本,但這些耗費大量人力物力研發的測驗題目,往往卻由於試題曝光的因素,僅能施測一次。因此,致使市面上難有相關的工具能有效且長期地透過多次施測,追蹤學生的閱讀能力發展。
為改善現有工具的限制,宋教授團隊採用適性測驗的技術,研發出一套可全面診斷學生閱讀能力表現的閱讀評量工具,稱為「國語文閱讀能力適性評量」 (Diagnostic Assessment of Chinese Competence,簡稱DACC) 。DACC為電腦化適性測驗(computerized adaptive testing),此測驗形式的優點為受測者接受測驗的長度(即施測的題數)可以不需太長,但又不會犧牲測量的精確性。
DACC施測時,測驗系統先依據受測者的年齡,從題庫中選擇難度適中的試題進行施測,再根據受測者的反應情形給予適當難度的試題。若答對的題目較多,下一題便選擇較難的試題施測;反之,若答錯的試題較多,則接下來出現的試題便較為簡單。藉由此方式精簡學生作答的測驗題目數量,減少學生因作答上的疲乏而亂答的機率,同時又能維持相當高的測驗信效度。且,DACC採電腦化測驗,藉由電腦強大的運算能力,可立即得知測驗結果,省去人工計分的麻煩。以下為傳統閱讀測驗與DACC的比較。
表一 傳統閱讀測驗與DACC的比較
|
測驗特性 |
傳統閱讀測驗 |
DACC |
|
施測形式 |
多為紙本 |
電腦化測驗 |
|
題數 |
多 |
適中 |
|
測驗時間 |
長,普遍需要一小時以上 |
約為35分鐘 |
|
題本形式 |
固定試題 |
題庫選題 |
|
試題曝光率 |
高 |
可適當控制 |
|
測驗結果計算 |
耗時 |
立即知道結果 |
除此之外,DACC不僅比一般傳統閱讀測驗在施測時更有效率,在測驗學生的閱讀能力上也具有相當的優勢,除了能夠衡量學生的整體閱讀能力以外,系統亦提供了學生能力的垂直與水平能力診斷。當學生完成DACC後,系統可即時估計出學生整體閱讀能力的表現,也更進一步地診斷學生在「字詞彙知識」、「句意理解/字面理解」、「摘要主旨」、「推論理解」、以及「省思評鑑」等五大向度的表現。此測驗結果可用來瞭解學生在各向度能力表現的強弱,並將其能力和同年級同儕的平均能力數值比較,以針對特定能力進行加強,提供個別化差異教學。以下為學生測驗結果報表的示例。
.jpg)
圖二 DACC測驗結果報表示例 (部分)
截至2015年11月止,已有一萬多位中小學生完成DACC的評測,施測範圍遍及全臺北中南東各區域,香港,大陸等,其相關結果已回饋予各校教師,為後續閱讀教學提供寶貴的資訊,進一步達到適性教學的目標。
整合讀者能力和讀物難度的適性閱讀系統,讓閱讀活動精緻化
「SmartReading慧讀,會讀」系統整合了「智慧型文本分析器-CRIE」的讀物難度分析技術,以及「閱讀能力適性測驗-DACC」的讀者能力測量技術,可讓孩子透過本系統達到適性的閱讀。本系統有四項特色,第一,學生及書籍的適性配對:系統能夠精確的測量孩子當下的閱讀能力,並根據該數據推薦適合孩子閱讀程度的書籍,讓孩子能夠迅速找到感興趣且又符合自身能力的讀物。第二,設定閱讀計畫:透過本系統的功能,可讓孩子對感興趣的書籍進行閱讀規劃,自行設定每本書籍預計閱讀的時間。第三、讀後摘要自動評量:系統可透過自然語言的技術比對學生所寫的摘要與書籍重點的相關程度,讓孩子可自行評估對閱讀書籍的理解程度,並掌握閱讀計畫的達成狀況。第四,適當的鼓勵機制:當孩子按照既定計畫完成閱讀目標,並在書籍的讀後評量達到合格的水準,系統會給予適當的積分進行累計,家長或教師即可透過累計積分給予適當的獎勵。透過本系統的四項特色功能,有效激勵孩子逐步養成自我規劃、自主閱讀以及自行調整的閱讀習慣。
在老師端,系統會提供老師關於學生閱讀能力的分析報表,以及根據學生的閱讀程度所推薦的讀物清單,同時老師也可以協助學生設定個人化的閱讀計畫。另外,透過系統的讀後評量模組的評估,老師能有效掌握孩子對於書籍閱讀理解的狀況,也能針對孩子讀後評量所寫的摘要給予適當的回饋與修正,同時也檢視孩子是否按照既定的規劃進行閱讀。
「SmartReading慧讀,會讀」目前已經在臺北市、臺東縣、苗栗縣、臺南市等地大規模採用,國外的教學機構如:香港、印尼等也都已經展開研究合作,未來將成為全球性的閱讀平臺。透過SmartReading的適性推薦功能,能有效地帶起孩子對閱讀的興趣,在現今閱讀資訊飽和的時代,協助孩子進行更精緻的適性閱讀,有效弭平成就落差,帶動孩子的適性發展。
.jpg)
圖三 SmartReading系統首頁