NTNU

師大新聞

2022.0706

能不能用人工智慧讀法院裁判:法律資料分析學

【本篇報導由東亞學系 邵軒磊副教授研究團隊提供】

近期有許多人工智慧的研究,使電腦(機器)能夠部分模擬人類思考過程、輔助人類決策,並應用至法學領域。惟過去的研究較多著重在解析法官思考過程以及預測裁判結果,讓律師與當事人參考;而為了獲得高度正確的成果,必須倚賴法學專家先閱讀裁判或法律條文,抽取出關鍵因素,將之編碼之後,再由機器建立模型並預測。本研究嘗試不同的方法,直接將自然語言的文本(即法院裁判原文)輸入機器,觀察機器能否成功解析法官的語意,判斷裁判之結果。

本文以三年期間地方法院第一審結果為「單獨親權」之裁判文書之部分段落作為樣本,使機器讀入這些文本後,以自動斷詞等文字探勘技術,製作出詞彙矩陣,再使用機器學習領域中的類神經網路方法,訓練機器「理解」法官的語氣與裁判方向(親權歸屬父親或母親)。接著以此為基礎,要求機器讀入其他未知裁判,並判斷結果。其準確率約77.25%,F1分數0.8674,如此證實了機器可以某種程度「讀懂」裁判文本並做出分類。由於機器的運算速度快,若結合法學資料搜尋系統,將能更快速地讓人們找到所需的裁判,達到「人機協作」,增進人類決策的效率與正確性,此稱為法律資料分析學。


人工智慧(artificial intelligence, AI)與機器學習(machine learning)在大數據(big data)的背景下,近期獲得飛躍式的發展,甚至成為我國科研戰略的一環。人工智慧逐漸進入生活的各個層面,除了帶來便利與效率外,也引發對市場秩序及政府權能之衝擊。為此,本研究試圖開展「法律資料分析學」,將2012年至2014年共三年期間的地方法院及少家法院關於親權酌定的第一審裁判共448件,經過「自然語言處理」(Natural Language Process, NLP、「文字探勘」(text mining, TM)與「類神經網路」(Neural Network),三個步驟,最後給出一個「裁判分類值」(即目標值,意味著電腦閱讀現有裁判的情狀之下,判斷親權酌定給父親母親),最後「機器分類結果」與「實際裁判結果」做比較,用來檢視模型的準確程度(如圖一、機器學習與文本探勘)。

此舉將簡化甚至省卻人類編碼的流程,期望能節省許多勞動時間,儘快進入第三階段之後的訓練與預測。使法律資料分析流程更接近直接使用原始裁判文書,讓機器能「讀懂」法官所寫文字,並對照實際判決結果做出驗證。為了避免只隨機測試一次而發生測量結果的偏差,研究團隊重複運行模型50次(且訓練組與測試組的樣本不相混淆),測試組準確率多在80%前後徘徊,50次的平均為77.25%,在F1分數的表現也與此相近。總體而言,優於其他類似方法的研究。

過去「人工智慧與法律」領域發展的主要方向在於建立「法律專家系統(legal expert system)」,將專家的知識輸入於電腦系統,基於此知識,由電腦像專家般提供諮詢、建議解決方法。但此作法必須仰賴人工(專家)預先設定各種規則,耗時且昂貴,故僅在個別少數的法領域被運用。近期逐漸導向讓電腦從法律文件中提取語意資訊,「幫助」人們解決法律問題,包括「概念資訊提取(conceptual information retrieval)」與「認知運算(cognitive computing)」等技術。

換言之,過去專家系統需要人類將規則寫在系統程式,才能讓電腦有某種功能;相較之下,本研究則是從自然語言文本的大數據中幫助人們找到適合的解答,強調「人機協作」(如圖二),機器可以提供百科全書般的知識與運算能力、可以理性推論與分析,人類則是提供專業、判斷、直覺、道德指引與創造力,如此共作以達成更好的決策。結合了上述技術的「法律資料分析學」,目的正是希望從法院裁判或法規當中,以機器自動提取有意義的資訊,進而協助專家回答法律問題、估計裁判結果、擬具訴訟攻防主張。

原文出處:黃詩淳、邵軒磊(2020),〈以人工智慧讀取親權酌定裁判文本:自然語言與文字探勘之實踐〉,《臺大法學論叢》,49卷1期,頁195-224。doi:10.6199/NTULJ.202003_49(1).0004

本文出處:研究發展處研究亮點

原始連結:https://rh.acad.ntnu.edu.tw/tw/article/content/154


邵軒磊 副教授 | 東亞學系現任國立臺灣師範大學東亞學系副教授,兼任中國大陸研究中心主任。涉獵中國大陸研究、日本學、數位人文、法律資料分析與國際關係。也是文字探勘工作者、python與R使用者、圍棋業餘兩段、腰痛患者與貓奴。曾獲得師大附中82學年度學生運動會個人400m銀牌、200m銅牌、團體400m(100*4)金牌。