travesti
travesti
travesti
友善列印
電腦下圍棋贏人腦 資工所校友黃士傑解密
圖
圖

AlphaGo 功臣黃士傑回臺:第四戰替李世?開心,但工程師要回去找 Bug 了

Mia 三月 18, 2016

DeepMind AlphaGo 團隊最大功臣之一,便是來自臺灣的黃士傑,國立臺灣師範大學資工系博士班畢業的他,本身也對圍棋有興趣,為業餘六段棋士,在學期間便開發了以妻子為名的圍棋人工智慧 Erica,曾打敗當時最強的圍棋人工智慧 Zen,為 AlphaGo 的前身。

今天黃士傑來到臺灣 Google 總部,向大家分享 AlphaGo 背後的運作,以及這次人機世紀大戰的心得。

工程師正在抓第四戰的 Bug

針對這次的賽事,黃士傑表示相當尊敬李世?九段,「不敢說看過全部,但至少也看過大部分的棋譜。」先前賽後訪問時,李世?曾提到黃士傑非常有禮,比賽途中都盡量保持面無表情,怕影響到對手的心情,因為對上 AlphaGo 的壓力,也讓李世?將負責落子的黃士傑代入了對手的角色,甚至連做夢都會夢到他。

黃士傑補充道,避免中途上廁所是怕浪費 AlphaGo 的時間額度,因為這也是要列入時間計算的。第四戰李世?大勝後,黃士傑也相當開心,不過目前團隊成員正在趕工抓 bug,希望找出第四戰李世?「神之一手」讓 AlphaGo 徹底潰敗的原因。

會有下一場人機大戰嗎?

黃士傑表示,AlphaGo 並沒有針對李世?過去的棋譜或風格做調整,比賽時雖然能即時看到勝率分析,但都是開始棋局之後邊下邊判斷的,無法在賽前做預測,他本人代替 AlphaGo 落子時也看不到相關數據。

至於 DeepMind 的 AlphaGo 團隊接下會不會挑戰世界圍棋冠軍柯潔,黃世傑則表示團隊還沒決定,他自己本身的下一步,也有可能會將這項演算法成果貢獻於 DeepMind 內部的醫療或機器人團隊,例如用病例判斷最佳療法等方面。

人工智慧能走多遠?會打線上遊戲嗎?

此次圍棋比賽,AlphaGo 代表了的人工智慧戰勝了人類圍棋好手,也傳出 DeepMind 未來有挑戰不同類型遊戲,甚至是星海爭霸等即時戰略遊戲的打算,黃士傑則表示由於星海爭霸這種線上遊戲和圍棋類型差異太大,遊戲中涉及許多不確定資訊的判讀,雖然也不排除公司往這方面發展的可能,不過這不是自己的 AlphaGo 團隊能決定的。而他也補充,簡單策略類型的遊戲如撲克牌等,去年就已經有人破解了。

至於人工智慧離自主思考還有多遠?黃世傑認為,現在的 AplphaGo 只是根據演算法做判斷,在計算策略上有優異的成績而已,距離到能獨立思考,甚至有自我意識的未來還相當遙遠,不過他也無法預測到底人工智慧何時能達到這樣的程度。

AlphaGo 的演算原理

黃士傑解釋,圍棋是目前棋類遊戲中最難挑戰的,因?可能的結果太多,「用窮舉法算完可能要幾億年。」

這次 AlphaGo 利用的是負責縮減結果廣度的值網路,可以在一開始就利用歷史棋譜篩出最合理的選擇,配合縮減結果深度的策略網路,可以往下推論幾步,判斷會不會輸,並刪去勝率小的結果。

詳細的演算法原理已經出版在《Nature》雜誌上,相關數據公佈地非常詳細,黃士傑也樂見各方發展電腦圍棋的工程師能直接利用此成果,造出更棒的人工智慧。

資料來源:http://www.inside.com.tw/2016/03/18/alphago-aja-huang-in-taiwan

AlphaGo如何贏人腦 黃士傑解密

●讓電腦自己跟自己下棋,自主學習突飛猛進。

●模擬人類專家,分析盤面找出適合的棋法,再選擇最有利的下一步。

Google DeepMind開發的AlphaGo打敗南韓棋王李世?,震驚棋界。AlphaGo背後推手黃士傑原本是設計象棋程式,卻在圍棋比賽輸給電腦,讓他決定繼續開發圍棋。

他謙稱AlphaGo的成功,是因為有30萬筆棋譜、7000萬筆棋面的人類智慧結晶。對於與李世?的比賽4勝1負,他覺得是很完美的結局,在李世?逆轉勝、AlphaGo宣布失敗時,他也露出難得的一抹微笑,替李世?感到高興。不過,「我們正在研究失敗的原因,找bug。」

黃士傑的結論是「不要怕失敗」,嘗試各種點子,十次總有一次會成功。

電腦式學習法 實力大躍進

2006年第11屆奧林匹克電腦圍棋競賽,可說是AlphaGo的起始點。黃士傑說,電腦過去在圍棋領域從未勝過人類,短短幾年內,電腦在9乘9小棋盤圍棋賽贏了黃士傑,讓棋力不差的他大為震驚,「竟然輸給電腦」。回到臺灣後,決定投入電腦圍棋。他以太太姓名命名的圍棋程式「Erica」,就是後來的成果。

他找到了讓電腦棋力大增的演算方式是「自主學習」。他說,過去的下棋程式,是工程師設計好、讓電腦去比賽,輸了以後,調整參數再去比賽,等於是人的學習。但我讓AlphaGo「自己跟自己下棋」,電腦自己學,技術能力突飛猛進。

這時因為Google投資入股AlphaGo,有更多的人力、經費,公司決定讓他做主導研究者,開發圍棋程式。AlphaGo的人工智慧系統,是以類神經網路的概念,結合機器學習(Machine Learning)與深度學習網路(deep neural networks),它能模擬人類專家,先分析盤面、找出最適合下棋的幾步棋,再選擇其中最有利的下一步。

去年起,約一年期間,AlphaGo就在19乘19的棋局上,打贏世界棋王。下一步,他打算挑戰多人戰略聯盟、3D戰略遊戲等產品。

黃士傑功成名就 歸功博班教授

「臺灣的老師指導能力真的很厲害,出國能力不輸人。」黃士傑說,他能在人工智慧、機器學習方面有成就,歸功於他的博士班教授林順喜。

老師鼓勵他每年出國參加棋類程式比賽,黃士傑建議,「多出國看看很重要」。他當初便是透過「戰友」幫助,在加拿大找到博士後研究的工作,進入DeepMind工作。

人性化工作環境 能力自然就發揮

DeepMind執行長Demis Hassabis被稱為「世界上最聰明的人之一」,統領來自世界各地的「聰明人」,黃士傑看這位老闆,形容他不像學者,「更像有衝勁的年輕人,有動力去實現自己的夢想(人工智慧)」。

他形容在DeepMind非常人性化,不要求打卡和加班,因為相信員工有好的個人生活,就能更好的達成工作目標。DeepMind讓每個人發揮所長,能力自然彰顯出來。

DeepMind以研發為主要營運模式,大家都熱愛做研究寫報告,發表論文的旺季,預約實驗室機器滿到排隊,不斷產出有智慧的研發成果,也讓黃士傑樂在其中。

聯合報/彭慧明 報導

聯合報/吳雨潔、李承宇、王又立、張心慈 製作

主圖/彭慧明 攝影

資料來源:http://a.udn.com/focus/2016/03/19/19083/index.html

上一筆
下一筆
上一筆
校友服務