HOME

 

 

呂理哲,知名電子出版專家、網路作家。
   
  阿法狗和AlphaGo Zero
  呂理哲 October 28 2017
  請把你的想法寫信給我: lu@brainnew.com.tw
   

2017/10/26 DeepMind在Nature 雜誌以“不靠人類知識精通圍棋”(Mastering the game of Go without human knowledge)為題發表一篇文章,介紹了阿法狗的新版本AlphaGo Zero以100:0懸殊的比數大敗阿法狗,引起大家的興趣。

《本文開始》

教(機器學習)有一種教法叫做 supervised learning ,就是給電腦大堆數據樣本,告訴電腦那些是對的,那些是錯的。讓電腦從中學習如何判斷,一旦電腦建立了自己的模型能夠正確地去判斷,就學會了一項技能。

人類老師(谷歌)就是用這個教法教阿法狗,打敗了全人類所有的圍棋高手。

百度參照谷歌“機器學習”的論文,一樣教會了“絕藝”(百度的圍棋AI)去打敗全人類的圍棋高手。

DeepMind 清空阿法狗的知識庫,讓電腦從圍棋的基本規則開始,自行採用強化學習(reinforcement learning) - 不告訴電腦什麼是對的,什麼是錯的,讓電腦從規則中自我領悟出判斷的模型,這樣AlphaGo Zero三個月就打趴了阿法狗,開拓了人工智慧的新視野。

AI 科學家讓電腦像人一樣學習,專家普遍認為阿法狗的圍棋知識受限於人類老師,所以比不上AlphaGo Zero從零開始學習那樣的天空海闊。

從電腦學習圍棋的新聞裏,想到自己受的教育和教育自己下一代的經歷,不能不反省自己是不是被教育系統限制了?

這倒不要緊,反正已經無藥可救了。

問題的是自己局限的知識是否限制了我們的下一代?

《end》


上一篇   下一篇 索 引