2017/10/26 DeepMind在Nature 雜誌以“不靠人類知識精通圍棋”(Mastering the game of Go without human knowledge)為題發表一篇文章,介紹了阿法狗的新版本AlphaGo Zero以100:0懸殊的比數大敗阿法狗,引起大家的興趣。
《本文開始》
教(機器學習)有一種教法叫做 supervised learning ,就是給電腦大堆數據樣本,告訴電腦那些是對的,那些是錯的。讓電腦從中學習如何判斷,一旦電腦建立了自己的模型能夠正確地去判斷,就學會了一項技能。
人類老師(谷歌)就是用這個教法教阿法狗,打敗了全人類所有的圍棋高手。
百度參照谷歌“機器學習”的論文,一樣教會了“絕藝”(百度的圍棋AI)去打敗全人類的圍棋高手。
DeepMind 清空阿法狗的知識庫,讓電腦從圍棋的基本規則開始,自行採用強化學習(reinforcement learning) - 不告訴電腦什麼是對的,什麼是錯的,讓電腦從規則中自我領悟出判斷的模型,這樣AlphaGo Zero三個月就打趴了阿法狗,開拓了人工智慧的新視野。
AI 科學家讓電腦像人一樣學習,專家普遍認為阿法狗的圍棋知識受限於人類老師,所以比不上AlphaGo Zero從零開始學習那樣的天空海闊。
從電腦學習圍棋的新聞裏,想到自己受的教育和教育自己下一代的經歷,不能不反省自己是不是被教育系統限制了?
這倒不要緊,反正已經無藥可救了。
問題的是自己局限的知識是否限制了我們的下一代?
《end》
|