柯潔首戰惜敗,但AlphaGo和AI未來何去何從?



文/小羿

人機大戰第二季第一場,柯潔負於AlphaGo。

結果並不出人意料,就像人們已經習慣瞭Master橫掃棋壇一樣。拼盡全力的柯潔,也隻能望洋興嘆,AlphaGo對棋的理解和判斷已經高於我們(人類)瞭。

但是,如果我們關註的僅僅限於輸贏,那整場比賽已經沒有任何意義瞭。網易智能希望帶您深挖圍棋背後的東西,AlphaGo憑什麼贏瞭人類,它顛覆瞭什麼,它以後還會存在嗎?在人工智能技術大范圍推廣應用的今天,人類該何去何從?

柯潔 vs AlphaGo 2.0:一場頂尖高手的精彩較量

雖然我們對於輸贏早已心中有數,但如果我們盡情欣賞這局比賽,一定會為其精彩之處贊嘆不已。現年19歲的柯潔是目前世界排名第一的職業圍棋選手,5歲開始學棋,10歲的時候成為職業選手,曾先後四次獲得國際大賽冠軍,可以說,他本身就代表瞭人類在圍棋上的最高智力。而AlphaGo 2.0經過進化,學會瞭的自我博弈,幾乎是滿血+升級。雙方的比賽,在圍棋界就是一場值得載入歷史的空前決賽。

在第一局的比賽中,柯潔對AlphaGo早已有所防備,使用瞭傳奇圍棋大師吳清源和木谷實在上世紀30年代創立的三·3開局。此開局曾經流行數十年,此後在現代圍棋中漸漸淡出。然而,AlphaGo(曾化名Master)在今年1月的一系列比賽中再次啟用此開局,此後柯潔和其他棋手一起在最近的棋賽中令其活力再現。在今天的對局中,AlphaGo還使用瞭它擅長的二間守角,而柯潔則在左上角祭出瞭三·3點角。

搜狗CEO王小川曾評論到,這次人機大戰我們的關註點不再是機器是否會贏,而是機器將用什麼姿勢戰勝人類。

14:50分左右,經過4個多小時的時間,AlphaGo執白以1/4子獲勝。

三角獸科技首席科學傢王寶勛點評說,能比較明顯的感覺到AlphaGo對於“勢”的理解跟之前對戰李世石相比更加明顯瞭,在這樣的情況下,機器比人更能避免陷入局部利益的狹隘計算,進而表現為能夠走出看似難以理解但是實則韻味無窮的落子,因為它的每一步都是朝著全局獲勝的目標前進的。

賽後,柯潔表示, “我對佈局有過備戰和研究,所以一開局下瞭三·3占角,三·3點角,這都是對手特別喜歡下的,所以我想看看它怎麼應對,但它應對得非常好。那手斷讓我很震驚,這手棋在人類對局中幾乎是不可能的,因為是後手。後來冷靜下來分析確實是好棋,制造瞭很多劫材,同時讓角部實地化,一石二鳥。AlphaGo實在下得太出色,我輸得沒什麼脾氣,很厲害。”

一句“輸得沒脾氣”,讓我們覺得作為人類圍棋冠軍的柯潔,第一次對於打敗自己的人心服口服。

而另一方面,DeepMind創始人Demis Hassabis(哈薩比斯)在賽後新聞發佈會上表示:“我要向柯潔表示祝賀,這是一場精彩絕倫的台中馬桶不通比賽,雙方勢均力敵,難分高下,對在座的每一個人來說,都是一次令人激動的體驗。”

哈薩比斯認為,柯潔將AlphaGo推向瞭極限。

自由自在,這才是圍棋的真諦?

AlphaGo之父哈薩比斯也是一個絕頂聰明的人,他從4歲開始下象棋,很快成為天才少年。8歲時就思考人腦如何完成復雜的任務。在本場比賽開始前的開幕式上,哈薩比斯就為此次比賽定瞭調。他說,“AlphaGo的本質是人類利用電腦發現新知識,人們利用哈勃望遠鏡發現新的宇宙空間一樣。就像我們的最終目的不是輸贏,台中通馬桶因為不管如何,最終的勝利終將屬於人類。讓我們一起尋找圍棋的真諦。”

啟發棋手思路,尋找圍棋真諦。哈薩比斯將AlphaGo比喻圍棋界的“哈勃望遠鏡”,事實也證明瞭AlphaGo對於人類圍棋的種種啟發。

正如賽後柯潔所說,比賽之中AlphaGo的幾個下法我覺得是人類對弈中不可能發生的,AlphaGo今年的棋和去年的棋判若兩人,有很多地方值得我們棋手去學習和探討。“AlphaGo在沖擊人類的圍棋理念,那就是沒有什麼棋是不可以下的。”柯潔說。

公家機關水肥清運

職業女子棋手和評論員徐瑩在今天比賽的評述中說到:“自從 AlphaGo 出現之後,突然圍棋變得五彩斑瀾瞭,我們感覺思路一下子打開瞭,AlphaGo 這種自由自在的行棋風格,恰恰是我們一直所追求的圍棋本質。”

Michael Redmond九段點評說,AlphaGo的棋風如何激發人類棋手挑戰創新的邊界,並賦予一些傳統套路新的生命。“柯潔在開局階段就使用瞭他從早前Master連勝系列中學習到的下法,並和自己的風格融合到瞭一起。”

正如哈薩比斯所說,“再過一萬年,我們也不能窮盡所有的打法。”但是,圍棋的探索從未停止。

AlphaGo有哪些蛻變,2.0之後何去何從?

哈薩比斯今日透露,目前的AlphaGo是在雲端由單TPU運行,這與Goolge上周在I/O大會上剛公佈的芯片版本一致。TPU是專門為機器學習而設計的處理器。與去年3月與李世石的比賽時相比,當前的版本在處理計算時所消耗的能量僅為過去的十分之一。

360研究院院長顏水成點評說,過去一年多,AlphaGo在學習方式和模型上有很大的變化和提升,實時比賽計算已經用一個TPU就足夠。對於算法上的貢獻,三角獸科技首席科學傢王寶勛說,毫無疑問的AlphaGo基於深度學習的搜索算法得到瞭進一步的優化,走棋的效率更高,強化學習勢必比之前發揮的作用更大。但是Deepmind對於硬件和模型細節的把握同樣是不可忽視的因素。

對於AlphaGo 2.0的技術進步,地平線機器人技術CEO餘凱稱,這次AlphaGo 2.0的重要進展是,系統完全從零狀態開始通過自我博弈來學習和提升棋力的。而以前的1.0版本是有學習人類棋手歷史數據的。這種完全不需要外界數據的自我學習,是人工智能很激動人心的一個進展。

搜狗CEO王小川進一步解釋說,AlphaGo 1.0是巧妙地混合瞭蒙特卡洛樹搜索+監督學習+增強學習三種算法。而此次AlphaGo2.0的技術原理與之前有著巨大不同,它放棄瞭放棄瞭監督學習;放棄瞭蒙特卡洛樹搜索,不再進行暴力計算;極大地強化瞭增強學習的作用,之前敲邊鼓的算法,正式成為扛把子主力。

第四范式資深機器學習架構師塗威威點評到,在底層架構上,AlphaGo這一版性能相比去年有瞭一個量級的提升,不僅是訓練速度提升,而且實際對弈的機器也從去年的多臺機器的集群變成瞭現在的單機,這點對實際應用意義巨大,降低瞭使用門檻,同樣也使得在相同計算資源的情況下,可以支持更多的訓練數據和維度更高的模型;Google在此之前也宣佈瞭新版的TPU,打破瞭深度學習訓練硬件上GPU的壟斷(更早公開的TPU隻是被應用在深度學習預估系統中),新版的AlphaGo可能也會受益於TPU技術的進步。算法細節上尚未公佈,這一版可能對搜索策略和強化學習一些細節上進行調整,比如蒙特卡洛樹搜索和策略網絡結合來提升性能,以及上一版的AlphaGo自我博弈的啟發式策略(與前幾輪的自己進行對弈)並不收斂,我們猜測新版可能在這些方面會有所改進。

塗威威重點提到,DeepMind已經在嘗試讓AlphaGo有“舉一反三”的能力,這種觸類旁通的能力才是人類更為擅長的,這裡就要用到遷移學習領域的技術。

對於AlphaGo在比賽之後的發展,創始人哈薩比斯表示,我們在本周內會告訴大傢,並披露更多的技術細節。

人工智能能給人類帶來什麼?

雖然哈薩比斯沒有透露AlphaGo的去向,但是他在現場曾表示,我們利用人工智能可以解決目前的很多難題,比如醫療。我們希望AlphaGo與人類的合作可以找到更多的方式,我們希望AlphaGo在其他領域也能取得矚目的成就。

達闥科技CEO黃曉慶說,AlphaGo贏柯潔是完全在意料之中,贏很小的優勢也是意料之中,因為那是AlphaGo的設計方法,隻需要保證贏就行。“這是對強人工智能技術的可能性的最強大的證明!”黃曉慶強調說。

也許就是因為這種進步,DeepMind將開始探索人工智能在醫療等各個行業領域的應用。

海知智能(ruyi.ai)創始人兼CEO謝殿俠評點說,以AlphaGo為代表的人工智能應用,在這場認知革命裡隻是一個小小裡程碑。工業革命實現瞭體力工作自動化解放瞭體力勞動者,認知革命將知識工作自動化解放腦力勞動者。

最後,智能菌相對大傢說,比賽尚未結束,精彩還在繼續,雖然變化打法仍沒有找到AlphaGo的弱點,但柯潔仍表示會盡全力去拼每一盤棋,作為觀眾我們何嘗不需要這種認真的精神呢?

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow

    ase242mc86 發表在 痞客邦 留言(0) 人氣()