機器人如何學習人類?
人工智能一直是一個很熱門的話題。搜狗CEO王小川在近的一次演講中,介紹了機器是怎么學會思考的。
機器人學習人類的過程,一共分三個階段。
個階段,我們把人已經(jīng)懂得的規(guī)則交給機器。這是開始的方法。程序員把規(guī)則寫成一個代碼交給機器,告訴機器什么數(shù)據(jù)要怎么處理。比如我們要做一個電飯鍋,寫好一個程序,到了103度,電飯鍋就會跳閘。所以傳統(tǒng)的機器學習,就是人告訴機器求解的方法。但這里有個問題,很多時候我們自己都不知道方法是什么。比如人臉識別這個技術,你想讓機器認出張三的臉,但你怎么告訴機器這就是張三的臉,眉毛是粗的還是臉是方的?我們發(fā)現(xiàn)很難用一個技術把人臉識別出來。
這時候就到了第二個階段,我們不告訴機器方法,只告訴機器問題和對應的答案是什么,讓機器進行學習。比如人臉識別,我們只要告訴機器這是張三的臉,那是李四的臉,不用告訴機器為什么這個臉是張三或者李四的。機器通過大量的數(shù)據(jù)訓練就能夠學會。去年開始圖像人臉識別機器超過了人,準確率超過了人一倍。谷歌機器人學圍棋就是這么學的,把人類棋手六段以上對弈的30萬盤棋放在機器面前,告訴他在什么局勢下,人是怎么落子的。機器不僅把這30萬盤棋學會了,它在這個過程里面還產(chǎn)生了對類似問題的分析能力,所以棋局變了之后,它也能根據(jù)以前的經(jīng)驗去做判斷。
第三個階段,只給機器人目標,而不是告訴它怎么做,這是演進中很重要的一步。機器學習人下棋的方法,后戰(zhàn)勝人,這是一個超越進化的路徑。但谷歌還在做另外一件事情,讓機器不學人的下棋方法,隨機落子,自己和自己下,然后告訴它輸贏,看能不能進化出來一臺跟人走棋風格完全不同的機器。這就像一個人在中原學會了所有武功,把它融匯貫通,然后再進行提高;另外一個人從來沒有來過地球和中原,卻要學武功,你說它的武功跟人會一樣嗎?這是人類所好奇的,看看重新開始會出現(xiàn)什么智慧。