|
本帖最后由 劉景亞 于 2016-4-11 18:26 編輯 - u! d9 q1 V; `( t
( h4 `7 O; r; [/ ~* m3 P& X
前段時間的人機(jī)圍棋大戰(zhàn)賺足了人們的眼球,Google公司的AlphaGO也使機(jī)器學(xué)習(xí)和深度學(xué)習(xí)讓更多的人有了一定的了解,可謂做了一次很好的科技普及。
) _) b" k3 M# i1 E$ y現(xiàn)在我們從簡單問題入手,如何基于機(jī)器學(xué)習(xí),,通過自學(xué)習(xí)的方式讓機(jī)器人學(xué)會玩“石頭、剪刀,、布”游戲,?9 X# V: y% K' N
不知大家有何建議?歡迎大家發(fā)言參加討論,。
2 G$ Q3 u! w, N*******************************************************************************************% W$ L; |4 E: L4 ~
分割線以上為原貼& R# f7 A1 k, q( k: o/ B, d6 N2 X
*******************************************************************************************2 C9 @! }4 s+ W5 \0 u
非常感謝各位大俠的參與和討論,。
3 |4 p2 o/ O0 B8 l關(guān)于機(jī)器人玩“石頭、剪子,、布”游戲,,我本打算分三個問題和步驟和大家一起探討�,?吹接懻撝�,,大家對這三個方面都有所涉及。0 }/ T! K, M" l7 V
下面我把我對這個問題的認(rèn)識拋出來與大家交流分享,。
! n( e: D; D1 E7 H$ |要讓一個機(jī)器人玩“石頭,、剪刀、布”,,我們分三步走,。
0 f, D8 R: s4 o, @5 O第一步,,如何讓機(jī)器人通過自學(xué)習(xí)的方式學(xué)會游戲規(guī)則?比如,,一開始機(jī)器人并不知道石頭、剪子和布,,哪個贏哪個,,要玩游戲首先得學(xué)會規(guī)則。當(dāng)然要實現(xiàn)這一步,,有比較簡單的辦法,,最直接的是程序員編程時,直接定義這個規(guī)則,,這是以前經(jīng)常用的傳統(tǒng)的方法�,,F(xiàn)在我們想通過一種新的方法來實現(xiàn),讓機(jī)器人像小孩一樣,,通過不斷地實踐,、摸索和總結(jié)掌握這個規(guī)則,也就是自學(xué)習(xí)和機(jī)器學(xué)習(xí),。
" d0 _1 w# z% s8 u8 T第二步,,如何讓機(jī)器人在掌握規(guī)則后大概率獲勝?: [7 A e1 I, X {1 g. h- q
第三步,,能不能通過一種方法,,使機(jī)器人在每局對戰(zhàn)時100%獲勝?% @# P O1 d1 i- O
*****************************************************************************************7 }2 Z5 b) b6 X% G/ e
關(guān)于第一步,,可以用如下方法實現(xiàn):讓機(jī)器人和人對戰(zhàn),,在對戰(zhàn)的實踐過程中訓(xùn)練機(jī)器人,使其不斷自學(xué)習(xí)以掌握規(guī)則,。在對戰(zhàn),,人始終隨機(jī)出,機(jī)器人一開始并不知道規(guī)則,,也隨機(jī)出,。贏了有獎勵,輸了有懲罰,,隨著對戰(zhàn)次數(shù)的增多,,機(jī)器人就會對出拳的種類形成“價值判斷”。在訓(xùn)練過程中,,機(jī)器人會反復(fù)判斷,,是隨機(jī)出還是基于已經(jīng)學(xué)到的部分知識。經(jīng)過不斷訓(xùn)練,,機(jī)器人就會學(xué)會游戲規(guī)則,。這個過程區(qū)別于以往的程序員直接定義,和人類的學(xué)習(xí)過程十分類似。
. J+ A( x& F' G3 z; F那么這個方法有沒有效果,,我們驗證一下,。
A- Z4 b i% S% U6 x5 e下圖是我與機(jī)器人玩25局的情況,注意這個機(jī)器人一開始并不知道游戲規(guī)則,。我隨機(jī)出拳,,機(jī)器人一開始也隨機(jī)出,贏了獎勵,,輸了懲罰,。大家會發(fā)現(xiàn),從第11局開始,,機(jī)器人就已經(jīng)完全掌握了規(guī)則,。
! g( _3 ]! h% @) X! }' s. `# h$ S+ [2 ?) G! c
+ Y6 o5 s+ L, m$ k; o
5 v$ f1 `. \- s+ I- A/ j8 B* U$ C( e( w, `
3 x0 @8 g- ?- f6 `$ u
|
本帖子中包含更多資源
您需要 登錄 才可以下載或查看,沒有帳號,?注冊會員
x
|