ルービックキューブを一瞬で解くことに深層強化学習アルゴリズムが成功

7月 17, 2019

囲碁のトップ棋士に勝利したAI「AlphaGo」は、自らの進化形として生まれた「AlphaGo Zero」に、誕生からわずか30時間で超えられてしまいました。AlphaGoとAlphaGo Zeroの違いは、AlphaGo Zeroが人間の棋譜を参考にせず、自身による強化学習で鍛錬を重ねたという点にありました。これと同じように、カリフォルニア大学アーバイン校(UCI)が生み出した深層強化学習アルゴリズム「DeepCubeA」は、人間の手助けなく、ルービックキューブをほんの一瞬で解けるようになったそうです。

from Pocket https://ift.tt/2SjAciY
via IFTTT

このブログを検索

もひかん

ルービックキューブを一瞬で解くことに深層強化学習アルゴリズムが成功

このブログの人気の投稿

How to patch OS X for the bash/Shellshock vulnerability | TUAW: Apple news, reviews and how-tos since 2004

(AMD 初のSSD 「Radeon R7 SSD」は国内9月上旬発売。120GB 1万2000円前後から - Engadget...

Beatsの新型完全ワイヤレスイヤホン｢Beats Studio Buds｣は来月に発表へ