AlphaZeroがチェス、将棋、囲碁の最強AIに勝利

※本サイトのコンテンツには、商品プロモーションが含まれている場合があります。

DeepMindは、「AlphaGo Zero」から進化させた強化学習採用のAI「AlphaZero」が、チェス、将棋、囲碁のそれぞれの世界最強AIを打ち負かしたと発表した。

強化学習（reinforcement learning）は大まかに言うと、学習用のデータを使わずに、AIが選択した行動が正しければ報酬を与えることで、AIの状況判断能力を上げていく機械学習方式。AlphaZeroはまた、行動の選択に「モンテカルロ木探索（MCTS）」と呼ばれる検索アルゴリズムを使う。

AlphaZeroはこの方法で、チェスを9時間学習した後チェスの世界チャンピオンAI「Stockfish」を、将棋を12時間学習した後世界コンピュータ将棋選手権の2017年の勝者「elmo」に、囲碁を13日間学習した後AlphaGo Zeroに勝利し…
続きはソース元で
http://www.itmedia.co.jp/news/articles/1812/09/news018.html