(Translated by https://www.hiragana.jp/)
AlphaZero - Wikipedia コンテンツにスキップ

AlphaZero

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

AlphaZero(アルファゼロ)は、DeepMindによって開発かいはつされたコンピュータプログラムである。ひろしされたAlphaGo Zeroのアプローチを使用しようしている。 2017ねん12月5にち、DeepMindチームはAlphaGo ZeroのアプローチをひろししたプログラムであるAlphaZeroの論文ろんぶんarXivうえ発表はっぴょうした。AlphaZeroは、24時間じかん以内いないチェス将棋しょうぎ囲碁いご世界せかいチャンピオンプログラムであるStockfishelmo、3日間にちかん学習がくしゅうさせたAlphaGo Zeroをやぶるレベルにたっした[1]具体ぐたいてきには、2あいだ将棋しょうぎ、4あいだでチェスの最高峰さいこうほうのAIに勝利しょうりし、AlphaGo Zeroも8あいだ上回うわまわった。

AlphaZeroは、オープニングブック序盤じょばん定跡じょうせきデータベース)とエンドゲームのひょう終盤しゅうばん解析かいせきしたデータベース)を参照さんしょうせずに、4あいだ自己じこ対戦たいせんだけでStockfishを凌駕りょうがした[2][3]

それまでチェスおよび将棋しょうぎAI一般いっぱんてきであったアルファ・ベータ探索たんさくではなく、囲碁いごAIで成功せいこうおさめたモンテカルロ探索たんさくモンテカルロほう応用おうよう)とディープラーニングをこれらのゲームにたいして適用てきようしてもつよいAIがつくれることを実証じっしょうした。

手法しゅほう[編集へんしゅう]

モンテカルロ探索たんさく使用しようした自己じこ対戦たいせんによって、ディープラーニングをもちいた強化きょうか学習がくしゅうをする。

AlphaGo Zeroとの関係かんけい[編集へんしゅう]

AlphaZero (AZ) は、AlphaGo Zero (AGZ) アルゴリズムのよりひろしされた変種へんしゅであり、囲碁いごとともに将棋しょうぎとチェスがプレーできる。AZとAGZとのあいだちがいには以下いか内容ないようふくまれる[1]

  • AZは探索たんさくハイパーパラメータ英語えいごばん設定せっていのためにハードコードされている。
  • ニューラルネットワークはえず更新こうしんされる。
  • (チェスとことなり)囲碁いご任意にんいかがみうつ回転かいてん対称たいしょうである。AGZはこれらの対称たいしょうせいをうまく利用りようするようにプログラムされている。AZはされていない。
  • 囲碁いごことなり)チェスにはけがある。したがって、AZはけの可能かのうせい考慮こうりょできる。

性能せいのう[編集へんしゅう]

囲碁いご[編集へんしゅう]

囲碁いごを8あいだ自己じこ学習がくしゅうしたのちぜんバージョンのAlphaGo Zeroと対戦たいせんして、AlphaZeroは60しょう40はいであった[4]

将棋しょうぎ[編集へんしゅう]

将棋しょうぎプログラムelmoとの100きょくにおいて、AlphaZeroは90しょう8はい2ふんであった[4]。このとき、思考しこう時間じかんはチェス同様どうよういちごとに1ふんあたえられた。

チェス[編集へんしゅう]

AlphaZeroとStockfishとのチェス対局たいきょくにおいて、それぞれのプログラムはいちごとに1ぶん思考しこう時間じかんあたえられた。AlphaZeroはしろ先手せんて)で25しょうくろ後手ごて)で3しょうし、のこりの72きょくけた[4]

AlphaZeroはStockfishをはじめてかしたプログラムではない。Komodo英語えいごばんばれるプログラムが、今回こんかいよりまえにStockfishをやぶっていた[4]。Komodoのラリー・カウフマン英語えいごばんはAlphaZeroの勝利しょうり重要じゅうようせず、「AlphaZeroは効果こうかてき自分じぶんのオープニングブックを構築こうちくしているので、オープニングブックをもちいるトップエンジンにたいしてよりフェアにたたかえたのだろう」と主張しゅちょうした[5]

評価ひょうか[編集へんしゅう]

新聞しんぶんは、訓練くんれんにわずか4あいだしかかからなかったとのだい見出みだしをけた: 『朝食ちょうしょく昼食ちゅうしょくあいだ大差たいさない時間じかんでやってのけた』[2][6]WIREDは、AlphaZeroを「はつのマルチスキルAIボードゲームチャンピオン」として大々的だいだいてき宣伝せんでんした[7]。AI専門せんもんのJoanna Bysoは、Googleは「パブリシティ(宣伝せんでん)の才覚さいかく」によって競合きょうごう他社たしゃたいして有利ゆうり立場たちばったとべた。「すぐれたプログラマーをやとえるだけではありません。AI部門ぶもん注目ちゅうもくする各国かっこく政府せいふ規制きせい当局とうきょくしゃとの交渉こうしょうにおいてできるかぎつよ立場たちばじょうでも有益ゆうえきなので、非常ひじょう政治せいじてきでもあるのです。」[4]

オランダのチェスグランドマスターであるピーター・ハイネ・ニールセン英語えいごばんはBBCのインタビューにたいして、「わたしはいつも、人間にんげんよりすぐれた生命せいめい地球ちきゅうち、チェスをどうプレーするのかせてくれたらどんなふうになるのだろうとおもっていました。いま、わかりました」とかたった[4]。ノルウェーのグランドマスターであるヨン・ルズヴィ・ハンメル英語えいごばんはAlphaZeroの特徴とくちょうについて、深遠しんえんなポジショナルプレイ(こま位置いちくするかた)をもちいながらの「常軌じょうきいっした攻撃こうげきてきチェス」とべた[2]

脚注きゃくちゅう[編集へんしゅう]

  1. ^ a b Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (5 December 2017). "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm". arXiv:1712.01815 [cs.AI]。
  2. ^ a b c Knapton, Sarah; Watson, Leon (2017ねん12月6にち). “Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours” (英語えいご). Telegraph.co.uk. http://www.telegraph.co.uk/science/2017/12/06/entire-human-chess-knowledge-learned-surpassed-deepminds-alphazero/ 2017ねん12月6にち閲覧えつらん 
  3. ^ Vincent, James (2017ねん12月6にち). “DeepMind’s AI became a superhuman chess player in a few hours, just for fun”. The Verge. https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go 2017ねん12月6にち閲覧えつらん 
  4. ^ a b c d e f “'Superhuman' Google AI claims chess crown”. BBC News. (2017ねん12月6にち). http://www.bbc.com/news/technology-42251535 2017ねん12月7にち閲覧えつらん 
  5. ^ “Google's AlphaZero Destroys Stockfish In 100-Game Match - Chess.com”. Chess.com. https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match 2017ねん12月7にち閲覧えつらん 
  6. ^ Badshah, Nadeem (2017ねん12月7にち). “Google's DeepMind robot becomes world-beating chess grandmaster in four hours”. The Times. https://www.thetimes.co.uk/article/google-s-deepmind-alphazero-becomes-world-beating-chess-grandmaster-in-four-hours-hcppp9vr2 2017ねん12月7にち閲覧えつらん 
  7. ^ “Alphabet's Latest AI Show Pony Has More Than One Trick”. WIRED. (2017ねん12月6にち). https://www.wired.com/story/alphabets-latest-ai-show-pony-has-more-than-one-trick/ 2017ねん12月7にち閲覧えつらん