2012年1月19日03時00分
将棋のプロとコンピューターが対決する「第1回電王戦」で14日、将棋ソフト「ボンクラーズ」が米長邦雄元名人(68)に勝った。コンピューター将棋の歴史が始まって38年。改良を重ねて弱点を解消することで、人工知能がプロ棋士のレベルに追いついた。
■1秒間に1800万手
「ボンクラーズ」は、先行する将棋ソフト「ボナンザ」(大発見の意味)を搭載したマシンを複数つないだクラスター(房)を作って読む作業を分担させ、1秒間に1800万手を読めるようにした。ボナンザとクラスターをあわせて命名した。東京都の会社員伊藤英紀さん(49)が開発。昨年の第21回世界コンピュータ将棋選手権で優勝した。
「ボナンザ」は2005年、当時カナダ・トロント大化学科の研究員だった電気通信大の保木邦仁・特任助教(36)が開発した。これが将棋ソフト史の革命だった。
将棋はルール上、実現可能な指し手の数が10の220乗とも言われている。1秒間に万単位の手を読める高速コンピューターでも、全てを読み尽くすことは事実上、不可能だ。
コンピューターはそれぞれの局面で複数の選択肢を検討する。「駒の損得」や「駒の働き」などの項目からなる「評価関数」で点数化して比較し、より高い点数の方に指し進める。だから、過去の実戦例を参考にできる序盤や、王が詰むか詰まないかといった答えが出やすい終盤は得意だ。だが、はっきりとした結論が出にくい局面は苦手だった。点数化が難しいからだ。
■6万局の棋譜から学習
人間の場合は、序盤、中盤、終盤といった局面の流れに応じて、「中盤なら駒の損得」「終盤なら相手の王に迫るスピード」などと、いろいろな価値の重み付けを臨機応変に判断できる。
ボナンザは約6万局の棋譜を元に、それぞれの局面でプロなどが指した手を「最善手」ととりあえず仮定。手本となる「教師データ」と呼び、同じ局面を迎えたらソフトがその手を選ぶように評価関数のパラメーター(項目ごとの重み付け)の調整を試みた。その計算をマシンにさせることで、未知の局面でもプロならこう指すだろう、という精度の高い評価関数が自動的に作れる、つまり「自動学習」ができるようになったのがミソだ。
それまでは、パラメーターの調整を将棋がわかる開発者が手作業で入力する必要があり、非常に労力がかかっていた。しかし、棋力がアマ10級程度の保木さんは、その調整を自分でできないため、マシンに任せた。人間の先入観を排したことで、結果的に人間には思い浮かばない手を指すソフトができたのだ。
計算を効率化し、従来より幅広い選択肢を調べる「全幅探索」を用いた点も画期的で、より幅広く指し手を読めるようになった。それまでは、有力な手だけを深く掘り下げる選択的探索を採用するソフトが多かった。
こうした改善の結果、より正確な形勢判断ができるようになった。
■トップ棋士に勝てる日は
その保木さんは今回の対局前、米長氏の相談に乗った。米長氏は2手目に△6二玉という常識外れの手を指した。ボンクラーズが熟知する過去の実戦例の蓄積から外れ、「いくら読んでもきりがない局面」(米長氏)に誘導する狙い。この作戦は、保木さんが提案したものだった。
序盤は米長氏が相手に攻めの手段を与えず、作戦通りに進んだ。その後、さらに完封勝ちの手順を目指したが、実は自陣に隙が生じていた。ボンクラーズはそれを見逃さず攻撃を始め、そのまま押し切った。途中からは結論が見えやすい展開になり、コンピューターの持ち味が出た形だ。
米長氏は引退棋士。では、将棋ソフトが名人などトップ棋士に勝つのはいつなのか。コンピュータ将棋協会の理事を務める伊藤毅志・電気通信大助教は「1回勝つだけなら、今でもあり得ると思う。2、3年後には、長い持ち時間で番勝負をやっても勝てるのでは」と予測する。
第2回電王戦は来年、現役棋士5人と五つの将棋ソフトが対戦する。07年にボナンザに勝った渡辺明竜王は「プロレベルに達したのは認めざるを得ないが、本当の強さはまだ不透明。来年の電王戦で、かなり明らかになると思う」と話している。(村瀬信也)
◇
〈将棋ソフトの歴史〉
1974年 早稲田大のチームが将棋ソフトの開発を始める
87年 コンピュータ将棋協会発足。強さはアマ級位者クラス
90年 第1回世界コンピュータ将棋選手権
95年 このころアマ初段クラスの強さに
97年 チェスの世界王者がソフトに敗れる
2005年 将棋ソフト「激指」がアマ全国大会でベスト16
07年 「ボナンザ」が渡辺明竜王に善戦
10年 「あから2010」が清水市代女流王将(当時)に勝利