ガジェット通信

見たことのないものを見に行こう

コンピュータ将棋と知能の本質(科学ライター 鹿野 司)

DATE: BY:
  • ガジェット通信を≫


今回は鹿野 司さんのブログ『くねくね科学探検日記』からご寄稿いただきました。

コンピュータ将棋と知能の本質(科学ライター 鹿野 司)

知っている人は多いだろうけど、プロ棋士とコンピュータ将棋の対戦する電王戦が、2012年から行われている。

第一回目は米永邦雄永世棋聖vsボンクラーズで、人間の負け。
第二回は5対5の団体戦になって、コンピュータ3勝1負1引き分け。
そして、先日行われた第三回では、事前に棋士側に対戦プログラムを貸与して研究して貰った上での対戦だったのに、コンピュータ4勝1負となった。

このことからすると、コンピュータ将棋は、すでに人間の最高の棋力と同等かそれ以上のレベルに達していると考えるのが、妥当だと思う。

オレ自身は将棋のことはほとんど解らない。だけど、コンピュータ将棋の強さに関しては、いくつかの面白い証言があるんだよね。

一つは、今回の電王戦の対局の前に、やねうら王というプログラムに途中でフリーズするバグが見つかったため、特例として修正が認められたんだけど、その修正後のプログラムが、プロ棋士側から棋力が上がっているとクレームされて、結局元の状態に戻されたというごたごたがあったことだ。

勝負としては、このもとのバージョンでも結局やねうら王が勝ったんだけど、これのポイントは、修正バージョンについて、プログラマはバグを取っただけで、棋力が上がったとは思っていなかったってことだ。

つまり、プログラマも、何をどうしたら棋力が上がるのか、余り確かには解っていない部分があるってことなんだよね。

もうひとつ、これは第二回電王戦の時から言われていることだけど、コンピュータは人間だったら普通は指そうとは思わない手を指して勝つことがあるということ。プロ棋士の見立てでは、そこに打つと不利と感じる手なのに、それが後々盛り返して有利な展開になるということが,何度か起きている。つまり、人間の認識力を超えた手が指せることもあるわけね。

さて、今のコンピュータ将棋がなんでここまで強くなったのかというと、これはコンピュータの性能がめっちゃ上がって、あらゆる手を人間より深く読めるようになったから……ではない。

これは,そう誤解している人は多いと思うし、どうもプロ棋士の人もなんとなくそう思っているみたいだけど、最も重要なポイントそこにはない。

コンピュータ将棋が今みたいに強くなったのは、2005年に登場したボナンザというプログラムによるところが大きい。

ボナンザはそれまでのコンピュータ将棋のコミュニティとは全く縁がない、当時カナダ在住で、ご本人はあまり将棋も強くない、物理化学が専門の保木邦仁さんが作ったプログラムなんだよね。しかも、当時のノートパソコンで動くような軽いプログラムだったんだけど、それにもかかわらず、2006年のコンピュータ将棋大会で優勝するなど、発表直後は飛び抜けた強さを誇っていた。

さらに、2009年にはボナンザはソースプログラムを公開して、今ある強いプログラムの全てがボナンザ方式を採用しているらしい。

では、そのボナンザ方式とは何なのかというと、機械学習をそれまでとは違った方法で使ったものだったんだよね。

コンピュータ将棋は、ある盤面が有利か不利かを、評価関数というものを計算して測っている。王と他の2つの駒がどういう位置関係になったらどれくらい有利になるかとか、条件を色々考えて得点を与え、その数値を総合して次にどの手を打つか判断をしているわけね。

で、過去のプログラムは、どれもこのルールを、将棋のかなり強い人が一生懸命頭で考えて作り込んでいた。

ところがボナンザは、そこのところを人間が考えるのではなく、過去の6万にも及ぶ棋譜データから自動的に作り出すようにした。

最初のバージョンでは、このルールの数は1万くらいだったんだけど、のちに5000万個まで増やしている。

つまり6万の棋譜データから作った5000万個のルールを使って、今の局面ではどの手を打ったら有利になるかを計算するようにしたわけね。

まあ、棋力をさらに高めるには、これ以外の様々な技術もいるんだけど(だからボナンザはもう最強のプログラムではない)、もっともキモとなっているのはこの機械学習の部分だ。

これはいったいどういうことなのか。

ある盤面に対して5000万個のルールを適用するというのは、つまり個々のルールには人間が考えるような、論理的な意味はないってことだ。

この駒ががここにあれば有利とかの、ゲームの進行から論理的に判断されるようなルールは5000万個も作れるはずがない。個々のルールのほとんどは、人間がどう考えても無意味としか思えないようなものになっているはずだ。

このルールの集合体は、例えるなら、生物の形質、つまり、角があるとかしっぽが生えてるとかエラがあるとかそういう特徴に相当するんだよね。

そしてその形質は、6万の棋譜によるデータ空間という環境の中で、もっとも成功するように調節される。つまり、ここには進化と本質的に同じプロセスが働いている。

進化というのは、ランダムな突然変異、つまり樹木がほっておくと色んな方向にボウボウに伸びちゃうようなことがまずおきて、それを環境がふさわしい形に刈り取る、つまり庭師が適切に剪定するような形でおきている。

まわりの生物も含む環境が、生物の形を決めているわけで、オレはこれを、「生命は方円の器に従う」といっているんだけど。

これと同じように、5000万のルールは、分子進化中立説と同じような、個々には生存に有利にも不利にもならない形質なんだろうけど、手順が進むにつれて、棋譜空間という環境に適応した形に進化していく。

このやり方が、想像以上に強いプログラムの誕生につながったわけだ。

そして、こういうやり方だから、プログラマも何をどうしたら棋力が上がるかということについて、余りはっきりしたことは解らなくなっているんだろう。

面白いのは、人間が過去に指した棋譜データ空間に適応させただけなのに、そのプログラムが人間には思いつけない手が打てるということだ。

コンピュータと違って、人間は直感的に有望そうな手をいくつかに絞り込み、それを何十手と深く読むらしい。

この直感的に有望そうな手が見つけられるというのは、つまり不可能立体は想像できないというのと、同じメカニズムなんじゃないかと思う。

人間の目は、脳に二枚の二次元の図形を入力している。そして脳は、ほとんどの場合、ただ一通りの3次元図形のイメージを作りだしている。

でも、実際には二枚の二次元の図形から想定できる三次元立体ってのは、無限にあるんだよね。無限の可能性があるのに、人間はそれにはほとんど気づくことすらなくて、ただ一つの三次元立体しか想像できない。

これは、生まれてから自然界に存在する色々なものを見ながら神経回路が取捨選択されて、自然にはありえない図形をイメージするような回路は刈り取られることで成立しているはずだ。

だから、不可能立体のように、自然界に存在しない図形を見ると、通常の視覚イメージでは正しく解釈できなくて、びっくりしてしまうわけね。

これと同じで、棋士たちも長い訓練によって、棋譜空間上での不可能立体に相当するものは見えなくなっているのだろう。余計なものが見えないから、ある部分だけに絞って深く深く探索することができる。

ところが、プログラムは棋譜空間に適応して進化したのにもかかわらず、一部の不可能立体に相当するもの作ってしまえるんだろう。それが、人間だったら恐くて打てない手の正体なんじゃないかな。

ただ、こういう機械学習による強さというのは、人と同じ論理的な思考でやっているわけではなくて、ミミックというか人間モドキというか、外形的な模倣でしかないということもできる。

つまり、このやり方では、あらゆる人間に勝利する、人間よりもちょっと賢いところまでは行けるけど、それはあらゆる手を完全に読み尽くして将棋を解くような、神そのものみたいな情報処理能力とは、だいぶ違うものなんだよね。

一方で、人間はこういうコンピュータ知性と違って、論理的に考えているようにみえるけど、実はそうではないかも知れないとも思う。

コンピュータのハードウェアはロジック回路でできていて、三段論法とかも記号論理どおりきちっとやっている。

ところが、人間の論理的思考というのは、感覚入力がおかしくなると、簡単に正しい推論ができなくなる。たとえば夢の中では素晴らしいアイデアを思いついたと思っていても、起きたら全くおかしな考えだったなんてことがあるよね。統合失調症の人が回りからおかしな考えに見えるのも、感覚入力がおかしくなった結果として、そうなっているんじゃないかな。

つまり、人間の論理的な思考というのは、ロジック回路みたいに物理的にそれ以外できないようなものではなくて、経験という外部入力によって、コンピュータ将棋の機械学習みたいな形で、見かけ上形が整えられて、できているものなんじゃないかなあとも思えるんだよね。

執筆:この記事は鹿野 司さんのブログ『くねくね科学探検日記』からご寄稿いただきました。

寄稿いただいた記事は2014年05月30日時点のものです。

寄稿の記事一覧をみる ▶

記者:

ガジェット通信はデジタルガジェット情報・ライフスタイル提案等を提供するウェブ媒体です。シリアスさを排除し、ジョークを交えながら肩の力を抜いて楽しんでいただけるやわらかニュースサイトを目指しています。 こちらのアカウントから記事の寄稿依頼をさせていただいております。

TwitterID: getnews_kiko

  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。

TOP