\u0026gt;京コンピュータのようなスーパーコンピュータでも、囲碁や将棋の思考は難しいとかいうけど、
これは誤解です。
別に囲碁や将棋の思考ぐらい、家庭用のパソコンやゲーム機にだってできます。
当然、スパコンだって可能です。
難しい、と言われているのは、囲碁や将棋の「ここから先の全ての盤面の展開を計算しきる事」です。
もしそれが出来るのであれば、複雑な思考なんて必要ありません。
先の展開を完全に見通しているのであれば、その中から自分の勝つコースを選ぶだけです。
しかし、囲碁や将棋は行動の選択肢が多く、盤面の展開のパターンはとてつもない数になるので、スパコンの計算能力を持ってしても、全てを計算するのに、何千万年も掛かってしまうので、現実的では無い。
という話です。
\u0026gt;ならば何でAIは人間に勝利できるの?
ですが、それはシンプルな話。
「盤面を最後まで読まない」事によって、現実的な時間内で手を打っているというだけです。
これは、AIだけではなく、パソコンやゲーム機の将棋ゲームソフトも同じです。
それぞれの機械の計算能力の許す限りできるだけ、先まで手を読みますが、全てを読み切る前に先読みを打ち切って、
その中から「どの盤面の方が有利そうか?」を判断してそちらへ進む道を選びます。
この、「どれくらい盤面が有利か?」を盤面から得点へと変換するプログラムを、評価関数と呼びます。
評価関数は、様々な条件から盤面の有利不利を数値化しますが、この出来が、将棋ソフトの強さを左右します。
昔の将棋ソフトは、人間が、
こういう盤面なら有利っぽいから得点をプラスしよう。
こういう状態は良くないから得点をマイナスしよう。といった条件を人力で設定していました。
つまりは、条件を設定した人間の判断能力に、将棋ソフトの強さが依存していました。
これは、ゲーム機でもスパコンでも同じです。
(ただし、スパコンは、同じ時間内により先まで手を読めるので、そのぶん強くなります)
AIの場合、この評価関数の条件付けを自分で行います。
様々な評価を用意して、それぞれで沢山の模擬戦を無数に繰り返して、買った場合の評価を強化し、負けた評価は弱めます。
そういう調整を自動で行わせながら、膨大な数の試行錯誤を行わせた結果、
人間が作ったものより遥かに優秀な評価関数が出来上がりました。
そのお陰で、AIは、いちいち全部先まで手を読まなくても、今の盤面が有利か不利か、そこからどっちに進めばより有利になるか、そういった事が高精度に判断できるようになりました。
人間のプロが全ての手を読まなくても有利不利を判断出来るのと似たような事を計算でできるようになったのです。
その結果として、人間のプロにも勝てるようになったのです。
ちなみに、スパコンというのは、大量のデータの計算能力の極端に高いコンピュータなので、原理上は他のコンピュータと同じです。
スパコンの計算能力をAIに活かせば、より先まで手を読めて、手を読んだ上で有利不利を判断できるので、
普通のパソコン上のAIよりは、スパコンのAIの方が原理的には強くなります。