つい最近テレビでAlphaGo なる人工知能が世界最高峰のプロ棋士と対戦して4勝1敗にて
勝利したことを題材に羽生善治さんがレポートしている番組(NHKスペシャル「天使か悪魔
か 羽生善治 人工知能を探る」(5月15日21時〜21時49分 放映))を見ていたら、この
プログラムを手掛けたハサビス氏が人間の脳の活動を観察することから、多くの経験を通し
て直感やひらめきといった機能を取り入れることで不可能と言われていた囲碁の対戦ソフト
に画期的な前進をもたらしたとあった。
全検索という従来の方法を、視点を変えることでブレイクスルーが可能になったことに驚い
た。たまたま神経や薬学を研究されている池谷裕二氏の本を読んでいたら、行列を使って
記憶の構造のシュレーションをモデル化しているのが面白かったので紹介してみます。
もともと何も知らない赤ちゃんが言葉を操れるようになるのは、周りがいろいろ喋っている
のを何度も聞く経験を繰り返すことから先生役の人が教えるのではなく、自律的に言葉を記
憶し、その使い回しを自ずと習得していける脳の機能にある。記憶が可能なのは脳の変容、
その可塑性をモデル化していく。
今、神経細胞が3個(A,B,C)あると仮定し、「1:活動している -1:休止している」とすると
8パターンの状態が考えられ、それぞれを繋ぐシナプスが各神経細胞から
A<->B<->C(<->A)
と伸びていると考える。
今、各(A,B,C)の状態でのシナプスの働きを行列で
[a(AA) a(AB) a(AC)]
M=[a(BA) a(BB) a(BC)]
[a(CA) a(CB) a(CC)]
で与えるが、神経細胞が
(1<=>1)なら1 、(1<=>-1)なら-1 、(-1<=>-1)なら0
と各成分を決めると、[A]、[B}、[C] の状態が
[A]、[B}、[C] =[ 1]、[ 1]、[-1] ならば
[ 0 1 -1]
M1=[ 1 0 -1]
[-1 -1 0]
[A]、[B}、[C] =[ 1]、[-1]、[ 1] ならば
[ 0 -1 1]
M2=[-1 0 -1]
[ 1 -1 0]
[A]、[B}、[C] =[ -1]、[1]、[ 1] ならば
[ 0 -1 -1]
M3=[-1 0 1]
[ -1 1 0]
[A]、[B}、[C] =[ 1]、[-1]、[ -1] ならば
[ 0 -1 -1]
M4=[-1 0 0]
[ -1 0 0]
[A]、[B}、[C] =[ -1]、[1]、[ -1] ならば
[ 0 -1 0]
M5=[-1 0 -1]
[ 0 -1 0]
[A]、[B}、[C] =[ -1]、[-1]、[ 1] ならば
[ 0 0 -1]
M6=[0 0 -1]
[ -1 -1 0]
[A]、[B}、[C] =[ 1]、[1]、[ 1] および [ -1]、[-1]、[ -1] は省略
そこで、s回学習することをs*M なるスカラー倍の行列で表すと、一般に、例えば、M1を2回、
M3の学習を3回やれば、脳内は、
[ 0 -1 -5]
2*M1+3*M3=[-1 0 1]
[-5 1 0]
そこで、この行列に [-1]、[ 1]、[ 1] をかける計算を行うと、
[ 0 -1 -5][-1] [-6]
[-1 0 1][ 1]=[ 2]
[-5 1 0][ 1] [ 6]
結果をsignで符号だけで判断すれば、 [-1]、[ 1]、[ 1] となり、M1より余計に学習したM3
での記憶が呼び戻せたことと解釈できる。
また、記憶が曖昧になり3つの内一つが思い出せず、そこを0で処理することで
[ 0 -1 -5][ 0] [-6]
[-1 0 1][ 1]=[ 1]
[-5 1 0][ 1] [ 1]
[ 0 -1 -5][-1] [-5]
[-1 0 1][ 0]=[ 2]
[-5 1 0][ 1] [ 5]
[ 0 -1 -5][-1] [-1]
[-1 0 1][ 1]=[ 1]
[-5 1 0][ 0] [ 6]
とどれも結果的にM3の記憶 [-1]、[ 1]、 1] を連想できることにつながる。