Intelligence Dynamics 2005

2005/4/8

昨年も参加したインテリジェントダイナミクスに今年も参加した。Sonyがやっているロボットを中心とした新しい知性観についてのシンポジウムだ。こういう言い方はあまりよくないな。知性、身体、環境の間で成り立つ知の解明をロボットをツールとして究めていこう、そしていいロボットを作ろうというとてもいい企画だ。

どうでもいいことから書くと、この間退任が決まった出井(元?)社長の姿を見た。ああいう人たちというのは、大勢人がいる中で、顔が浮き出るんだよね。青学の卒業式で見た(たぶん間違いないと思うけど)中村吉右衛門さんと同じだ。

で、内容だが、


今回は残念ながら午前中は出席できず、理研のというか、日本の伊藤先生、京大の正高さん、などの発表は聞けなかった。午後から出席して、ATRの銅谷さんの話をまず聞いた。以前もどこかで聞いたことがあるし、国際高等研では個人的にもお話しした方だが、そのときからScientificな志向性が強く、とてもimpressiveなトークだった。要は、辺縁系、脳幹からの化学物質が強化学習の各種パラメタに対応したものとなっている可能性を示す証拠がかなりまとまってきたという話だ。
ドーパミン→報酬予測誤差
セロトニン→報酬予測誤差の割引率
ノルアドレナリン→探索範囲
アセチルコリン→学習率
などに関係しているという話だ。彼はこれをメタ学習と呼び定数として固定してしまう強化学習をさらに深めていこうというしている。

私と開さんの洞察の動的制約緩和理論でも、学習率、報酬予測誤差、探索範囲などはパラメタとなっており、扱う現象はまったく異なるが(運動学習と洞察!全然違うぞー!)、とても深いレベルの共通点を感じた。洞察においてもこうした物質の関与があるのだろうか。こうした知見は脳と親和的なモデルの構築にとって、crucialだ。

次の発表は東大の國吉さんのものだった。これはテレビで結果だけ見たことがあって(仰臥姿勢から起きあがるロボットの開発)、このときは「だから何なの?」という思いを強くしたが、これは誤解だったことが分かった。

彼の発表はこのシンポジウムの趣旨そのものような発表だった。基本は「身体と環境の相互作用により、脳が「見る」部分が特定されてくる」というものだ。Pfeiferの例の本のツボを具現化したものとも言える。行為の学習における自由度の問題、その間の制御の問題を作り込みを出来るだけ押さえた形で実現するための原理レベルの探求を徹底的に行い、そのカオス的性格を明らかにし、計測結果を実機、あるいはシミュレーションで確認している。見事だ。

これも実は私がやっている研究と関連している。ゼミ生の竹葉、メディア開発センタの大西君と一緒に、身体的スキルの熟達をやっているが、この研究に直接的に関連する部分もずいぶんとあった。両方とも身体を用いるものだから、とうぜんともいえるが、発散と収束、安定と揺らぎなどの各種成分が、skilled peformanceの鍵となるという意味では同じだ。ただ、私たちが熟達に焦点を置いているのに対して、國吉さんたちの研究は熟達した(してしまった)行為が可能になるための条件を焦点としているというところが違う。これらの結果についてもずいぶんと分かってきた部分があるので、こんどまとめてBlogに書いてみようと思う。

まあ、いずれにせよいろいろと刺激的で、やらねばならないこともわかってきた。こういう機会を作ってくれた人にはとても感謝したいし、また簡単に出席できるところにすんでいることにも感謝だな。


Comments are closed.