忍者ブログ

Memeplexes

プログラミング、3DCGとその他いろいろについて

決定論的な行動を学習する

ピアノを学ぶ時、最初は指はたどたどしく動きますが、やがてスムーズになります。これは非決定論的な動きが学習によって決定論的になったのだとみなせます。どうしてそういう事が起きるのか考えてみましょう。


世界のすべてが制御下にある場合の学習

前回述べた学習法の復習をしましょう。何度も練習して、上手く行ったときの行動を繰り返すと、より物事を上手くやれるようになります。

もし目の前に2種類の銃があって、そのどちらかで的を撃てと言われたら、何度も的に命中させたり外したりを繰り返して、命中させた時の動作を繰り返せば、命中率は上がっていくでしょう。

Aの命中確率:%
Bの命中確率:%

これは2種類の銃のどちらかで的を撃つシミュレーションです。[100回試行して学習]ボタンを押すと、100回「銃を選び、的を撃」ち、その中で上手く行ったときの行動だけを記憶します。何度もこのボタンを押すと、より命中率の高い銃を選ぶようになり、射撃の腕も上がっていきます。

ただし、命中率の低い銃を選ばなくなるわけではないことに注意してください。あなたの射撃の腕は上がっているので、(一般人が使ったときの)命中率が低い銃を使ってもほぼ100%の確率で当てられるようになるのです。つまり、どっちの銃を選んでも大差がなくなるわけです。

物理学者ファインマンは複数のやり方で問題を解けて初めて解けるようになったと言えるのだというようなことを言っていましたが、このシミュレーションはまさにその状況です。問題の解き方には簡単な解き方やややこしい解き方がありますが、十分に習熟した人ならどちらの解き方も口笛を吹きながらやってみせるでしょう。弘法筆を選ばずです。

世界の一部分のみが制御下にある場合の学習

しかし残念なことに、どんなに練習しても上手くならないものもあります。量子サイコロを何千回転がしても、思い通りの目を出せるようにはならないでしょう。超能力者なら別ですが…。

上のシミュレーションをすこし変更して、どんなに練習しても射撃の腕は上手くならないようにしたのが次のシミュレーションです。あなたの射撃の腕は十分上手いのですが、銃の設計があまりにメチャクチャなので、必ず一定確率で的を外すのです。そのようなとき、あなたにできるのは銃の選択だけです。

Aの命中確率:%
Bの命中確率:%

[100回試行して学習]ボタンはさっきのシミュレーションとほぼ同じで、繰り返し練習し学習します。ただし、さっきのシミュレーションと違って、射撃の腕は全く上がりません。このとき、あなたにできるのはより命中率の高い銃を選ぶことだけです。それも、学習を進めていくにつれ、より命中率の高い方を選ぶ確率は100%に近づいていきます。弘法が筆を選ぶようになるのです。

両者の比較

この2つのシミュレーションを比較してみましょう。前者ではあなたが宇宙のすべてを支配していて非決定論的で、後者ではあなたは一部のみを支配していて決定論的なのです。ふつう、支配と決定論は同じものだと思われていることが多いようですが、これらのシミュレーションを考える限りではそうでないこともあるようです。全宇宙の支配が自由をもたらすのです!

あるいはこう考えることも出来ます。これらの2つのシミュレーションはどちらも、「的に命中させなければいけない」という意味で、あなたに自由はありません。責任があるのです。しかし、その責任をどのように分配するかに違いはあります。前者は責任を「銃の選択」と「射撃」に分散しているので、途中経過に自由があります。しかし後者は責任が「銃の選択」に集中するので、そこに自由はないのです。これは長期的な責任vs短期的な責任と考えることができそうです。前者のシミュレーションは「長期的な責任+自由」で、後者は「短期的な責任」です。「自由には責任が伴う」という言葉は、「途中経過が自由だと長期的な責任が伴う」と言い換えたほうがより正確でしょう。自由がなくても責任はやはり伴うからです。

現実世界では前者と後者どちらがより多く見られるでしょうか?私の考えでは、後者のシミュレーションのほうが現実世界に近いように思えます。現実世界では事前にどんなに練習しても、予想外の出来事というのはあるものです。とくに、人類の先祖が進化した環境では、どんなに獲物の行動を観察したとしても、情報不足や獲物の気まぐれにより予想が外れることはありえたでしょう。それなら彼らの子孫であるわたしたちが、自分たちの勢力圏内を決定論的にしようとしてもおかしくありません。つまり、資源をより効率的に分配するルールを作るというわけです。おそらく、格差の固定もこのあたりから来ているのでしょう。

まとめ

世界のすべてを支配すると、自由が生まれます。今すぐ完全にケリを付けなくても、あとでなんとかなるからです。いっぽう、世界の一部しか支配していないと、行動がより決定論的になります。今すぐ決着をつけないと物事が自分の手を離れていってしまうからです。

拍手[1回]

PR