[PR]
×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
プログラミング、3DCGとその他いろいろについて
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
コインの表が出る確率をベイズで計算するプログラムです。
ここのプログラムを少し改造しました。
強化学習の概念を単純化したクイズを考えました。
Q学習が進む様子を表したでもプログラムを作ってみました。
問題の設定はここのものを使いました。
ここの問題設定を使ってQ学習のサンプルコードを書いてみました。
言語はC#です。
以前の記事でTodd A. Brunさんの論文を紹介しました。
タイムマシンコンピュータを利用してNP完全問題を多項式時間内に解く
この論文はある種の難しい計算問題をあっというまに解いてしまう方法を示しています。
ただし、その方法を行うにはタイムマシンがなければいけません。
その後私はもう少しスマートな方法を思いつきました(自画自賛ですが)。
プログラムがより単純で済む上、Todd A. Brunさんのオリジナルの方法よりも、必要とされるタイムトラベルの条件が圧倒的に緩いです(自画自賛ですが)。
もうすでに誰か別の人が同じことを考えついているような気もしますが、念のためメモしておきます。
なお、この記事は以前の記事の内容をベースにしているので、まだ読んでいない方は以下の記事からお読みください。