Memeplexes

[PR]

2025年07月03日

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

GPUで疑似乱数 (DirectX 11)(Xorshift)

GPUで疑似乱数

人工知能の世界では今Deep Learningが流行りです。
そしてDeep Learningは重いのでGPUが向いています。
しかし制限（制約）付きボルツマンマシン（Restricted Boltzmann Machine：RBM）を使ったDeep Learningの場合、ネットワークの更新に乱数が必要です。
ニューロンが興奮するかどうかどうかを確率からランダムに決めるんですね。
ですから「GPUで乱数を得るには？」というのが今回のテーマです。
（CPU側で作った疑似乱数をGPUにどっと送ってもいいのですが、転送速度が気になります）

ここ数日OpenCLばっかり使っていたので今回はDirectX11を使ってあげましょう。
後でOpenCLでもやってみる気もしますけどね。

つづきはこちら

[0回]

PR

GPUでニューラルネットワーク更新 (OpenCL)

ニューロン更新

Deep Learningに備えて色々やってみます。
Deep Learningは重いことがわかったので、GPUで計算をしましょう。

using Cloo;
using System.Linq;

class Program
{
    static void Main()
    {
        ComputePlatform platform = ComputePlatform.Platforms[0];
        ComputeDevice[] devices = platform
            .Devices
            .Where(d => d.Type == ComputeDeviceTypes.Gpu)
            .ToArray();
        ComputeContext context = new ComputeContext(
            devices,
            new ComputeContextPropertyList(platform),
            null,
            System.IntPtr.Zero
            );
        ComputeCommandQueue commandQueue = new ComputeCommandQueue(
            context,
            devices[0],
            ComputeCommandQueueFlags.None
            );
        ComputeProgram program = new ComputeProgram(
            context,
            System.IO.File.ReadAllText("myKernelProgram.cl")
            );
        try
        {
            program.Build(devices, null, null, System.IntPtr.Zero);
        }
        catch
        {
            System.Console.WriteLine(program.GetBuildLog(devices[0]));
        }

        ComputeKernel kernel = program.CreateKernel("updateVisibleNeurons");

        int visibleNeuronCount = 3;
        int hiddenNeuronCount = 2;
        ComputeBuffer<float> visibleNeuronValues = new ComputeBuffer<float>(
            context,
            ComputeMemoryFlags.ReadWrite,
            visibleNeuronCount
            );
        ComputeBuffer<float> visibleNeuronBiases = new ComputeBuffer<float>(
            context,
            ComputeMemoryFlags.ReadOnly | ComputeMemoryFlags.CopyHostPointer,
            new float[visibleNeuronCount]
            );
        ComputeBuffer<float> weights = new ComputeBuffer<float>(
            context,
            ComputeMemoryFlags.ReadOnly | ComputeMemoryFlags.CopyHostPointer,
            Enumerable.Range(0, visibleNeuronCount * hiddenNeuronCount).Select(i => (float)i).ToArray()
            );
        ComputeBuffer<float> hiddenNeuronValues = new ComputeBuffer<float>(
            context,
            ComputeMemoryFlags.ReadOnly | ComputeMemoryFlags.CopyHostPointer,
            Enumerable.Range(0, hiddenNeuronCount).Select(i => (float)i).ToArray()
            );
        kernel.SetMemoryArgument(0, visibleNeuronValues);
        kernel.SetMemoryArgument(1, visibleNeuronBiases);
        kernel.SetMemoryArgument(2, weights);
        kernel.SetMemoryArgument(3, hiddenNeuronValues);
        kernel.SetValueArgument(4, visibleNeuronCount);
        kernel.SetValueArgument(5, hiddenNeuronCount);


        commandQueue.Execute(
            kernel,
            null,
            new long[] { visibleNeuronCount },
            new long[] { 1 },
            null
            );
        float[] resultVisibleNeuronValues = new float[visibleNeuronCount];
        commandQueue.ReadFromBuffer(visibleNeuronValues, ref resultVisibleNeuronValues, true, null);

        foreach (var number in resultVisibleNeuronValues)
        {
            System.Console.WriteLine(number);
        }

        hiddenNeuronValues.Dispose();
        weights.Dispose();
        visibleNeuronBiases.Dispose();
        visibleNeuronValues.Dispose();

        kernel.Dispose();
        commandQueue.Dispose();
        program.Dispose();
        context.Dispose();
    }
}

GPUがわで動くプログラムはこちら：

myKernelProgram.cl

float sigmoid(float x)
{
	return 1.0f / (1.0f + exp(-x));
}

__kernel void updateVisibleNeurons(
	__global float *resultVisibleNeuronValues,
	__global float *visibleNeuronBiases, 
	__global float *weights, 
	__global float *hiddenNeuronValues,
	int visibleNeuronCount,
	int hiddenNeuronCount)
{
	int visibleNeuronIndex = get_global_id(0);
	float sum = 0;

	for(int i = 0; i < hiddenNeuronCount;i++)
	{
		sum += weights[visibleNeuronIndex * hiddenNeuronCount + i] * hiddenNeuronValues[i];
	}

	resultVisibleNeuronValues[visibleNeuronIndex] 
		= sigmoid(sum + visibleNeuronBiases[visibleNeuronIndex]);
}

このプログラムを実行すると、次のようになります：

0.7310586
0.9525741
0.9933071

上手く動いているようですね。
※sigmoid(1)は0.73...です。

[1回]

C#でOpenCL入門一覧 (Cloo版)

ClooからOpenCLを使うシリーズをまとめます。

感想

OpenCLNetよりインターフェースが綺麗かなと思って使い始めたClooですが、その…もうちょっとメソッドを簡素化して欲しいです。

Deep LearningはOpenCLNetとClooどっちを使うか迷ってきました。
いや、もしかしたらSlimDXでDirectX11のCompute Shaderあたりを使うかもしれませんね。
もっとも、Xbox Oneが出ることですしもうすぐMicrosoft公式のGPGPUライブラリが出てもおかしくありませんが。

[0回]

C#でOpenCL入門 (Cloo版) スレッドとグループの個数

スレッドとグループの個数

こちらも合わせてお読みください。

つづきはこちら

[0回]

C#でOpenCL入門 (Cloo版) 非バッファ引数

バッファの参照ではなくintをGPUに渡す

こちらも合わせてお読みください。

ここまでGPUにデータを渡すときはバッファを使っていました。
しかしint一つだけを渡す、なんてこともできます。

つづきはこちら

[0回]

S	M	T	W	T	F	S
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31