このループの中で、_shared_ float As[BLOCK_SIZE][BLOCK_SIZE];でシェアードメモリ上に部分行列Asの領域を確保する。また、Bsに対しても同様にシェアードメモリ上に領域を確保する。そして、As[ty][tx] = A[a + wA * ty + tx];とBs[ty][tx] = B[b + wB * ty + tx];で、各スレッドは自分が ...
以上述べたようにGeForce 8800/9800シリーズGPUは、16コアのプロセサであり、各コアには8個の並列に動作する演算ユニットを持つプロセサチップである。従って、元々はグラフィック処理をメインに開発されたチップであるが、汎用の計算に使用することも可能 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する