alpaka-group · fwyzard · Aug 20, 2024 · Aug 16, 2024
diff --git a/example/bufferCopy/src/bufferCopy.cpp b/example/bufferCopy/src/bufferCopy.cpp
@@ -105,7 +105,7 @@ auto example(TAccTag const&) -> int
     // Define the work division for kernels to be run on devAcc and devHost
     using Vec = alpaka::Vec<Dim, Idx>;
     Vec const elementsPerThread(Vec::all(static_cast<Idx>(1)));
-    Vec const threadsPerGrid(Vec::all(static_cast<Idx>(10)));
+    Vec const elementsPerGrid(Vec::all(static_cast<Idx>(10)));
 
     // Create host and device buffers
     //
@@ -164,7 +164,7 @@ auto example(TAccTag const&) -> int
 
     FillBufferKernel fillBufferKernel;
 
-    alpaka::KernelCfg<Host> const hostKernelCfg = {threadsPerGrid, elementsPerThread};
+    alpaka::KernelCfg<Host> const hostKernelCfg = {elementsPerGrid, elementsPerThread};
     auto const hostWorkDiv = alpaka::getValidWorkDiv(hostKernelCfg, devHost, fillBufferKernel, hostViewPlainPtrMdSpan);
 
     alpaka::exec<Host>(hostQueue, hostWorkDiv, fillBufferKernel,
@@ -204,7 +204,7 @@ auto example(TAccTag const&) -> int
     TestBufferKernel testBufferKernel;
 
     // Let alpaka calculate good block and grid sizes given our full problem extent
-    alpaka::KernelCfg<Acc> const devKernelCfg = {threadsPerGrid, elementsPerThread};
+    alpaka::KernelCfg<Acc> const devKernelCfg = {elementsPerGrid, elementsPerThread};
     auto const devWorkDiv = alpaka::getValidWorkDiv(devKernelCfg, devAcc, testBufferKernel, deviceBufferMdSpan1);
 
     alpaka::exec<Acc>(devQueue, devWorkDiv, testBufferKernel, deviceBufferMdSpan1);

diff --git a/example/complex/src/complex.cpp b/example/complex/src/complex.cpp
@@ -53,12 +53,12 @@ auto example(TAccTag const&) -> int
     Queue queue(devAcc);
 
     // Define the work division
-    Idx const threadsPerGrid = 1u;
+    Idx const elementsPerGrid = 1u;
     Idx const elementsPerThread = 1u;
 
     ComplexKernel complexKernel;
 
-    alpaka::KernelCfg<Acc> const kernelCfg = {threadsPerGrid, elementsPerThread};
+    alpaka::KernelCfg<Acc> const kernelCfg = {elementsPerGrid, elementsPerThread};
 
     // Let alpaka calculate good block and grid sizes given our full problem extent
     auto const workDiv = alpaka::getValidWorkDiv(kernelCfg, devAcc, complexKernel);

diff --git a/example/convolution1D/src/convolution1D.cpp b/example/convolution1D/src/convolution1D.cpp
@@ -130,7 +130,7 @@ auto example(TAccTag const&) -> int
 
     auto const elementsPerThread = Vec::all(static_cast<Idx>(1));
     // Grid size
-    auto const threadsPerGrid = inputSize;
+    auto const elementsPerGrid = inputSize;
 
     // Instantiate the kernel (gpu code) function-object
     ConvolutionKernel convolutionKernel;
@@ -140,7 +140,7 @@ auto example(TAccTag const&) -> int
     DataType* nativeInputDeviceMemory = std::data(inputDeviceMemory);
     DataType* nativeOutputDeviceMemory = std::data(outputDeviceMemory);
 
-    alpaka::KernelCfg<DevAcc> const kernelCfg = {threadsPerGrid, elementsPerThread};
+    alpaka::KernelCfg<DevAcc> const kernelCfg = {elementsPerGrid, elementsPerThread};
 
     // Let alpaka calculate good block and grid sizes given our full problem extent
     auto const workDiv = alpaka::getValidWorkDiv(

diff --git a/example/helloWorld/src/helloWorld.cpp b/example/helloWorld/src/helloWorld.cpp
@@ -126,7 +126,7 @@ auto example(TAccTag const&) -> int
     // vector processing unit.
     using Vec = alpaka::Vec<Dim, Idx>;
     auto const elementsPerThread = Vec::all(static_cast<Idx>(1));
-    auto const threadsPerGrid = Vec{4, 2, 4};
+    auto const elementsPerGrid = Vec{4, 2, 4};
 
     // Instantiate the kernel function object
     //
@@ -135,7 +135,7 @@ auto example(TAccTag const&) -> int
     // argument. So a kernel can be a class or struct, a lambda, etc.
     HelloWorldKernel helloWorldKernel;
 
-    alpaka::KernelCfg<Acc> const kernelCfg = {threadsPerGrid, elementsPerThread};
+    alpaka::KernelCfg<Acc> const kernelCfg = {elementsPerGrid, elementsPerThread};
 
     // Let alpaka calculate good block and grid sizes given our full problem extent
     auto const workDiv = alpaka::getValidWorkDiv(kernelCfg, devAcc, helloWorldKernel);

diff --git a/example/helloWorldLambda/src/helloWorldLambda.cpp b/example/helloWorldLambda/src/helloWorldLambda.cpp
@@ -75,7 +75,7 @@ auto example(TAccTag const&) -> int
     // Define the work division
     using Vec = alpaka::Vec<Dim, Idx>;
     auto const elementsPerThread = Vec::all(static_cast<Idx>(1));
-    auto const threadsPerGrid = Vec{4, 2, 4};
+    auto const elementsPerGrid = Vec{4, 2, 4};
 
 
     size_t const nExclamationMarks = 10;
@@ -117,7 +117,7 @@ auto example(TAccTag const&) -> int
         printf("\n");
     };
 
-    alpaka::KernelCfg<Acc> const kernelCfg = {threadsPerGrid, elementsPerThread};
+    alpaka::KernelCfg<Acc> const kernelCfg = {elementsPerGrid, elementsPerThread};
 
     // Let alpaka calculate good block and grid sizes given our full problem extent
     auto const workDiv = alpaka::getValidWorkDiv(kernelCfg, devAcc, kernelLambda, nExclamationMarks);

diff --git a/example/kernelSpecialization/src/kernelSpecialization.cpp b/example/kernelSpecialization/src/kernelSpecialization.cpp
@@ -77,11 +77,11 @@ auto example(TAccTag const&) -> int
     Queue queue(devAcc);
 
     // Define the work division
-    std::size_t const threadsPerGrid = 16u;
+    std::size_t const elementsPerGrid = 16u;
     std::size_t const elementsPerThread = 1u;
     Kernel kernel;
 
-    alpaka::KernelCfg<Acc> const kernelCfg = {threadsPerGrid, elementsPerThread};
+    alpaka::KernelCfg<Acc> const kernelCfg = {elementsPerGrid, elementsPerThread};
 
     // Let alpaka calculate good block and grid sizes given our full problem extent
     auto const workDiv = alpaka::getValidWorkDiv(kernelCfg, devAcc, kernel);

diff --git a/example/openMPSchedule/src/openMPSchedule.cpp b/example/openMPSchedule/src/openMPSchedule.cpp
@@ -104,13 +104,13 @@ auto main() -> int
     Queue queue(devAcc);
 
     // Define the work division
-    Idx const threadsPerGrid = 16u;
+    Idx const elementsPerGrid = 16u;
     Idx const elementsPerThread = 1u;
 
     OpenMPScheduleDefaultKernel openMPScheduleDefaultKernel;
 
     // Let alpaka calculate good block and grid sizes given our full problem extent
-    alpaka::KernelCfg<Acc> kernelCfg = {threadsPerGrid, elementsPerThread};
+    alpaka::KernelCfg<Acc> kernelCfg = {elementsPerGrid, elementsPerThread};
     auto const workDiv = alpaka::getValidWorkDiv(kernelCfg, devAcc, openMPScheduleDefaultKernel);
 
     // Run the kernel setting no schedule explicitly.

diff --git a/test/unit/workDiv/src/WorkDivForKernelTest.cpp b/test/unit/workDiv/src/WorkDivForKernelTest.cpp
@@ -88,10 +88,10 @@ TEMPLATE_LIST_TEST_CASE("getValidWorkDiv.1D", "[workDivKernel]", TestAccs)
 
     // Get the device properties and hard limits
     auto const props = alpaka::getAccDevProps<Acc>(dev);
-    Idx const threadsPerGridTestValue = props.m_blockThreadCountMax * props.m_gridBlockCountMax;
+    Idx const elementsPerGridTestValue = props.m_blockThreadCountMax * props.m_gridBlockCountMax;
 
-    // Test the getValidWorkDiv function for threadsPerGridTestValue threads per grid.
-    alpaka::KernelCfg<Acc> const kernelCfg = {Vec{threadsPerGridTestValue}, Vec{1}};
+    // Test the getValidWorkDiv function for elementsPerGridTestValue threads per grid.
+    alpaka::KernelCfg<Acc> const kernelCfg = {Vec{elementsPerGridTestValue}, Vec{1}};
     auto const workDiv = alpaka::getValidWorkDiv(kernelCfg, dev, kernel, 200ul);
 
     // Test the isValidWorkDiv function
@@ -107,7 +107,7 @@ TEMPLATE_LIST_TEST_CASE("getValidWorkDiv.1D", "[workDivKernel]", TestAccs)
     CHECK(threadsPerBlock <= threadsPerBlockLimit);
 
     // Check that using the maximum number of threads per block is valid.
-    auto const validWorkDiv = WorkDiv{Vec{threadsPerGridTestValue / threadsPerBlock}, Vec{threadsPerBlock}, Vec{1}};
+    auto const validWorkDiv = WorkDiv{Vec{elementsPerGridTestValue / threadsPerBlock}, Vec{threadsPerBlock}, Vec{1}};
     CHECK(alpaka::isValidWorkDiv<Acc>(validWorkDiv, dev, kernel, 200ul));
 
     // Check that using too many threads per block is not valid.
@@ -122,7 +122,7 @@ TEMPLATE_LIST_TEST_CASE("getValidWorkDiv.1D", "[workDivKernel]", TestAccs)
     if constexpr(alpaka::isSingleThreadAcc<Acc>)
     {
         // Check that the compute work division uses a single thread per block.
-        auto const expectedWorkDiv = WorkDiv{Vec{threadsPerGridTestValue}, Vec{1}, Vec{1}};
+        auto const expectedWorkDiv = WorkDiv{Vec{elementsPerGridTestValue}, Vec{1}, Vec{1}};
         CHECK(workDiv == expectedWorkDiv);
 
         // Check that a work division with more than one thread per block is not valid.
@@ -161,10 +161,10 @@ TEMPLATE_LIST_TEST_CASE("getValidWorkDiv.2D", "[workDivKernel]", TestAccs2D)
 
     // Get the device properties and hard limits
     auto const props = alpaka::getAccDevProps<Acc>(dev);
-    Idx const threadsPerGridTestValue = props.m_blockThreadCountMax * props.m_gridBlockCountMax;
+    Idx const elementsPerGridTestValue = props.m_blockThreadCountMax * props.m_gridBlockCountMax;
 
-    // Test getValidWorkDiv function for threadsPerGridTestValue threads per grid.
-    alpaka::KernelCfg<Acc> const kernelCfg = {Vec{8, threadsPerGridTestValue / 8}, Vec{1, 1}};
+    // Test getValidWorkDiv function for elementsPerGridTestValue threads per grid.
+    alpaka::KernelCfg<Acc> const kernelCfg = {Vec{8, elementsPerGridTestValue / 8}, Vec{1, 1}};
     auto const workDiv = alpaka::getValidWorkDiv(kernelCfg, dev, kernel, 200ul);
 
     // Test the isValidWorkDiv function
@@ -184,7 +184,7 @@ TEMPLATE_LIST_TEST_CASE("getValidWorkDiv.2D", "[workDivKernel]", TestAccs2D)
 
     // Check that using the maximum number of threads per block is valid.
     auto const validWorkDiv
-        = WorkDiv{Vec{8, threadsPerGridTestValue / threadsPerBlock / 8}, Vec{1, threadsPerBlock}, Vec{1, 1}};
+        = WorkDiv{Vec{8, elementsPerGridTestValue / threadsPerBlock / 8}, Vec{1, threadsPerBlock}, Vec{1, 1}};
     CHECK(alpaka::isValidWorkDiv<Acc>(validWorkDiv, dev, kernel, 200ul));
 
     // Check that using too many threads per block is not valid.
@@ -199,7 +199,7 @@ TEMPLATE_LIST_TEST_CASE("getValidWorkDiv.2D", "[workDivKernel]", TestAccs2D)
     if constexpr(alpaka::isSingleThreadAcc<Acc>)
     {
         // Check that the compute work division uses a single thread per block.
-        auto const expectedWorkDiv = WorkDiv{Vec{8, threadsPerGridTestValue / 8}, Vec{1, 1}, Vec{1, 1}};
+        auto const expectedWorkDiv = WorkDiv{Vec{8, elementsPerGridTestValue / 8}, Vec{1, 1}, Vec{1, 1}};
         CHECK(workDiv == expectedWorkDiv);
 
         // Check that a work division with more than one thread per block is not valid.