Add option to allocate on the host

84242aae · Paul · 95ee5ad4 · 84242aae · 84242aae · 84242aae
Commit 84242aae authored Aug 16, 2018 by Paul
4 changed files
--- a/src/onnx/perf_onnx.cpp
+++ b/src/onnx/perf_onnx.cpp
@@ -25,8 +25,10 @@ int main(int argc, char const* argv[])
    {
        std::string file = argv[1];
        auto p           = migraph::parse_onnx(file);
+        std::cout << "Compiling ... " << std::endl;
        p.compile(migraph::gpu::target{});
        auto m = create_param_map(p);
+        std::cout << "Running performance report ... " << std::endl;
        p.perf_report(std::cout, 10, m);
    }
 }
--- a/src/targets/gpu/hip.cpp
+++ b/src/targets/gpu/hip.cpp
@@ -13,12 +13,27 @@ using hip_ptr = MIGRAPH_MANAGE_PTR(void, hipFree);

 std::string hip_error(int error) { return hipGetErrorString(static_cast<hipError_t>(error)); }

-hip_ptr allocate_gpu(std::size_t sz)
+std::size_t get_available_gpu_memory()
 {
-    void* result;
-    auto status = hipMalloc(&result, sz);
+    size_t free, total;
+    auto status = hipMemGetInfo(&free, &total);
    if(status != hipSuccess)
-        MIGRAPH_THROW("Gpu allocation failed: " + hip_error(status));
+        MIGRAPH_THROW("Failed getting available memory: " + hip_error(status));
+    return free;
+}
+
+hip_ptr allocate_gpu(std::size_t sz, bool host=false)
+{
+    if(sz > get_available_gpu_memory())
+        MIGRAPH_THROW("Memory not available to allocate buffer: " + std::to_string(sz));
+    void* result;
+    auto status = host ? hipHostMalloc(&result, sz) : hipMalloc(&result, sz);
+    if(status != hipSuccess) {
+        if (host)
+            MIGRAPH_THROW("Gpu allocation failed: " + hip_error(status));
+        else
+            allocate_gpu(sz, true);
+    }
    return hip_ptr{result};
 }

@@ -40,24 +55,24 @@ std::vector<T> read_from_gpu(const void* x, std::size_t sz)
    return result;
 }

-hip_ptr write_to_gpu(const void* x, std::size_t sz)
+hip_ptr write_to_gpu(const void* x, std::size_t sz, bool host=false)
 {
-    auto result = allocate_gpu(sz);
+    auto result = allocate_gpu(sz, host);
    auto status = hipMemcpy(result.get(), x, sz, hipMemcpyHostToDevice);
    if(status != hipSuccess)
        MIGRAPH_THROW("Copy to gpu failed: " + hip_error(status));
    return result;
 }

-argument allocate_gpu(shape s)
+argument allocate_gpu(shape s, bool host)
 {
-    auto p = share(allocate_gpu(s.bytes() + 1));
+    auto p = share(allocate_gpu(s.bytes() + 1, host));
    return {s, [p]() mutable { return reinterpret_cast<char*>(p.get()); }};
 }

-argument to_gpu(argument arg)
+argument to_gpu(argument arg, bool host)
 {
-    auto p = share(write_to_gpu(arg.data(), arg.get_shape().bytes()));
+    auto p = share(write_to_gpu(arg.data(), arg.get_shape().bytes(), host));
    return {arg.get_shape(), [p]() mutable { return reinterpret_cast<char*>(p.get()); }};
 }


--- a/src/targets/gpu/include/migraph/gpu/hip.hpp
+++ b/src/targets/gpu/include/migraph/gpu/hip.hpp
@@ -6,9 +6,9 @@
 namespace migraph {
 namespace gpu {

-migraph::argument allocate_gpu(migraph::shape s);
+migraph::argument allocate_gpu(migraph::shape s, bool host=false);

-migraph::argument to_gpu(migraph::argument arg);
+migraph::argument to_gpu(migraph::argument arg, bool host=false);

 migraph::argument from_gpu(migraph::argument arg);


--- a/test/gpu/miopen.cpp
+++ b/test/gpu/miopen.cpp
@@ -272,6 +272,29 @@ struct test_transpose
    }
 };

+struct test_batchnorm_inference_2
+{
+    const size_t width    = 14;
+    const size_t height   = 14;
+    const size_t channels = 256;
+    const size_t batches  = 1;
+
+    migraph::program create_program() const
+    {
+        migraph::program p;
+
+        migraph::shape s{migraph::shape::float_type, {batches, channels, height, width}};
+        migraph::shape vars{migraph::shape::float_type, {channels}};
+        auto x        = p.add_parameter("x", s);
+        auto mean     = p.add_parameter("mean", vars);
+        auto variance = p.add_parameter("variance", vars);
+        auto scale    = p.add_parameter("scale", vars);
+        auto bias     = p.add_parameter("bias", vars);
+        p.add_instruction(migraph::batch_norm_inference{}, x, mean, variance, scale, bias);
+        return p;
+    }
+};
+
 struct test_batchnorm_inference
 {
    const size_t width    = 3;
@@ -309,4 +332,5 @@ int main()
    verify_program<test_contiguous>();
    verify_program<test_transpose>();
    verify_program<test_batchnorm_inference>();
+    verify_program<test_batchnorm_inference_2>();
 }