Merge branch 'dist_part' of github.com:dmlc/dgl into dist_part

b7187dd3 · Da Zheng · a324440f · 3ccd973c · b7187dd3 · b7187dd3
Commit b7187dd3 authored Jul 04, 2022 by Da Zheng
Hide whitespace changes
Inline Side-by-side

Showing with 6 additions and 4 deletions

tools/distpartitioning/convert_partition.py tools/distpartitioning/convert_partition.py +5 -3

tools/distpartitioning/globalids.py tools/distpartitioning/globalids.py +1 -1

No files found.
--- a/tools/distpartitioning/convert_partition.py
+++ b/tools/distpartitioning/convert_partition.py
@@ -9,6 +9,7 @@ import pyarrow
 import pandas as pd
 import constants
 from pyarrow import csv
+from utils import read_json
 def create_dgl_object(graph_name, num_parts, \
                        schema, part_id, node_data, \
@@ -129,7 +130,8 @@ def create_dgl_object(graph_name, num_parts, \
    assert len(uniq_ids) == len(idx)
    # We get the edge list with their node IDs mapped to a contiguous ID range.
    part_local_src_id, part_local_dst_id = np.split(inverse_idx[:len(shuffle_global_src_id) * 2], 2)
-    compact_g = dgl.graph((part_local_src_id, part_local_dst_id))
+    compact_g = dgl.graph(data=(part_local_src_id, part_local_dst_id), num_nodes=len(idx))
    compact_g.edata['orig_id'] = th.as_tensor(global_edge_id)
    compact_g.edata[dgl.ETYPE] = th.as_tensor(etype_ids)
    compact_g.edata['inner_edge'] = th.ones(
@@ -232,6 +234,6 @@ def create_metadata_json(graph_name, num_nodes, num_edges, num_parts, node_map_v
        edge_feat_file = os.path.join(part_dir, "edge_feat.dgl")
        part_graph_file = os.path.join(part_dir, "graph.dgl")
        part_metadata['part-{}'.format(part_id)] = {'node_feats': node_feat_file,
-                                                'edge_feats': edge_feat_file,
+                                                    'edge_feats': edge_feat_file,
-                                                'part_graph': part_graph_file}
+                                                    'part_graph': part_graph_file}
    return part_metadata
--- a/tools/distpartitioning/globalids.py
+++ b/tools/distpartitioning/globalids.py
@@ -50,7 +50,7 @@ def get_shuffle_global_nids(rank, world_size, global_nids_ranks, node_data):
    #form the outgoing message
    send_nodes = []
    for i in range(world_size):
-        send_nodes.append(torch.Tensor(global_nids_ranks[i]).type(dtype=torch.int64))
+        send_nodes.append(torch.from_numpy(global_nids_ranks[i]).type(dtype=torch.int64))
    #send-recieve messages
    alltoallv_cpu(rank, world_size, recv_nodes, send_nodes)