updata GNMT-v2

01bc05b7 · Pan,Huiwen · 20291e9d · 01bc05b7 · 01bc05b7 · 01bc05b7
Commit 01bc05b7 authored Apr 20, 2022 by Pan,Huiwen
20 changed files
--- a/PyTorch/NLP/gnmt/scripts/verify_dataset.sh
+++ b/PyTorch/NLP/gnmt/scripts/verify_dataset.sh
@@ -22,7 +22,7 @@
 set -e
-DATASET_DIR='../wmt16_de_en/'
+DATASET_DIR='data/wmt16_de_en'
 ACTUAL_SRC_TRAIN=`cat ${DATASET_DIR}/train.tok.clean.bpe.32000.en |md5sum`
 EXPECTED_SRC_TRAIN='b7482095b787264a310d4933d197a134  -'

--- a/PyTorch/NLP/gnmt/scripts/wmt16_en_de.sh
+++ b/PyTorch/NLP/gnmt/scripts/wmt16_en_de.sh
@@ -64,9 +64,7 @@ wget -nc -nv -O  ${OUTPUT_DIR_DATA}/dev.tgz \
 wget -nc -nv -O  ${OUTPUT_DIR_DATA}/test.tgz \
  http://data.statmt.org/wmt16/translation-task/test.tgz
-OUTPUT_DIR=${1:-"/public/home/aiss/code/mlperf/wmt16_de_en"}
+# Extract everything
-OUTPUT_DIR_DATA="${OUTPUT_DIR}/data"
-## Extract everything
 echo "Extracting all files..."
 mkdir -p "${OUTPUT_DIR_DATA}/europarl-v7-de-en"
 tar -xvzf "${OUTPUT_DIR_DATA}/europarl-v7-de-en.tgz" -C "${OUTPUT_DIR_DATA}/europarl-v7-de-en"
@@ -160,10 +158,10 @@ cat "${OUTPUT_DIR}/newstest2015.tok.clean.de" \
   > "${OUTPUT_DIR}/newstest_dev.tok.clean.de"
 # Filter datasets
-python3 `pwd`/scripts/filter_dataset.py \
+python3 scripts/filter_dataset.py \
   -f1 ${OUTPUT_DIR}/train.tok.clean.en \
   -f2 ${OUTPUT_DIR}/train.tok.clean.de
-python3 `pwd`/scripts/filter_dataset.py \
+python3 scripts/filter_dataset.py \
   -f1 ${OUTPUT_DIR}/newstest_dev.tok.clean.en \
   -f2 ${OUTPUT_DIR}/newstest_dev.tok.clean.de
@@ -173,23 +171,20 @@ python3 `pwd`/scripts/filter_dataset.py \
 for merge_ops in 32000; do
  echo "Learning BPE with merge_ops=${merge_ops}. This may take a while..."
  cat "${OUTPUT_DIR}/train.tok.clean.de" "${OUTPUT_DIR}/train.tok.clean.en" | \
-    #subword-nmt learn-bpe -s $merge_ops > "${OUTPUT_DIR}/bpe.${merge_ops}"
+    subword-nmt learn-bpe -s $merge_ops > "${OUTPUT_DIR}/bpe.${merge_ops}"
-    ${OUTPUT_DIR}/subword-nmt/learn_bpe.py -s $merge_ops > "${OUTPUT_DIR}/bpe.${merge_ops}"
  echo "Apply BPE with merge_ops=${merge_ops} to tokenized files..."
  for lang in en de; do
    for f in ${OUTPUT_DIR}/*.tok.${lang} ${OUTPUT_DIR}/*.tok.clean.${lang}; do
      outfile="${f%.*}.bpe.${merge_ops}.${lang}"
-      #subword-nmt apply-bpe -c "${OUTPUT_DIR}/bpe.${merge_ops}" < $f > "${outfile}"
+      subword-nmt apply-bpe -c "${OUTPUT_DIR}/bpe.${merge_ops}" < $f > "${outfile}"
-      ${OUTPUT_DIR}/subword-nmt/apply_bpe.py -c "${OUTPUT_DIR}/bpe.${merge_ops}" < $f > "${outfile}"
      echo ${outfile}
    done
  done
  # Create vocabulary file for BPE
  cat "${OUTPUT_DIR}/train.tok.clean.bpe.${merge_ops}.en" "${OUTPUT_DIR}/train.tok.clean.bpe.${merge_ops}.de" | \
-    #subword-nmt get-vocab | cut -f1 -d ' ' > "${OUTPUT_DIR}/vocab.bpe.${merge_ops}"
+    subword-nmt get-vocab | cut -f1 -d ' ' > "${OUTPUT_DIR}/vocab.bpe.${merge_ops}"
-    ${OUTPUT_DIR}/subword-nmt/get_vocab.py | cut -f1 -d ' ' > "${OUTPUT_DIR}/vocab.bpe.${merge_ops}"
 done

--- a/PyTorch/NLP/gnmt/seq2seq/__pycache__/gpu_affinity.cpython-36.pyc
+++ b/PyTorch/NLP/gnmt/seq2seq/__pycache__/gpu_affinity.cpython-36.pyc
--- a/PyTorch/NLP/gnmt/seq2seq/__pycache__/utils.cpython-36.pyc
+++ b/PyTorch/NLP/gnmt/seq2seq/__pycache__/utils.cpython-36.pyc
--- a/PyTorch/NLP/gnmt/seq2seq/attn_score_cuda_kernel.cu
+++ b/PyTorch/NLP/gnmt/seq2seq/attn_score_cuda_kernel.cu
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_cuda.cpp
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_cuda.cpp
-#include <torch/torch.h>
-#include <vector>
-// CUDA forward declarations
-at::Tensor attn_score_forward_cuda(
-    const at::Tensor &attn_query,
-    const at::Tensor &attn_keys,
-    const at::Tensor &bias,
-    const at::Tensor &linear_attn);
-std::vector<at::Tensor> attn_score_backward_cuda(
-    const at::Tensor &grad_output,
-    const at::Tensor &attn_query,
-    const at::Tensor &attn_keys,
-    const at::Tensor &bias,
-    const at::Tensor &linear_attn);
-// C++ interface
-#define CHECK_CUDA(x) AT_ASSERTM(x.is_cuda(), #x " must be a CUDA tensor")
-#define CHECK_CONTIGUOUS(x) AT_ASSERTM(x.is_contiguous(), #x " must be contiguous")
-#define CHECK_INPUT(x) CHECK_CUDA(x); CHECK_CONTIGUOUS(x)
-at::Tensor attn_score_forward(
-    const at::Tensor &attn_query,
-    const at::Tensor &attn_keys,
-    const at::Tensor &bias,
-    const at::Tensor &linear_attn) {
-    CHECK_INPUT(attn_query);
-    CHECK_INPUT(attn_keys);
-    CHECK_INPUT(bias);
-    CHECK_INPUT(linear_attn);
-    return attn_score_forward_cuda(attn_query, attn_keys, bias, linear_attn);
-}
-std::vector<at::Tensor> attn_score_backward(
-    const at::Tensor &grad_output,
-    const at::Tensor &attn_query,
-    const at::Tensor &attn_keys,
-    const at::Tensor &bias,
-    const at::Tensor &linear_attn) {
-    CHECK_INPUT(grad_output);
-    CHECK_INPUT(attn_query);
-    CHECK_INPUT(attn_keys);
-    CHECK_INPUT(bias);
-    CHECK_INPUT(linear_attn);
-    return attn_score_backward_cuda(grad_output, attn_query, attn_keys, bias, linear_attn);
-}
-PYBIND11_MODULE(TORCH_EXTENSION_NAME, m) {
-    m.def("forward", &attn_score_forward, "Attention score calculation forward (CUDA)");
-    m.def("backward", &attn_score_backward, "Attention score calculation backward (CUDA)");
-}
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_cuda.cpp.prehip
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_cuda.cpp.prehip
-#include <torch/torch.h>
-#include <vector>
-// CUDA forward declarations
-at::Tensor attn_score_forward_cuda(
-    const at::Tensor &attn_query,
-    const at::Tensor &attn_keys,
-    const at::Tensor &bias,
-    const at::Tensor &linear_attn);
-std::vector<at::Tensor> attn_score_backward_cuda(
-    const at::Tensor &grad_output,
-    const at::Tensor &attn_query,
-    const at::Tensor &attn_keys,
-    const at::Tensor &bias,
-    const at::Tensor &linear_attn);
-// C++ interface
-#define CHECK_CUDA(x) AT_ASSERTM(x.is_cuda(), #x " must be a CUDA tensor")
-#define CHECK_CONTIGUOUS(x) AT_ASSERTM(x.is_contiguous(), #x " must be contiguous")
-#define CHECK_INPUT(x) CHECK_CUDA(x); CHECK_CONTIGUOUS(x)
-at::Tensor attn_score_forward(
-    const at::Tensor &attn_query,
-    const at::Tensor &attn_keys,
-    const at::Tensor &bias,
-    const at::Tensor &linear_attn) {
-    CHECK_INPUT(attn_query);
-    CHECK_INPUT(attn_keys);
-    CHECK_INPUT(bias);
-    CHECK_INPUT(linear_attn);
-    return attn_score_forward_cuda(attn_query, attn_keys, bias, linear_attn);
-}
-std::vector<at::Tensor> attn_score_backward(
-    const at::Tensor &grad_output,
-    const at::Tensor &attn_query,
-    const at::Tensor &attn_keys,
-    const at::Tensor &bias,
-    const at::Tensor &linear_attn) {
-    CHECK_INPUT(grad_output);
-    CHECK_INPUT(attn_query);
-    CHECK_INPUT(attn_keys);
-    CHECK_INPUT(bias);
-    CHECK_INPUT(linear_attn);
-    return attn_score_backward_cuda(grad_output, attn_query, attn_keys, bias, linear_attn);
-}
-PYBIND11_MODULE(TORCH_EXTENSION_NAME, m) {
-    m.def("forward", &attn_score_forward, "Attention score calculation forward (CUDA)");
-    m.def("backward", &attn_score_backward, "Attention score calculation backward (CUDA)");
-}
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_cuda_kernel.cu.bak
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_cuda_kernel.cu.bak
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_cuda_kernel.cu.prehip
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_cuda_kernel.cu.prehip
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_hip_kernel.hip
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_hip_kernel.hip
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_hip_kernel.hip.rocm33
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/attn_score_hip_kernel.hip.rocm33
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils.cpp
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils.cpp
-#include <pybind11/numpy.h>
-#include <pybind11/pybind11.h>
-#include <torch/torch.h>
-namespace at {
-namespace native {
-at::Tensor revert_varlen_tensor(const Tensor &input, const Tensor &offsets);
-at::Tensor get_offsets(const Tensor &input, const Tensor &lengths);
-void checkLongTensor(const Tensor &tensor);
-at::Tensor set_mask_cpp(const Tensor &_lengths) {
-  at::native::checkLongTensor(_lengths);
-  int64_t batch_size = _lengths.size(0);
-  int64_t *lengths = _lengths.data_ptr<int64_t>();
-  int64_t seq_length = (lengths == NULL) ? 0 : lengths[0];
-  auto output = torch::empty({seq_length, batch_size}, torch::CPU(at::kByte));
-  auto output_data = output.data_ptr<uint8_t>();
-  for (int64_t t = 0; t < seq_length; t++) {
-    for (int64_t i = 0; i < batch_size; i++) {
-      if (lengths[i] > t) {
-        output_data[t * batch_size + i] = 1;
-      } else {
-        output_data[t * batch_size + i] = 0;
-      }
-    }
-  }
-  return output;
-}
-} // namespace native
-} // namespace at
-PYBIND11_MODULE(TORCH_EXTENSION_NAME, m) {
-  m.def("revert_varlen_tensor", &at::native::revert_varlen_tensor);
-  m.def("set_mask_cpp", &at::native::set_mask_cpp);
-  m.def("get_offsets", &at::native::get_offsets);
-}
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils.cpp.prehip
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils.cpp.prehip
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils_kernel.cu.bak
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils_kernel.cu.bak
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils_kernel.cu.prehip
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils_kernel.cu.prehip
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils_kernel.hip
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils_kernel.hip
--- a/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils_kernel.hip.rocm33
+++ b/PyTorch/NLP/gnmt/seq2seq/csrc/pack_utils_kernel.hip.rocm33
--- a/PyTorch/NLP/gnmt/seq2seq/data/__pycache__/config.cpython-36.pyc
+++ b/PyTorch/NLP/gnmt/seq2seq/data/__pycache__/config.cpython-36.pyc
--- a/PyTorch/NLP/gnmt/seq2seq/data/__pycache__/dataset.cpython-36.pyc
+++ b/PyTorch/NLP/gnmt/seq2seq/data/__pycache__/dataset.cpython-36.pyc
--- a/PyTorch/NLP/gnmt/seq2seq/data/__pycache__/sampler.cpython-36.pyc
+++ b/PyTorch/NLP/gnmt/seq2seq/data/__pycache__/sampler.cpython-36.pyc