Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
OpenDAS
deepspeed
Commits
b29229bf
"git@developer.sourcefind.cn:renzhc/diffusers_dcu.git" did not exist on "8e552bb4fe33363762864c62a60d456b1cf1e973"
Commit
b29229bf
authored
Sep 10, 2020
by
Jeff Rasley
Committed by
Ubuntu
Sep 10, 2020
Browse files
update docker image and bump DSE
parent
6bb5c69f
Changes
3
Hide whitespace changes
Inline
Side-by-side
Showing
3 changed files
with
94 additions
and
46 deletions
+94
-46
DeepSpeedExamples
DeepSpeedExamples
+1
-1
azure-pipelines-docker.yml
azure-pipelines-docker.yml
+1
-1
docker/Dockerfile
docker/Dockerfile
+92
-44
No files found.
DeepSpeedExamples
@
a0a80fcc
Compare
9e2c34e3
...
a0a80fcc
Subproject commit
9e2c34e31cec99f7d5785c6a1a3b0854c322f883
Subproject commit
a0a80fcc010be54dca1710d71436859eabc52c0c
azure-pipelines-docker.yml
View file @
b29229bf
...
@@ -29,7 +29,7 @@ stages:
...
@@ -29,7 +29,7 @@ stages:
displayName
:
Build and Push
displayName
:
Build and Push
inputs
:
inputs
:
command
:
buildAndPush
command
:
buildAndPush
dockerfile
:
'
$(Build.SourcesDirectory)/Dockerfile'
dockerfile
:
'
$(Build.SourcesDirectory)/
docker/
Dockerfile'
repository
:
deepspeed/deepspeed
repository
:
deepspeed/deepspeed
tags
:
|
tags
:
|
$(tag)
$(tag)
...
...
Dockerfile
→
docker/
Dockerfile
View file @
b29229bf
...
@@ -11,11 +11,13 @@ RUN mkdir -p ${STAGE_DIR}
...
@@ -11,11 +11,13 @@ RUN mkdir -p ${STAGE_DIR}
##############################################################################
##############################################################################
RUN
apt-get update
&&
\
RUN
apt-get update
&&
\
apt-get
install
-y
--no-install-recommends
\
apt-get
install
-y
--no-install-recommends
\
software-properties-common
\
software-properties-common build-essential autotools-dev
\
openssh-client openssh-server
\
nfs-common pdsh
\
pdsh curl
sudo
net-tools
\
cmake g++ gcc
\
vim iputils-ping wget
curl wget vim tmux emacs less unzip
\
#llvm-9-dev cmake
htop iftop iotop ca-certificates openssh-client openssh-server
\
rsync iputils-ping net-tools
sudo
\
llvm-9-dev
##############################################################################
##############################################################################
# Installation Latest Git
# Installation Latest Git
...
@@ -25,6 +27,43 @@ RUN add-apt-repository ppa:git-core/ppa -y && \
...
@@ -25,6 +27,43 @@ RUN add-apt-repository ppa:git-core/ppa -y && \
apt-get
install
-y
git
&&
\
apt-get
install
-y
git
&&
\
git
--version
git
--version
##############################################################################
# Client Liveness & Uncomment Port 22 for SSH Daemon
##############################################################################
# Keep SSH client alive from server side
RUN
echo
"ClientAliveInterval 30"
>>
/etc/ssh/sshd_config
RUN
cp
/etc/ssh/sshd_config
${
STAGE_DIR
}
/sshd_config
&&
\
sed
"0,/^#Port 22/s//Port 22/"
${
STAGE_DIR
}
/sshd_config
>
/etc/ssh/sshd_config
##############################################################################
# Mellanox OFED
##############################################################################
ENV
MLNX_OFED_VERSION=4.6-1.0.1.1
RUN
apt-get
install
-y
libnuma-dev
RUN
cd
${
STAGE_DIR
}
&&
\
wget
-q
-O
- http://www.mellanox.com/downloads/ofed/MLNX_OFED-
${
MLNX_OFED_VERSION
}
/MLNX_OFED_LINUX-
${
MLNX_OFED_VERSION
}
-ubuntu18
.04-x86_64.tgz |
tar
xzf -
&&
\
cd
MLNX_OFED_LINUX-
${
MLNX_OFED_VERSION
}
-ubuntu18
.04-x86_64
&&
\
./mlnxofedinstall
--user-space-only
--without-fw-update
--all
-q
&&
\
cd
${
STAGE_DIR
}
&&
\
rm
-rf
${
STAGE_DIR
}
/MLNX_OFED_LINUX-
${
MLNX_OFED_VERSION
}
-ubuntu18
.04-x86_64
*
##############################################################################
# nv_peer_mem
##############################################################################
ENV
NV_PEER_MEM_VERSION=1.1
ENV
NV_PEER_MEM_TAG=1.1-0
RUN
mkdir
-p
${
STAGE_DIR
}
&&
\
git clone https://github.com/Mellanox/nv_peer_memory.git
--branch
${
NV_PEER_MEM_TAG
}
${
STAGE_DIR
}
/nv_peer_memory
&&
\
cd
${
STAGE_DIR
}
/nv_peer_memory
&&
\
./build_module.sh
&&
\
cd
${
STAGE_DIR
}
&&
\
tar
xzf
${
STAGE_DIR
}
/nvidia-peer-memory_
${
NV_PEER_MEM_VERSION
}
.orig.tar.gz
&&
\
cd
${
STAGE_DIR
}
/nvidia-peer-memory-
${
NV_PEER_MEM_VERSION
}
&&
\
apt-get update
&&
\
apt-get
install
-y
dkms
&&
\
dpkg-buildpackage
-us
-uc
&&
\
dpkg
-i
${
STAGE_DIR
}
/nvidia-peer-memory_
${
NV_PEER_MEM_TAG
}
_all.deb
##############################################################################
##############################################################################
# OPENMPI
# OPENMPI
##############################################################################
##############################################################################
...
@@ -63,6 +102,7 @@ RUN apt-get install -y python3 python3-dev && \
...
@@ -63,6 +102,7 @@ RUN apt-get install -y python3 python3-dev && \
# Print python an pip version
# Print python an pip version
python -V && pip -V
python -V && pip -V
RUN
pip
install
pyyaml
RUN
pip
install
pyyaml
RUN
pip
install
ipython
##############################################################################
##############################################################################
# TensorFlow
# TensorFlow
...
@@ -70,6 +110,49 @@ RUN pip install pyyaml
...
@@ -70,6 +110,49 @@ RUN pip install pyyaml
ENV
TENSORFLOW_VERSION=1.15.2
ENV
TENSORFLOW_VERSION=1.15.2
RUN
pip
install
tensorflow-gpu
==
${
TENSORFLOW_VERSION
}
RUN
pip
install
tensorflow-gpu
==
${
TENSORFLOW_VERSION
}
##############################################################################
# Some Packages
##############################################################################
RUN
apt-get update
&&
\
apt-get
install
-y
--no-install-recommends
\
libsndfile-dev
\
libcupti-dev
\
libjpeg-dev
\
libpng-dev
\
screen
RUN
pip
install
psutil
\
yappi
\
cffi
\
ipdb
\
pandas
\
matplotlib
\
py3nvml
\
pyarrow
\
graphviz
\
astor
\
boto3
\
tqdm
\
sentencepiece
\
msgpack
\
requests
\
pandas
\
sphinx
\
sphinx_rtd_theme
\
scipy
\
numpy
\
sklearn
\
scikit-learn
\
nvidia-ml-py3
\
mpi4py
\
cupy-cuda100
##############################################################################
## SSH daemon port inside container cannot conflict with host OS port
###############################################################################
ENV
SSH_PORT=2222
RUN
cat
/etc/ssh/sshd_config
>
${
STAGE_DIR
}
/sshd_config
&&
\
sed
"0,/^#Port 22/s//Port
${
SSH_PORT
}
/"
${
STAGE_DIR
}
/sshd_config
>
/etc/ssh/sshd_config
##############################################################################
##############################################################################
# PyTorch
# PyTorch
##############################################################################
##############################################################################
...
@@ -81,46 +164,11 @@ RUN pip install torchvision==${TORCHVISION_VERSION}
...
@@ -81,46 +164,11 @@ RUN pip install torchvision==${TORCHVISION_VERSION}
RUN
pip
install
tensorboardX
==
${
TENSORBOARDX_VERSION
}
RUN
pip
install
tensorboardX
==
${
TENSORBOARDX_VERSION
}
##############################################################################
##############################################################################
# Temporary Installation Directory
# PyYAML build issue
##############################################################################
# https://stackoverflow.com/a/53926898
ENV
STAGE_DIR=/tmp
RUN
mkdir
-p
${
STAGE_DIR
}
##############################################################################
# Mellanox OFED
##############################################################################
ENV
MLNX_OFED_VERSION=4.6-1.0.1.1
RUN
apt-get
install
-y
libnuma-dev
RUN
cd
${
STAGE_DIR
}
&&
\
wget
-q
-O
- http://www.mellanox.com/downloads/ofed/MLNX_OFED-
${
MLNX_OFED_VERSION
}
/MLNX_OFED_LINUX-
${
MLNX_OFED_VERSION
}
-ubuntu18
.04-x86_64.tgz |
tar
xzf -
&&
\
cd
MLNX_OFED_LINUX-
${
MLNX_OFED_VERSION
}
-ubuntu18
.04-x86_64
&&
\
./mlnxofedinstall
--user-space-only
--without-fw-update
--all
-q
&&
\
cd
${
STAGE_DIR
}
&&
\
rm
-rf
${
STAGE_DIR
}
/MLNX_OFED_LINUX-
${
MLNX_OFED_VERSION
}
-ubuntu18
.04-x86_64
*
##############################################################################
# nv_peer_mem
##############################################################################
##############################################################################
ENV
NV_PEER_MEM_VERSION=1.1
RUN
rm
-rf
/usr/lib/python3/dist-packages/yaml
&&
\
ENV
NV_PEER_MEM_TAG=1.1-0
rm
-rf
/usr/lib/python3/dist-packages/PyYAML-
*
RUN
mkdir
-p
${
STAGE_DIR
}
&&
\
git clone https://github.com/Mellanox/nv_peer_memory.git
--branch
${
NV_PEER_MEM_TAG
}
${
STAGE_DIR
}
/nv_peer_memory
&&
\
cd
${
STAGE_DIR
}
/nv_peer_memory
&&
\
./build_module.sh
&&
\
cd
${
STAGE_DIR
}
&&
\
tar
xzf
${
STAGE_DIR
}
/nvidia-peer-memory_
${
NV_PEER_MEM_VERSION
}
.orig.tar.gz
&&
\
cd
${
STAGE_DIR
}
/nvidia-peer-memory-
${
NV_PEER_MEM_VERSION
}
&&
\
apt-get update
&&
\
apt-get
install
-y
dkms
&&
\
dpkg-buildpackage
-us
-uc
&&
\
dpkg
-i
${
STAGE_DIR
}
/nvidia-peer-memory_
${
NV_PEER_MEM_TAG
}
_all.deb
##############################################################################
## SSH daemon port inside container cannot conflict with host OS port
###############################################################################
ENV
SSH_PORT=2222
RUN
cat
/etc/ssh/sshd_config
>
${
STAGE_DIR
}
/sshd_config
&&
\
sed
"0,/^#Port 22/s//Port
${
SSH_PORT
}
/"
${
STAGE_DIR
}
/sshd_config
>
/etc/ssh/sshd_config
##############################################################################
##############################################################################
## Add deepspeed user
## Add deepspeed user
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment