ci: OPS-2444: Enable dev builds for pre-merge and post-merge (#7174)

Signed-off-by: Dillon Cullinan <dcullinan@nvidia.com>

ci: OPS-2444: Enable dev builds for pre-merge and post-merge (#7174)
Signed-off-by: Dillon Cullinan <dcullinan@nvidia.com>
38bf037b · Dillon Cullinan · GitHub · da354663 · 38bf037b · 38bf037b
Unverified Commit 38bf037b authored Mar 12, 2026 by Dillon Cullinan Committed by GitHub Mar 12, 2026
4 changed files
--- a/.github/workflows/build-test-distribute-flavor-matrix.yml
+++ b/.github/workflows/build-test-distribute-flavor-matrix.yml
@@ -150,7 +150,9 @@ jobs:
      matrix:
        platform: ${{ fromJson(inputs.platforms) }}
        cuda_version: ${{ fromJson(inputs.cuda_versions) }}
-    name: ${{ inputs.framework }}-cuda${{ matrix.cuda_version }}-${{ matrix.platform }}
+    # This name weirdly shows in the checks overview, but not once you dive into
+    # a specific workflow. Keeping it as a short placeholder
+    name: matrix
    uses: ./.github/workflows/build-test-distribute-flavor.yml
    with:
      framework: ${{ inputs.framework }}

--- a/.github/workflows/build-test-distribute-flavor.yml
+++ b/.github/workflows/build-test-distribute-flavor.yml
@@ -158,7 +158,7 @@ jobs:
  # ============================================================================
  build:
    if: inputs.build_image
-    name: Build ${{ inputs.framework }}-cuda${{ inputs.cuda_version }}-${{ inputs.platform }}
+    name: Build cuda${{ inputs.cuda_version }}-${{ inputs.platform }}
    runs-on: prod-builder-v3
    outputs:
      target_tag_plain: ${{ steps.calculate-target-tag.outputs.target_tag_plain }}
@@ -188,8 +188,8 @@ jobs:
          if [ "${{ inputs.make_efa }}" == "true" ]; then
            EFA_SUFFIX="-efa"
          fi
-          TARGET_TAG_PLAIN="${{ github.sha }}-${{ inputs.framework }}${EFA_SUFFIX}"
-          TEST_TAG_PLAIN="${{ github.sha }}-${{ inputs.framework }}${EFA_SUFFIX}-test"
+          TARGET_TAG_PLAIN="${{ github.sha }}-${{ inputs.framework }}-${{ inputs.target }}${EFA_SUFFIX}"
+          TEST_TAG_PLAIN="${{ github.sha }}-${{ inputs.framework }}-${{ inputs.target }}${EFA_SUFFIX}-test"
          DEFAULT_TARGET_IMAGE_URI="${{ secrets.AWS_ACCOUNT_ID }}.dkr.ecr.${{ secrets.AWS_DEFAULT_REGION }}.amazonaws.com/ai-dynamo/dynamo:${TARGET_TAG_PLAIN}-cuda${CUDA_VERSION}-${{ inputs.platform }}"
          TEST_IMAGE_URI="${{ secrets.AWS_ACCOUNT_ID }}.dkr.ecr.${{ secrets.AWS_DEFAULT_REGION }}.amazonaws.com/ai-dynamo/dynamo:${TEST_TAG_PLAIN}-cuda${CUDA_VERSION}-${{ inputs.platform }}"
          echo "default_target_image_uri=${DEFAULT_TARGET_IMAGE_URI}" >> $GITHUB_OUTPUT
@@ -263,7 +263,7 @@ jobs:
              ${MAKE_EFA_FLAG} \
              --show-result \
              --output-short-filename
-      - name: Build and Push Runtime Image
+      - name: Build and Push Image
        id: build-image
        timeout-minutes: ${{ inputs.build_timeout_minutes }}
        uses: ./.github/actions/docker-remote-build
@@ -285,6 +285,7 @@ jobs:
          extra_build_args: |
            DYNAMO_COMMIT_SHA=${{ github.sha }}
      - name: Build and Push Test Image
+        if: ${{ inputs.target != 'dev' }} # no need to build a separate test image for dev as its not tested
        shell: bash
        env:
          ECR_HOSTNAME: ${{ secrets.AWS_ACCOUNT_ID }}.dkr.ecr.${{ secrets.AWS_DEFAULT_REGION }}.amazonaws.com
@@ -347,7 +348,7 @@ jobs:
        ( inputs.run_cpu_only_tests || inputs.run_single_gpu_tests ) &&
        inputs.build_image
    needs: [build]
-    name: Test ${{ inputs.framework }}-cuda${{ inputs.cuda_version }}-${{ inputs.platform }}
+    name: Test cuda${{ inputs.cuda_version }}-${{ inputs.platform }}
    runs-on: ${{ inputs.platform == 'amd64' && 'prod-tester-amd-gpu-v1' || 'prod-tester-arm-v1' }}
    env:
      FRAMEWORK: ${{ inputs.framework }}
@@ -450,7 +451,7 @@ jobs:
        inputs.build_image &&
        ( inputs.platform != 'arm64' )
    needs: [build]
-    name: Multi-gpu Test ${{ inputs.framework }}-cuda${{ inputs.cuda_version }}-${{ inputs.platform }}
+    name: Multi-gpu test cuda${{ inputs.cuda_version }}-${{ inputs.platform }}
    runs-on: prod-tester-amd-gpu-4-v1
    env:
      FRAMEWORK: ${{ inputs.framework }}
@@ -515,7 +516,7 @@ jobs:
      inputs.copy_to_acr &&
      needs.build.result == 'success' &&
      (needs.test.result == 'success' || needs.test.result == 'skipped')
-    name: copy ${{ inputs.framework }}-cuda${{ inputs.cuda_version }}-${{ inputs.platform }}
+    name: copy-to-acr cuda${{ inputs.cuda_version }}-${{ inputs.platform }}
    runs-on: prod-default-small-v2
    outputs:
      target_tag_plain: ${{ needs.build.outputs.target_tag_plain }}

--- a/.github/workflows/post-merge-ci.yml
+++ b/.github/workflows/post-merge-ci.yml
@@ -20,6 +20,7 @@ jobs:
  # VLLM PIPELINE
  # ============================================================================
  vllm-pipeline:
+    name: vllm
    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
    with:
      framework: vllm
@@ -44,6 +45,7 @@ jobs:
  # SGLANG PIPELINE
  # ============================================================================
  sglang-pipeline:
+    name: sglang
    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
    with:
      framework: sglang
@@ -68,6 +70,7 @@ jobs:
  # TRTLLM PIPELINE
  # ============================================================================
  trtllm-pipeline:
+    name: trtllm
    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
    with:
      framework: trtllm
@@ -88,6 +91,54 @@ jobs:
      multi_gpu_test_timeout_minutes: 60
    secrets: inherit

+  # ============================================================================
+  # DEV PIPELINES
+  # ============================================================================
+  vllm-dev-pipeline:
+    name: vllm-dev
+    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
+    with:
+      framework: vllm
+      target: dev
+      platforms: '["amd64", "arm64"]'
+      cuda_versions: '["12.9", "13.0"]'
+      builder_name: ${{ needs.changed-files.outputs.builder_name }}
+      build_timeout_minutes: 60
+      run_cpu_only_tests: false
+      run_single_gpu_tests: false
+      run_multi_gpu_tests: false
+    secrets: inherit
+
+  sglang-dev-pipeline:
+    name: sglang-dev
+    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
+    with:
+      framework: sglang
+      target: dev
+      platforms: '["amd64", "arm64"]'
+      cuda_versions: '["12.9", "13.0"]'
+      builder_name: ${{ needs.changed-files.outputs.builder_name }}
+      build_timeout_minutes: 60
+      run_cpu_only_tests: false
+      run_single_gpu_tests: false
+      run_multi_gpu_tests: false
+    secrets: inherit
+
+  trtllm-dev-pipeline:
+    name: trtllm-dev
+    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
+    with:
+      framework: trtllm
+      target: dev
+      platforms: '["amd64", "arm64"]'
+      cuda_versions: '["13.1"]'
+      builder_name: ${{ needs.changed-files.outputs.builder_name }}
+      build_timeout_minutes: 60
+      run_cpu_only_tests: false
+      run_single_gpu_tests: false
+      run_multi_gpu_tests: false
+    secrets: inherit
+
  # ============================================================================
  # EFA PIPELINES (Build only, amd64)
  # ============================================================================
@@ -321,7 +372,7 @@ jobs:
          hf_token: ${{ secrets.HF_TOKEN }}
          framework: ${{ env.FRAMEWORK }}
          profile: ${{ matrix.profile }}
-          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-vllm-cuda12-amd64
+          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-vllm-runtime-cuda12-amd64
          platform_arch: amd64

  deploy-test-sglang:
@@ -354,7 +405,7 @@ jobs:
          hf_token: ${{ secrets.HF_TOKEN }}
          framework: ${{ env.FRAMEWORK }}
          profile: ${{ matrix.profile }}
-          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-sglang-cuda12-amd64
+          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-sglang-runtime-cuda12-amd64
          platform_arch: amd64

  deploy-test-trtllm:
@@ -391,7 +442,7 @@ jobs:
          hf_token: ${{ secrets.HF_TOKEN }}
          framework: ${{ env.FRAMEWORK }}
          profile: ${{ matrix.profile }}
-          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-trtllm-cuda13-amd64
+          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-trtllm-runtime-cuda13-amd64
          platform_arch: amd64

  deploy-status-check:

--- a/.github/workflows/pr.yaml
+++ b/.github/workflows/pr.yaml
@@ -180,6 +180,7 @@ jobs:
  # VLLM PIPELINE
  # ============================================================================
  vllm-pipeline:
+    name: vllm
    needs: [changed-files]
    if: needs.changed-files.outputs.core == 'true' || needs.changed-files.outputs.vllm == 'true' || needs.changed-files.outputs.deploy == 'true'
    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
@@ -203,6 +204,7 @@ jobs:
  # SGLANG PIPELINE
  # ============================================================================
  sglang-pipeline:
+    name: sglang
    needs: [changed-files]
    if: needs.changed-files.outputs.core == 'true' || needs.changed-files.outputs.sglang == 'true' || needs.changed-files.outputs.deploy == 'true'
    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
@@ -225,6 +227,7 @@ jobs:
  # TRTLLM PIPELINE
  # ============================================================================
  trtllm-pipeline:
+    name: trtllm
    needs: [changed-files]
    if: needs.changed-files.outputs.core == 'true' || needs.changed-files.outputs.trtllm == 'true' || needs.changed-files.outputs.deploy == 'true'
    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
@@ -243,6 +246,65 @@ jobs:
      run_multi_gpu_tests: false  # TODO: Dmitry is working on fixing markers for multi-GPU tests, can enable after that is resolved
    secrets: inherit

+  # ============================================================================
+  # DEV PIPELINES
+  # ============================================================================
+  vllm-dev-pipeline:
+    name: vllm-dev
+    needs: [changed-files]
+    if: needs.changed-files.outputs.core == 'true' || needs.changed-files.outputs.vllm == 'true'
+    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
+    with:
+      framework: vllm
+      target: dev
+      platforms: '["amd64", "arm64"]'
+      cuda_versions: '["12.9", "13.0"]'
+      builder_name: ${{ needs.changed-files.outputs.builder_name }}
+      build_timeout_minutes: 60
+      push_image: false # Only push dev images on main
+      copy_to_acr: false
+      run_cpu_only_tests: false
+      run_single_gpu_tests: false
+      run_multi_gpu_tests: false
+    secrets: inherit
+
+  sglang-dev-pipeline:
+    name: sglang-dev
+    needs: [changed-files]
+    if: needs.changed-files.outputs.core == 'true' || needs.changed-files.outputs.sglang == 'true'
+    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
+    with:
+      framework: sglang
+      target: dev
+      platforms: '["amd64", "arm64"]'
+      cuda_versions: '["12.9", "13.0"]'
+      builder_name: ${{ needs.changed-files.outputs.builder_name }}
+      build_timeout_minutes: 60
+      push_image: false # Only push dev images on main
+      copy_to_acr: false
+      run_cpu_only_tests: false
+      run_single_gpu_tests: false
+      run_multi_gpu_tests: false
+    secrets: inherit
+
+  trtllm-dev-pipeline:
+    name: trtllm-dev
+    needs: [changed-files]
+    if: needs.changed-files.outputs.core == 'true' || needs.changed-files.outputs.trtllm == 'true'
+    uses: ./.github/workflows/build-test-distribute-flavor-matrix.yml
+    with:
+      framework: trtllm
+      target: dev
+      platforms: '["amd64", "arm64"]'
+      cuda_versions: '["13.1"]'
+      builder_name: ${{ needs.changed-files.outputs.builder_name }}
+      build_timeout_minutes: 60
+      push_image: false # Only push dev images on main
+      copy_to_acr: false
+      run_cpu_only_tests: false
+      run_single_gpu_tests: false
+      run_multi_gpu_tests: false
+    secrets: inherit

   # ============================================================================
   # DEPLOYMENT JOBS
@@ -339,7 +401,7 @@ jobs:
          hf_token: ${{ secrets.HF_TOKEN }}
          framework: ${{ env.FRAMEWORK }}
          profile: ${{ matrix.profile }}
-          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-vllm-cuda12-amd64
+          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-vllm-runtime-cuda12-amd64
          platform_arch: amd64

  deploy-test-sglang:
@@ -376,7 +438,7 @@ jobs:
          hf_token: ${{ secrets.HF_TOKEN }}
          framework: ${{ env.FRAMEWORK }}
          profile: ${{ matrix.profile }}
-          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-sglang-cuda12-amd64
+          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-sglang-runtime-cuda12-amd64
          platform_arch: amd64

  deploy-test-trtllm:
@@ -417,7 +479,7 @@ jobs:
          hf_token: ${{ secrets.HF_TOKEN }}
          framework: ${{ env.FRAMEWORK }}
          profile: ${{ matrix.profile }}
-          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-trtllm-cuda13-amd64
+          image: ${{ secrets.AZURE_ACR_HOSTNAME }}/ai-dynamo/dynamo:${{ github.sha }}-trtllm-runtime-cuda13-amd64
          platform_arch: amd64

  # ============================================================================