[JAX] HuggingFace login in JAX examples if token is available (#2290)

HF login in JAX examples Signed-off-by: Jeremy Berchtold <jberchtold@nvidia.com>

[JAX] HuggingFace login in JAX examples if token is available (#2290)
HF login in JAX examples Signed-off-by: Jeremy Berchtold <jberchtold@nvidia.com>
ce2f9fa4 · jberchtold-nvidia · GitHub · e90582f2 · ce2f9fa4 · ce2f9fa4
Unverified Commit ce2f9fa4 authored Oct 21, 2025 by jberchtold-nvidia Committed by GitHub Oct 21, 2025
6 changed files
--- a/examples/jax/encoder/common.py
+++ b/examples/jax/encoder/common.py
@@ -118,3 +118,14 @@ def get_quantization_recipe_from_name_string(name: str):
            return recipe.NVFP4BlockScaling()
        case _:
            raise ValueError(f"Invalid quantization_recipe, got {name}")
+def hf_login_if_available():
+    """Login to HF hub if available"""
+    try:
+        from huggingface_hub import login
+        login()
+    except Exception as e:
+        print(e)
+        pass
--- a/examples/jax/encoder/test_model_parallel_encoder.py
+++ b/examples/jax/encoder/test_model_parallel_encoder.py
@@ -23,12 +23,14 @@ from common import (
    is_bf16_supported,
    get_quantization_recipe_from_name_string,
    assert_params_sufficiently_sharded,
+    hf_login_if_available,
 )
 import transformer_engine.jax as te
 import transformer_engine.jax.cpp_extensions as tex
 import transformer_engine.jax.flax as te_flax
 from transformer_engine.jax.quantize import is_scaling_mode_supported, ScalingMode
+hf_login_if_available()
 DEVICE_DP_AXIS = "data"
 DEVICE_TP_AXIS = "model"

--- a/examples/jax/encoder/test_multigpu_encoder.py
+++ b/examples/jax/encoder/test_multigpu_encoder.py
@@ -19,12 +19,17 @@ from flax.training import train_state
 from jax.experimental import mesh_utils
 from jax.sharding import PartitionSpec, NamedSharding
-from common import is_bf16_supported, get_quantization_recipe_from_name_string
+from common import (
+    is_bf16_supported,
+    get_quantization_recipe_from_name_string,
+    hf_login_if_available,
+)
 import transformer_engine.jax as te
 import transformer_engine.jax.cpp_extensions as tex
 import transformer_engine.jax.flax as te_flax
 from transformer_engine.jax.quantize import is_scaling_mode_supported, ScalingMode
+hf_login_if_available()
 DEVICE_DP_AXIS = "data"
 PARAMS_KEY = "params"

--- a/examples/jax/encoder/test_multiprocessing_encoder.py
+++ b/examples/jax/encoder/test_multiprocessing_encoder.py
@@ -27,11 +27,13 @@ from common import (
    is_mxfp8_supported,
    is_nvfp4_supported,
    get_quantization_recipe_from_name_string,
+    hf_login_if_available,
 )
 import transformer_engine.jax as te
 import transformer_engine.jax.cpp_extensions as tex
 import transformer_engine.jax.flax as te_flax
+hf_login_if_available()
 os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
 DEVICE_DP_AXIS = "data"

--- a/examples/jax/encoder/test_single_gpu_encoder.py
+++ b/examples/jax/encoder/test_single_gpu_encoder.py
@@ -16,11 +16,16 @@ from datasets import load_dataset
 from flax import linen as nn
 from flax.training import train_state
-from common import is_bf16_supported, get_quantization_recipe_from_name_string
+from common import (
+    is_bf16_supported,
+    get_quantization_recipe_from_name_string,
+    hf_login_if_available,
+)
 import transformer_engine.jax as te
 import transformer_engine.jax.flax as te_flax
 from transformer_engine.jax.quantize import is_scaling_mode_supported, ScalingMode
+hf_login_if_available()
 PARAMS_KEY = "params"
 DROPOUT_KEY = "dropout"

--- a/examples/jax/mnist/test_single_gpu_mnist.py
+++ b/examples/jax/mnist/test_single_gpu_mnist.py
@@ -22,7 +22,13 @@ from transformer_engine.jax.quantize import is_scaling_mode_supported, ScalingMo
 DIR = str(Path(__file__).resolve().parents[1])
 sys.path.append(str(DIR))
-from encoder.common import is_bf16_supported, get_quantization_recipe_from_name_string
+from encoder.common import (
+    is_bf16_supported,
+    get_quantization_recipe_from_name_string,
+    hf_login_if_available,
+)
+hf_login_if_available()
 IMAGE_H = 28
 IMAGE_W = 28