{'loss': 2.4423, 'learning_rate': 1e-05, 'epoch': 1.0} {'loss': 2.4423, 'learning_rate': 8.535533905932739e-06, 'epoch': 2.0} {'loss': 1.7389, 'learning_rate': 5e-06, 'epoch': 2.67} {'loss': 0.6183, 'learning_rate': 1.4644660940672628e-06, 'epoch': 3.0} {'loss': 2.333, 'learning_rate': 0.0, 'epoch': 4.0} {'train_runtime': 35.6042, 'train_samples_per_second': 0.421, 'train_steps_per_second': 0.14, 'train_loss': 1.9149360179901123, 'epoch': 4.0}