amend

pytorch · vmoens · Jun 27, 2023 · Jun 18, 2023 · Jun 18, 2023 · Jun 23, 2023
commit 4ffcf72b59dd794d5a18a26761e1f61b8edc5d33
diff --git a/torchrl/data/rlhf/reward.py b/torchrl/data/rlhf/reward.py
@@ -11,10 +11,10 @@
 from tensordict import tensorclass
 
 from torchrl.data.rlhf.dataset import TensorDictTokenizer, TokenizedDatasetLoader
-from tqdm import tqdm
 
 DEFAULT_DATASET = "CarperAI/openai_summarize_comparisons"
 _has_datasets = importlib.util.find_spec("datasets") is not None
+_has_tqdm = importlib.util.find_spec("tqdm") is not None
 
 
 @tensorclass
@@ -197,7 +197,13 @@ def pre_tokenization_hook(dataset, min_length=5):
 
     chosen = []
     rejected = []
-    for sample in tqdm(dataset):
+    if _has_tqdm:
+        from tqdm import tqdm
+
+        pbar = tqdm(dataset)
+    else:
+        pbar = dataset
+    for sample in pbar:
         prompt = sample["prompt"]
         chosen_summary = sample["chosen"]
         rejected_summary = sample["rejected"]