reranker arguments

texttron · sigridjineth · Aug 24, 2024 · Aug 24, 2024 · Aug 24, 2024 · Aug 24, 2024
commit f29930c9cb0c2e41602d824f58116ba8b81a4fa1
diff --git a/examples/example_rankllama.md b/examples/example_rankllama.md
@@ -18,4 +18,5 @@ deepspeed --include localhost:4,5,6,7 --master_port 60000 --module tevatron.rera
   --num_train_epochs 1 \
   --logging_steps 10 \
   --overwrite_output_dir
+  --gra
 ```
diff --git a/src/tevatron/reranker/arguments.py b/src/tevatron/reranker/arguments.py
@@ -116,3 +116,11 @@ class DataArguments:
                     "enable the use of Tensor Cores on NVIDIA hardware with compute capability >= 7.5 (Volta)."
         },
     )
+
+@dataclass
+class TevatronTrainingArguments(TrainingArguments):
+    warmup_ratio: float = field(default=0.1)
+
+    grad_cache: bool = field(default=False, metadata={"help": "Use gradient cache update"})
+    gc_q_chunk_size: int = field(default=4)
+    gc_p_chunk_size: int = field(default=32)