flake8 compliant

castorini · ronakice · Feb 6, 2021 · Feb 6, 2021 · Feb 6, 2021 · Feb 6, 2021
commit 87ec9f6d991d208ec58b2a0951ceab364f32b74b
diff --git a/pygaggle/data/msmarco.py b/pygaggle/data/msmarco.py
@@ -16,8 +16,8 @@
 
 __all__ = ['MsMarcoExample', 'MsMarcoDataset']
 
-# MsMarcoExample represents a query along with its ranked and re-ranked
-# candidates.
+
+# MsMarcoExample represents a query along with its ranked and re-ranked candidates.
 class MsMarcoExample(BaseModel):
     qid: str
     text: str
@@ -41,7 +41,7 @@ def load_qrels(cls, path: str) -> DefaultDict[str, Set[str]]:
         return qrels
 
     # Load a run from the provided path.  The run file contains mappings from
-    # a query id and a doc title to a rank.  load_run returns a dictionary 
+    # a query id and a doc title to a rank.  load_run returns a dictionary
     # mapping query ids to lists of doc titles sorted by ascending rank.
     @classmethod
     def load_run(cls, path: str):

diff --git a/pygaggle/rerank/transformer.py b/pygaggle/rerank/transformer.py
@@ -42,7 +42,8 @@ def get_model(pretrained_model_name_or_path: str = 'castorini/monot5-base-msmarc
                   *args, device: str = None, **kwargs) -> T5ForConditionalGeneration:
         device = device or ('cuda' if torch.cuda.is_available() else 'cpu')
         device = torch.device(device)
-        return T5ForConditionalGeneration.from_pretrained(pretrained_model_name_or_path, *args, **kwargs).to(device).eval()
+        return T5ForConditionalGeneration.from_pretrained(pretrained_model_name_or_path,
+                                                          *args, **kwargs).to(device).eval()
 
     @staticmethod
     def get_tokenizer(pretrained_model_name_or_path: str = 't5-base',
@@ -86,7 +87,8 @@ def get_model(pretrained_model_name_or_path: str = 'castorini/duot5-base-msmarco
                   *args, device: str = None, **kwargs) -> T5ForConditionalGeneration:
         device = device or ('cuda' if torch.cuda.is_available() else 'cpu')
         device = torch.device(device)
-        return T5ForConditionalGeneration.from_pretrained(pretrained_model_name_or_path, *args, **kwargs).to(device).eval()
+        return T5ForConditionalGeneration.from_pretrained(pretrained_model_name_or_path,
+                                                          *args, **kwargs).to(device).eval()
 
     @staticmethod
     def get_tokenizer(pretrained_model_name_or_path: str = 't5-base',
@@ -182,7 +184,8 @@ def get_model(pretrained_model_name_or_path: str = 'castorini/monobert-large-msm
                   *args, device: str = None, **kwargs) -> AutoModelForSequenceClassification:
         device = device or ('cuda' if torch.cuda.is_available() else 'cpu')
         device = torch.device(device)
-        return AutoModelForSequenceClassification.from_pretrained(pretrained_model_name_or_path, *args, **kwargs).to(device).eval()
+        return AutoModelForSequenceClassification.from_pretrained(pretrained_model_name_or_path,
+                                                                  *args, **kwargs).to(device).eval()
 
     @staticmethod
     def get_tokenizer(pretrained_model_name_or_path: str = 'bert-large-uncased',

diff --git a/pygaggle/run/evaluate_document_ranker.py b/pygaggle/run/evaluate_document_ranker.py
@@ -4,9 +4,7 @@
 
 from pydantic import BaseModel, validator
 from transformers import (AutoModel,
-                          AutoTokenizer,
-                          AutoModelForSequenceClassification,
-                          T5ForConditionalGeneration)
+                          AutoTokenizer)
 import torch
 
 from .args import ArgumentParserBuilder, opt
@@ -20,7 +18,6 @@
 from pygaggle.rerank.random import RandomReranker
 from pygaggle.rerank.similarity import CosineSimilarityMatrixProvider
 from pygaggle.model import (SimpleBatchTokenizer,
-                            T5BatchTokenizer,
                             RerankerEvaluator,
                             metric_names,
                             MsMarcoWriter)
@@ -169,5 +166,6 @@ def main():
                                                  options.aggregate_method):
         logging.info(f'{metric.name:<{width}}{metric.value:.5}')
 
+
 if __name__ == '__main__':
     main()
diff --git a/pygaggle/run/evaluate_passage_reader.py b/pygaggle/run/evaluate_passage_reader.py
@@ -40,13 +40,15 @@ def construct_dpr(options: PassageReadingEvaluationOptions) -> Reader:
                                        options.max_answer_length,
                                        options.num_spans_per_passage)
 
+
 def display(ems):
     if len(ems) == 0:
         em = -1.
     else:
         em = np.mean(np.array(ems)) * 100.
     logging.info(f'Exact Match Accuracy: {em}')
 
+
 def main():
     apb = ArgumentParserBuilder()
     apb.add_opts(

diff --git a/pygaggle/settings.py b/pygaggle/settings.py
@@ -14,9 +14,11 @@ class Settings(BaseSettings):
 class MsMarcoSettings(Settings):
     pass
 
+
 class TRECCovidSettings(Settings):
     pass
 
+
 class Cord19Settings(Settings):
     # T5 model settings
     t5_model_dir: str = 'gs://neuralresearcher_data/covid/data/model_exp304'