format code

Signed-off-by: Lize Cai <lize.cai@sap.com>
kserve · oss-prow-bot · Apr 3, 2024 · Mar 29, 2024 · Mar 30, 2024 · Apr 3, 2024
commit c9dbd049046534297d96d269d9b088f0b5138ea6
diff --git a/python/huggingfaceserver/huggingfaceserver/__main__.py b/python/huggingfaceserver/huggingfaceserver/__main__.py
@@ -37,7 +37,10 @@ def list_of_strings(arg):
     "--model_revision", required=False, default=None, help="Huggingface model revision"
 )
 parser.add_argument(
-    "--tokenizer_revision", required=False, default=None, help="Huggingface tokenizer revision"
+    "--tokenizer_revision",
+    required=False,
+    default=None,
+    help="Huggingface tokenizer revision",
 )
 parser.add_argument(
     "--max_length", type=int, default=None, help="max sequence length for the tokenizer"

diff --git a/python/huggingfaceserver/huggingfaceserver/model.py b/python/huggingfaceserver/huggingfaceserver/model.py
@@ -130,7 +130,7 @@ def load(self) -> bool:
 
         model_config = AutoConfig.from_pretrained(model_id_or_path, revision=revision)
 
-        if self.use_vllm and self.device == torch.device("cuda"):   # vllm needs gpu
+        if self.use_vllm and self.device == torch.device("cuda"):  # vllm needs gpu
             if self.infer_vllm_supported_from_model_architecture(model_config):
                 logger.info("supported model by vLLM")
                 self.vllm_engine_args.tensor_parallel_size = torch.cuda.device_count()
@@ -162,13 +162,15 @@ def load(self) -> bool:
                 revision=tokenizer_revision,
                 do_lower_case=self.do_lower_case,
                 device_map=self.device_map,
-                padding_side="left")
+                padding_side="left",
+            )
         else:
             self.tokenizer = AutoTokenizer.from_pretrained(
                 model_id_or_path,
                 revision=tokenizer_revision,
                 do_lower_case=self.do_lower_case,
-                device_map=self.device_map)
+                device_map=self.device_map,
+            )
 
         if not self.tokenizer.pad_token:
             self.tokenizer.add_special_tokens({"pad_token": "[PAD]"})

diff --git a/python/huggingfaceserver/huggingfaceserver/test_model.py b/python/huggingfaceserver/huggingfaceserver/test_model.py
@@ -57,16 +57,28 @@ def test_bert():
 def test_model_revision():
     # https://huggingface.co/google-bert/bert-base-uncased
     commit = "86b5e0934494bd15c9632b12f734a8a67f723594"
-    model = HuggingfaceModel("bert-base-uncased",
-                             {"model_id": "bert-base-uncased",
-                              "model_revision": commit,
-                              "tokenizer_revision": commit,
-                              "disable_lower_case": False}
-                             )
+    model = HuggingfaceModel(
+        "bert-base-uncased",
+        {
+            "model_id": "bert-base-uncased",
+            "model_revision": commit,
+            "tokenizer_revision": commit,
+            "disable_lower_case": False,
+        },
+    )
     model.load()
 
-    response = asyncio.run(model({"instances": ["The capital of France is [MASK].",
-                                                "The capital of [MASK] is paris."]}, headers={}))
+    response = asyncio.run(
+        model(
+            {
+                "instances": [
+                    "The capital of France is [MASK].",
+                    "The capital of [MASK] is paris.",
+                ]
+            },
+            headers={},
+        )
+    )
     assert response == {"predictions": ["paris", "france"]}