[Fix] Add padding_side="left" for Qwen2.5 to enable flash_attention (#620)

robinhad · web-flow · commit b5a3050c9f37 · 2025-04-08T12:39:48.000+08:00
* Add padding_side="left" to enable flash_attention

* Fix linting errors
diff --git a/lmms_eval/models/qwen2_5_vl.py b/lmms_eval/models/qwen2_5_vl.py
@@ -82,12 +82,11 @@ def __init__(
             ).eval()
         else:
             self._model = Qwen2_5_VLForConditionalGeneration.from_pretrained(pretrained, torch_dtype="auto", device_map=self.device_map).eval()
-        self.processor = AutoProcessor.from_pretrained(pretrained, max_pixels=max_pixels, min_pixels=min_pixels)
         self.max_pixels = max_pixels
         self.min_pixels = min_pixels
         self.max_num_frames = max_num_frames
-        self.processor = AutoProcessor.from_pretrained(pretrained, max_pixels=max_pixels, min_pixels=min_pixels)
-        self._tokenizer = AutoTokenizer.from_pretrained(pretrained)
+        self.processor = AutoProcessor.from_pretrained(pretrained, max_pixels=max_pixels, min_pixels=min_pixels, padding_side="left")
+        self._tokenizer = AutoTokenizer.from_pretrained(pretrained, padding_side="left")
 
         self._config = self.model.config
         self.batch_size_per_gpu = int(batch_size)