Minor tweaks to newer models (#50)

derekk-nm · web-flow · commit 7b09318550ab · 2025-09-08T14:51:08.000-04:00
* add deepseek-ai path, fix Smol  gsm8k value

* Qwen3 model on quad, deepseek limit gpu memory

* try Qwen3 gpu_memory_utilization

* try max-model-len
diff --git a/HuggingFaceTB/SmolLM3-3B/accuracy/tasks.yml b/HuggingFaceTB/SmolLM3-3B/accuracy/tasks.yml
@@ -2,4 +2,4 @@ tasks:
   - name: gsm8k
     metrics:
       - name: exact_match,strict-match
-        value: 0
+        value: 0.4708
diff --git a/Qwen/Qwen3-Coder-480B-A35B-Instruct-FP8/accuracy/server.yml b/Qwen/Qwen3-Coder-480B-A35B-Instruct-FP8/accuracy/server.yml
@@ -0,0 +1,3 @@
+trust-remote-code: true
+tensor-parallel-size: 4
+max-model-len: 4096
diff --git a/RedHatAI/DeepSeek-R1-0528-quantized.w4a16/accuracy/server.yml b/RedHatAI/DeepSeek-R1-0528-quantized.w4a16/accuracy/server.yml
@@ -1,3 +1,4 @@
 max-model-len: 4096
 tensor-parallel-size: 8
 trust-remote-code: true
+gpu_memory_utilization: 0.8
diff --git a/deepseek-ai/DeepSeek-R1-0528/accuracy/tasks.yml b/deepseek-ai/DeepSeek-R1-0528/accuracy/tasks.yml
@@ -0,0 +1,5 @@
+tasks:
+  - name: gsm8k
+    metrics:
+      - name: exact_match,strict-match
+        value: 0
diff --git a/deepseek-ai/DeepSeek-R1-0528/storage.yml b/deepseek-ai/DeepSeek-R1-0528/storage.yml
@@ -0,0 +1,3 @@
+# storage configs for https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
+model: hf
+data: hf

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+trust-remote-code: true`
	`2`	`+tensor-parallel-size: 4`
	`3`	`+max-model-len: 4096`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+# storage configs for https://huggingface.co/deepseek-ai/DeepSeek-R1-0528`
	`2`	`+model: hf`
	`3`	`+data: hf`