Spaces:

Snowflake
/

MADQA-Leaderboard

Running

App Files Files

Borchmann commited on Nov 15, 2025

Commit

c731123

verified ·

1 Parent(s): 6da8289

Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

.ruff_cache/0.14.5/10030214861837525307 +0 -0
.ruff_cache/0.14.5/1217244776251154506 +0 -0
.ruff_cache/0.14.5/17154366104450809768 +0 -0
.ruff_cache/0.14.5/17246995203982082100 +0 -0
.ruff_cache/0.14.5/18101337634414237271 +0 -0
src/display/utils.py +9 -9

.ruff_cache/0.14.5/10030214861837525307 CHANGED Viewed

Binary files a/.ruff_cache/0.14.5/10030214861837525307 and b/.ruff_cache/0.14.5/10030214861837525307 differ

.ruff_cache/0.14.5/1217244776251154506 CHANGED Viewed

Binary files a/.ruff_cache/0.14.5/1217244776251154506 and b/.ruff_cache/0.14.5/1217244776251154506 differ

.ruff_cache/0.14.5/17154366104450809768 CHANGED Viewed

Binary files a/.ruff_cache/0.14.5/17154366104450809768 and b/.ruff_cache/0.14.5/17154366104450809768 differ

.ruff_cache/0.14.5/17246995203982082100 CHANGED Viewed

Binary files a/.ruff_cache/0.14.5/17246995203982082100 and b/.ruff_cache/0.14.5/17246995203982082100 differ

.ruff_cache/0.14.5/18101337634414237271 CHANGED Viewed

Binary files a/.ruff_cache/0.14.5/18101337634414237271 and b/.ruff_cache/0.14.5/18101337634414237271 differ

src/display/utils.py CHANGED Viewed

@@ -11,7 +11,7 @@ def fields(raw_class):
 # These classes are for user facing column names,
 # to avoid having to change them all around the code
 # when a modif is needed
-@dataclass
 class ColumnContent:
     name: str
     type: str
@@ -24,23 +24,23 @@ class ColumnContent:
 auto_eval_column_dict = []
 # Init
 auto_eval_column_dict.append(
-    ["model_type_symbol", ColumnContent, ColumnContent("T", "markdown", True, never_hidden=True)]
 )
-auto_eval_column_dict.append(["model", ColumnContent, ColumnContent("Model", "markdown", True, never_hidden=True)])
 # Scores
 for idx, task in enumerate(Tasks):
     # Only show overall ANLS (first task) by default
     displayed_by_default = idx == 0
     auto_eval_column_dict.append(
-        [task.name, ColumnContent, ColumnContent(task.value.col_name, "number", displayed_by_default)]
     )
 # Cost/Efficiency metrics
-auto_eval_column_dict.append(["agent_steps", ColumnContent, ColumnContent("Agent Steps", "number", True)])
-auto_eval_column_dict.append(["cost_usd", ColumnContent, ColumnContent("Cost (USD)", "number", True)])
 # Model information
-auto_eval_column_dict.append(["model_type", ColumnContent, ColumnContent("Model Type", "str", True)])
-auto_eval_column_dict.append(["submitted_by", ColumnContent, ColumnContent("Submitted By", "str", False)])
-auto_eval_column_dict.append(["submission_date", ColumnContent, ColumnContent("Submission Date", "str", False)])
 # We use make dataclass to dynamically fill the scores from Tasks
 AutoEvalColumn = make_dataclass("AutoEvalColumn", auto_eval_column_dict, frozen=True)

 # These classes are for user facing column names,
 # to avoid having to change them all around the code
 # when a modif is needed
+@dataclass(frozen=True)
 class ColumnContent:
     name: str
     type: str
 auto_eval_column_dict = []
 # Init
 auto_eval_column_dict.append(
+    ("model_type_symbol", ColumnContent, ColumnContent("T", "markdown", True, never_hidden=True))
 )
+auto_eval_column_dict.append(("model", ColumnContent, ColumnContent("Model", "markdown", True, never_hidden=True)))
 # Scores
 for idx, task in enumerate(Tasks):
     # Only show overall ANLS (first task) by default
     displayed_by_default = idx == 0
     auto_eval_column_dict.append(
+        (task.name, ColumnContent, ColumnContent(task.value.col_name, "number", displayed_by_default))
     )
 # Cost/Efficiency metrics
+auto_eval_column_dict.append(("agent_steps", ColumnContent, ColumnContent("Agent Steps", "number", True)))
+auto_eval_column_dict.append(("cost_usd", ColumnContent, ColumnContent("Cost (USD)", "number", True)))
 # Model information
+auto_eval_column_dict.append(("model_type", ColumnContent, ColumnContent("Model Type", "str", True)))
+auto_eval_column_dict.append(("submitted_by", ColumnContent, ColumnContent("Submitted By", "str", False)))
+auto_eval_column_dict.append(("submission_date", ColumnContent, ColumnContent("Submission Date", "str", False)))
 # We use make dataclass to dynamically fill the scores from Tasks
 AutoEvalColumn = make_dataclass("AutoEvalColumn", auto_eval_column_dict, frozen=True)