Taskごとに, 適切なハイパーパラメータ (max_new_token, temperature) が異なるため, Taskごとのdefault evaluation configを設定させたい. lmms-evalを参考にする.