-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Labels
evaluationExperiment of model evaluationExperiment of model evaluation
Description
Overview
安全性WGで自動レッドチーミング実験を行います。
Details
Resources
- 計算機
- クラスタ: 未定
- ノード種別: 未定
- ノード台数: 未定
- コード
- リポジトリ: FIXME https://github.com/{org}/{repo}
- コミット: FIXME xxxxxx
- 評価データ:
- {name}:
{physical path}
FIXME llm-jp-eval-v1.3.1:cluster:/path/to/dataset
- {name}:
- 出力データ:
- 保存先:
{cluster}:/data/experiments/{issue_id}/evaluations
FIXME
- 保存先:
- W&B ログ:
- 開始日: YYYY-MM-DD
- 終了予定日: YYYY-MM-DD
Metadata
Metadata
Assignees
Labels
evaluationExperiment of model evaluationExperiment of model evaluation