Skip to content

[評価実験] - 自動レッドチーミング実験 #207

@k141303

Description

@k141303

Overview

安全性WGで自動レッドチーミング実験を行います。

Details

Resources

  • 計算機
    • クラスタ: 未定
    • ノード種別: 未定
    • ノード台数: 未定
  • コード
  • 評価データ:
    • {name}: {physical path} FIXME llm-jp-eval-v1.3.1: cluster:/path/to/dataset
  • 出力データ:
    • 保存先: {cluster}:/data/experiments/{issue_id}/evaluations FIXME
  • W&B ログ:
  • 開始日: YYYY-MM-DD
  • 終了予定日: YYYY-MM-DD

Metadata

Metadata

Assignees

No one assigned

    Labels

    evaluationExperiment of model evaluation

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions