Skip to content

[事前学習] - 8B/32B ハイパーパラメータ調査 #204

@odashi

Description

@odashi

Overview

事前学習のハイパーパラメータを確定させる調査を行う。

Details

モデルカードPR: https://github.com/llm-jp/model-cards/pull/{id}

数パラグラフ以内で実験に関する詳細を説明してください。
関連するリンクがあれば適宜してください。

Resources

  • 計算機
    • クラスタ: FIXME Sakura (Ishikari)
    • ノード種別: FIXME gpu-small (H100x8)
    • ノード台数: FIXME 32
  • コード
  • 入力データ:
    • {name}: {physical path}
  • 出力データ:
    • 保存先: {cluster}:/data/experiments/{number}
    • データ内訳:
      • {name}: xxx TB (バッファ容量を含む)
  • W&B ログ:
  • 開始日: YYYY-MM-DD
  • 終了予定日: YYYY-MM-DD (バッファ期間を含む)

Metadata

Metadata

Assignees

No one assigned

    Labels

    pretrainExperiment of model pretrain

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions