Skip to content

[事前学習] - tokenizer v4 test #200

@cr-liu

Description

@cr-liu

Overview

トークナイザ v4 比較実験

Details

モデルカードPR: https://github.com/llm-jp/model-cards/pull/{id}

数パラグラフ以内で実験に関する詳細を説明してください。
関連するリンクがあれば適宜してください。

Resources

  • 計算機
    • クラスタ: FIXME Sakura (Ishikari)
    • ノード種別: FIXME gpu-small (H100x8)
    • ノード台数: FIXME 32
  • コード
  • 入力データ:
    • {name}: {physical path}
  • 出力データ:
    • 保存先: {cluster}:/data/experiments/{number}
    • データ内訳:
      • {name}: xxx TB (バッファ容量を含む)
  • W&B ログ:
  • 開始日: YYYY-MM-DD
  • 終了予定日: YYYY-MM-DD (バッファ期間を含む)

Metadata

Metadata

Assignees

No one assigned

    Labels

    pretrainExperiment of model pretrain

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions