Skip to content

[事前学習] - マルチモーダルモデル学習(VILA step-2) #205

@kei-0917

Description

@kei-0917

Overview

llm-jp-VILA を参考に,マルチモーダルの学習を行う.

Details

モデルカードPR: https://github.com/llm-jp/model-cards/pull/{id}

llm-jp-VILA の step-0, step-1 の学習を行なったモデルに対して,指示チューニングを行う.

Resources

  • 計算機
    • クラスタ: mdx (llm-jp-nvlink)
    • ノード種別: gpu (A100x8)
    • ノード台数: 4 - 8
  • コード
  • 入力データ:
    • llm-jp-nvlink:/data/kei0917/VILA-open-ja/playground/data
  • 出力データ:
    • 保存先: llm-jp-nvlink:/data/experiments/0205_vila_step2
    • データ内訳:
      • checkpoints: 150GB(バッファ容量を含む)
  • W&B ログ:
  • 開始日: YYYY-MM-DD
  • 終了予定日: YYYY-MM-DD (バッファ期間を含む)

Metadata

Metadata

Assignees

No one assigned

    Labels

    pretrainExperiment of model pretrain

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions