もし、あなたがタイタニック号に乗っていたら生き残れるかどうか判定してくれる。 kaggleのタイタニックのデータセットを用いた簡単な機械学習アプリケーション。
- リポジトリのCode -> Codespacesから環境を作成
- 事前準備
- vscodeとremote devcontainerの拡張をインストール
- docker環境を用意
git clone
- vscode上で
dev container rebuild
- 事前準備
- docker環境を用意
docker-compose -f ./docker/docker-compose.yml up -d
-
新規のライブラリをインストール
- 例えばnumpyをインストールする場合のコード
poetry add numpy --dev
-
フォーマット
- コードをフォーマットしてくれる
make format
-
実行
-
入力データの投入
- データのダウンロード
- https://www.kaggle.com/competitions/titanic/data
- download all
- データ配置
- (configを変更しなければ)
data/input/
にtrain.csvとtest.csvを配置
- データのダウンロード
-
実行
make run
data/model
にmodel.pkl- 学習済みモデル
data/output
にdf_results.csv- 生存判定結果
-