miniChatGPT

miniChatGPT基于Huggingface GPT2，支持有监督微调(SFT)、奖励模型(Reward Model)和PPO全流程ChatGPT训练。

如何使用

本项目是对minChatGPT的修改和完善，感谢minChatGPT的辛勤工作。

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
chatgpt		chatgpt
docs		docs
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md