PaddlePaddle · ChenControl · May 31, 2023 · May 31, 2023 · Dec 15, 2024 · HydrogenSulfate
diff --git a/.gitignore b/.gitignore
@@ -129,3 +129,24 @@ FETCH_HEAD
 # vtk
 *.vtk
 *.vtu
+<<<<<<< ours
+=======
+
+# auto generated version file by setuptools_scm
+ppsci/_version.py
+# Model checkpoints
+*.pdparams
+*.pdopt
+*.pdstates
+
+# Output directories
+outputs_HumanoidControl/
+
+# Screenshots and images
+test_screenshot/
+
+# Cache files
+__pycache__/
+*.py[cod]
+*.class
+>>>>>>> theirs
diff --git a/README.md b/README.md
@@ -54,23 +54,23 @@ PaddleScience 是一个基于深度学习框架 PaddlePaddle 开发的科学计
     # write your code here...
     ```
 
-更多安装方式请参考 [**安装与使用**](https://paddlescience-docs.readthedocs.io/zh/latest/zh/install_setup/)
+更多安装方式请参考 [**安装与使用**](https://paddlescience-docs.readthedocs.io/zh/release-1.0/zh/install_setup/)
 
 ## 快速开始
 
-请参考 [**快速开始**](https://paddlescience-docs.readthedocs.io/zh/latest/zh/quickstart/)
+请参考 [**快速开始**](https://paddlescience-docs.readthedocs.io/zh/release-1.0/zh/quickstart/)
 
 ## 经典案例
 
-请参考 [**经典案例**](https://paddlescience-docs.readthedocs.io/zh/latest/zh/examples/viv/)
+请参考 [**经典案例**](https://paddlescience-docs.readthedocs.io/zh/release-1.0/zh/examples/viv/)
 
 ## 支持
 
 如使用过程中遇到问题或想提出开发建议，欢迎在 [**Issue**](https://github.com/PaddlePaddle/PaddleScience/issues/new/choose) 页面新建 issue。
 
 ## 贡献代码
 
-PaddleScience 项目欢迎并依赖开发人员和开源社区中的用户，请参阅 [**贡献指南**](https://paddlescience-docs.readthedocs.io/zh/latest/zh/contribute/)。
+PaddleScience 项目欢迎并依赖开发人员和开源社区中的用户，请参阅 [**贡献指南**](https://paddlescience-docs.readthedocs.io/zh/release-1.0/zh/contribute/)。
 
 ## 证书
 

diff --git a/docs/images/overview/panorama.png b/docs/images/overview/panorama.png
diff --git a/docs/index.md b/docs/index.md
@@ -21,7 +21,7 @@ PaddleScience 是一个基于深度学习框架 PaddlePaddle 开发的科学计
 
 ## 贡献代码
 
-PaddleScience 项目欢迎并依赖开发人员和开源社区中的用户，请参阅 [**贡献指南**](https://paddlescience-docs.readthedocs.io/zh/latest/zh/contribute/)。
+PaddleScience 项目欢迎并依赖开发人员和开源社区中的用户，请参阅 [**贡献指南**](https://paddlescience-docs.readthedocs.io/zh/release-1.0/zh/contribute/)。
 
 ## 证书
 

diff --git a/docs/zh/examples/mujoco_control.md b/docs/zh/examples/mujoco_control.md
@@ -0,0 +1,218 @@
+本项目使用PaddleScience和DeepMind Control Suite (dm_control) 实现了一个人形机器人（Humanoid）的运动控制系统。该系统通过深度学习方法，学习控制人形机器人进行稳定的运动。PINN（Physics-informed Neural Network）方法利用控制方程加速深度学习神经网络收敛，甚至在无训练数据的情况下实现无监督学习。尝试实现Humanoid控制仿真。
+
+1.    开发指南 - PaddleScience Docs (paddlescience-docs.readthedocs.io)
+2.    google-deepmind/dm_control: Google DeepMind's software stack for physics-based simulation and Reinforcement Learning environments, using MuJoCo. (github.com)
+pip install dm_control
+
+安装paddle cuda11.8
+python3 -m pip install paddlepaddle-gpu==3.0.0b1 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
+
+安装paddlescience
+git clone -b develop https://github.com/PaddlePaddle/PaddleScience.git
+### 若 github clone 速度比较慢，可以使用 gitee clone
+### git clone -b develop https://gitee.com/paddlepaddle/PaddleScience.git
+cd PaddleScience
+### install paddlesci with editable mode
+python -m pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple
+
+### MuJoCo Humanoid Control with PaddleScience
+
+
+### 主要特点
+- 使用PaddleScience框架进行深度学习模型训练
+- 基于dm_control的MuJoCo物理引擎进行机器人仿真
+- 实现了自监督学习方案
+- 提供了完整的训练和评估流程
+- 包含详细的性能分析和可视化工具
+
+## 项目结构
+PaddleScience/examples/
+```
+mujoco_control/
+├── conf/
+│   └── humanoid_control.yaml    # 配置文件
+├── humanoid_complete.py         # 主程序文件
+└── outputs_HumanoidControl/     # 输出目录
+    └── YYYY-MM-DD/             # 按日期组织的输出
+        ├── checkpoints/        # 模型检查点
+        ├── evaluation/         # 评估结果
+        └── logs/              # 训练日志
+```
+```
+── conf
+│   └── humanoid_control.yaml
+├── humanoid_complete.py
+└── outputs_HumanoidControl
+        ├── 13-17-41
+        │   └── mode=train
+        │       ├── checkpoints
+        │       │   ├── epoch_10.pdopt
+        │       │   ├── epoch_10.pdparams
+        │       │   ├── epoch_10.pdstates
+        │       │   ├── epoch_100.pdopt
+        │       │   ├── epoch_100.pdparams
+        │       │   ├── epoch_100.pdstates
+        │       │   ├── epoch_20.pdopt
+        │       │   ├── epoch_20.pdparams
+        │       │   ├── epoch_20.pdstates
+        │       │   ├── epoch_30.pdopt
+        │       │   ├── epoch_30.pdparams
+        │       │   ├── epoch_30.pdstates
+        │       │   ├── epoch_40.pdopt
+        │       │   ├── epoch_40.pdparams
+        │       │   ├── epoch_40.pdstates
+        │       │   ├── epoch_50.pdopt
+        │       │   ├── epoch_50.pdparams
+        │       │   ├── epoch_50.pdstates
+        │       │   ├── epoch_60.pdopt
+        │       │   ├── epoch_60.pdparams
+        │       │   ├── epoch_60.pdstates
+        │       │   ├── epoch_70.pdopt
+        │       │   ├── epoch_70.pdparams
+        │       │   ├── epoch_70.pdstates
+        │       │   ├── epoch_80.pdopt
+        │       │   ├── epoch_80.pdparams
+        │       │   ├── epoch_80.pdstates
+        │       │   ├── epoch_90.pdopt
+        │       │   ├── epoch_90.pdparams
+        │       │   ├── epoch_90.pdstates
+        │       │   ├── latest.pdopt
+        │       │   ├── latest.pdparams
+        │       │   └── latest.pdstates
+        │       └── train.log
+```
+## 核心组件
+
+### 1. 数据集类 (HumanoidDataset)
+```python
+class HumanoidDataset:
+    """处理训练数据的收集和预处理"""
+    def __init__(self, num_episodes=1000, episode_length=1000, ratio_split=0.8)
+    def collect_episode_data(self)      # 收集单个回合数据
+    def _flatten_observation(self)       # 处理观察数据
+    def generate_dataset(self)          # 生成训练集和验证集
+```
+
+### 2. 控制器模型 (HumanoidController)
+```python
+class HumanoidController(paddle.nn.Layer):
+    """神经网络控制器"""
+    def __init__(self, state_size, action_size, hidden_size=256)
+    def forward(self, x)                # 前向传播，预测动作
+```
+
+### 3. 评估器类 (HumanoidEvaluator)
+```python
+class HumanoidEvaluator:
+    """模型评估和可视化"""
+    def __init__(self, model_path, num_episodes=5, episode_length=1000)
+    def evaluate_episode(self)          # 评估单个回合
+    def run_evaluation(self)            # 运行完整评估
+```
+
+## 配置说明
+
+主要配置参数（在humanoid_control.yaml中）：
+
+```yaml
+DATA:
+  num_episodes: 100      # 训练回合数
+  episode_length: 500    # 每回合步数
+
+MODEL:
+  hidden_size: 256      # 隐藏层大小
+
+TRAIN:
+  epochs: 100           # 训练轮数
+  batch_size: 32        # 批次大小
+  learning_rate: 0.001  # 学习率
+
+EVAL:
+  num_episodes: 5       # 评估回合数
+  episode_length: 1000  # 评估步数长度
+```
+
+## 训练流程
+
+### 训练方法
+1. 数据收集：
+   - 使用随机策略收集初始训练数据
+   - 将数据分割为训练集和验证集
+
+2. 模型训练：
+   - 使用PaddleScience的训练框架
+   - 实现了自定义损失函数
+   - 包含动作预测和奖励最大化两个目标
+
+3. 训练命令：
+```bash
+python humanoid_complete.py mode=train
+```
+
+### 评估方法
+1. 模型评估：
+   - 在真实环境中运行训练好的模型
+   - 收集性能指标
+   - 生成评估视频（如果可用）
+
+2. 评估命令：
+```bash
+python humanoid_complete.py mode=eval +EVAL.pretrained_model_path="path/to/checkpoint"
+```
+
+## 性能分析
+
+评估过程会生成以下分析结果：
+- 总体奖励统计
+- 动作模式分析
+- 性能可视化图表
+- 评估视频（如果启用）
+
+## 输出说明
+
+### 训练输出
+- 模型检查点
+- 训练日志
+- 学习曲线
+
+### 评估输出
+- 统计数据文件 (stats.txt)
+- 性能分析图表
+- 评估视频文件（如果启用）
+
+## 使用示例
+
+1. 训练新模型：
+python humanoid_complete.py mode=train
+
+2. 评估已训练模型：
+python humanoid_complete.py mode=eval
+
+## 注意事项
+
+1. 环境要求：
+   - PaddlePaddle >= 3.0.0
+   - dm_control
+   - MuJoCo物理引擎
+   - Python >= 3.7 （测试环境为3.10.15）
+
+2. 性能优化建议：
+   - 适当调整batch_size和learning_rate
+   - 根据需要修改网络结构
+   - 可以通过修改配置文件调整训练参数
+
+3. 已知问题：
+   - WSL2环境下可能存在可视化问题
+   - 需要使用适当的渲染后端
+
+## 未来改进
+
+1. 功能扩展：
+   - 添加更多控制策略
+   - 实现多种任务场景
+   - 增强可视化功能
+
+2. 性能优化：
+   - 改进训练效率
+   - 优化模型结构
+   - 增加并行训练支持
diff --git a/docs/zh/install_setup.md b/docs/zh/install_setup.md
@@ -26,25 +26,20 @@
     pip install -r requirements.txt
     ```
 
-    ???+ Info "安装注意事项"
-
-        如需使用外部导入STL文件来构建几何，以及使用加密采样等功能，还需额外安装三个依赖库：
-        [pymesh](https://pymesh.readthedocs.io/en/latest/installation.html#download-the-source)（推荐编译安装）,
-        [open3d](https://github.com/isl-org/Open3D/tree/master#python-quick-start)（推荐pip安装）,
-        [pysdf](https://github.com/sxyu/sdf)（推荐pip安装）
-
 #### 1.2.2 pip 安装
 
-coming soon
-
-<div style='display: none'>
 执行以下命令进行 pip 安装
 
 ``` shell
-pip install -i https://pypi.org/simple/ paddlesci
+pip install paddlesci
 ```
 
-</div>
+???+ Info "安装注意事项"
+
+    如需使用外部导入STL文件来构建几何，以及使用加密采样等功能，还需额外安装三个依赖库：
+    [pymesh](https://pymesh.readthedocs.io/en/latest/installation.html#download-the-source)（推荐编译安装）,
+    [open3d](https://github.com/isl-org/Open3D/tree/master#python-quick-start)（推荐pip安装）,
+    [pysdf](https://github.com/sxyu/sdf)（推荐pip安装）
 
 ## 2. 验证安装
 

diff --git a/examples/mujoco_control/conf/humanoid_control.yaml b/examples/mujoco_control/conf/humanoid_control.yaml
@@ -0,0 +1,41 @@
+defaults:
+  - _self_
+
+hydra:
+  run:
+    dir: outputs_HumanoidControl/${now:%Y-%m-%d}/${now:%H-%M-%S}/${hydra.job.override_dirname}
+  job:
+    name: ${mode}
+    chdir: false
+  sweep:
+    dir: ${hydra.run.dir}
+    subdir: ./
+
+mode: train
+seed: 42
+output_dir: ${hydra:run.dir}
+log_freq: 20
+
+DATA:
+  num_episodes: 100
+  episode_length: 500
+
+MODEL:
+  hidden_size: 256
+
+TRAIN:
+  epochs: 100
+  iters_per_epoch: 10
+  save_freq: 10
+  learning_rate: 0.001
+  batch_size: 32
+  pretrained_model_path: null
+  checkpoint_path: null
+  eval_with_no_grad: true
+
+EVAL:
+  pretrained_model_path: outputs_HumanoidControl/2024-12-15/22-02-39/mode=train/checkpoints/latest.pdparams
-  pretrained_model_path: outputs_HumanoidControl/2024-12-15/22-02-39/mode=train/checkpoints/latest.pdparams
+  pretrained_model_path: null
-  pretrained_model_path: outputs_HumanoidControl/2024-12-15/22-02-39/mode=train/checkpoints/latest.pdparams
+  pretrained_model_path: null
+  eval_with_no_grad: true
+  num_episodes: 5
+  episode_length: 1000
+  interactive: false