Skip to content

ZZH-qwq/Contrail

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

88 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Logo

Contrail

简单易用的服务器资源和计算平台监控工具

✨ 主要功能  |   ⚙️ 部署方式  |   📖 使用说明

overview overview

Contrail 是一个简单易用的服务器资源和计算平台监控工具。它旨在提供一个高效、直观的监控界面,帮助用户了解各个系统的实时和历史状态。

使用技术

主要功能

服务器资源监控

GPU 实时状态

点击展开图像

realtime monitor realtime monitor

GPU 历史信息

点击展开图像

history monitor history monitor

AI4S 平台监控

AI4S 任务列表

点击展开图像

ai4s tasks ai4s tasks

AI4S 费用记录

点击展开图像

ai4s fee ai4s fee

部署方式

主设备

根据需要运行的监控项目安装对应的依赖:

pip install -e .[ai4s,web]

同时在 config/host_config.json 中配置主设备的相关信息。

主设备 - AI4S

Note

ai4s 未来也会提供配置文件模板,因此AI4S相关命令仅为临时方案

获取 cookies:

python -m contrail.ai4s.ai4s_login --url http://aiplatform.ai4s.sjtu.edu.cn/bml/project/...

然后在 screenshoots/body.png 下查看验证码和动态口令二维码

Note

TODO:chromedriver 的路径未来将会由配置文件提供

将与浏览器对应的 chromedriver 放在 resource/chromedriver 下。

socket 设备

仅需安装基本的依赖:

pip install -e .

同时在 config/sender_config.json 中配置相关信息。

使用说明

主设备

启动 web 应用:

streamlit run webapp.py --server.port 3333

启动监控:

contrail monitor

在运行过程中:

list                  # 列出所有被监控的设备
remove <device_name>  # 移除被监控的设备
reload                # 重新加载配置文件
exit                  # 退出监控

例如,若需要更新已有设备的配置,可以直接修改 config/host_config.json 中的相关信息,然后运行:

remove <device_name>
reload

主设备 - AI4S

运行监控:

python -m contrail.ai4s.ai4s_execute --url http://aiplatform.ai4s.sjtu.edu.cn/bml/project/model-train/notebook/...

socket 设备

连接到主设备

contrail sender

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages