CHANGELOG.md 2.46 KB
Newer Older
zk's avatar
zk committed
1
# 更新记录
zk's avatar
zk committed
2

zk's avatar
zk committed
3
4
## 2026-06-04

zk's avatar
zk committed
5
- 将天津 / 昆山公共服务的本地服务器配置整理为 18 台机器,按组织或实验室分组,并清理标签中的借用人、用途和状态信息。
zk's avatar
zk committed
6
7
- 增加 `hy-smi` 采集兜底:当默认环境和登录 Shell 都找不到命令时,会尝试先加载 `/opt/hyhal/env.sh`,兼容需要手动 source HYHAL 环境的机器。

zk's avatar
zk committed
8
9
10
11
12
13
## 2026-05-29

- 新增多站点入口切换,页面侧边栏可以在昆山 / 天津中心、太原中心等独立部署之间跳转。
- 新增 `/api/site-config` 配置接口,支持通过 `data/sites.json` 或环境变量维护当前站点和站点列表。
- 新增 `data/sites.sample.json` 示例配置,并将真实站点入口 `data/sites.json` 作为本地运行配置忽略,避免提交真实内网地址。

zk's avatar
zk committed
14
15
## 2026-05-28

zk's avatar
zk committed
16
17
18
19
- 新增“模型镜像检索”视图,支持按模型名、路径、Docker 镜像名或 tag 查找资产所在服务器。
- 检索结果按服务器聚合展示,并显示机器分组、IP、当前占用状态,支持复制 IP、SSH 命令、模型路径和镜像名称。
- 优化资源看板和模型检索的顶部工具栏,让搜索框明确跟随当前视图显示资源搜索或模型搜索。
- 收紧模型目录识别规则,只展示目录名或目录内容具备模型特征的路径,减少项目目录、脚本目录等非模型内容混入。
zk's avatar
zk committed
20
21
22
23
- 新增服务器配置定期备份,默认保存到 `data/backups/` 并保留最近 30 份。
- 新增模型资产盘点,支持展示每台服务器 `/models``/public``/data` 等目录下的模型文件/目录和 Docker images。
- 新增“刷新模型资产”入口,并支持按模型路径、模型名和镜像名称进行搜索。
- 新增采集并发控制,GPU/DCU 状态默认最多同时采集 8 台,模型资产默认最多同时采集 3 台。
zk's avatar
zk committed
24
25
- 新增 `hy-smi` 登录 Shell 兜底采集方式,兼容需要加载启动脚本后才能使用 DTK 环境的服务器。
- 验证本地可以访问 `10.17.26.107`,并把同样的采集方式同步到公共部署服务。
zk's avatar
zk committed
26
27
28

## 2026-05-27

zk's avatar
zk committed
29
30
31
32
33
- 优化宽屏下的服务器卡片布局,修复卡片内容超出边界的问题。
- 将默认 SSH/采集超时时间调整为 20 秒,减少 NVIDIA `nvidia-smi` 响应较慢时误判连接失败的情况。
- 新增 GPU/DCU 型号持久化,并改为添加、编辑或手动刷新时更新型号信息。
- 新增服务器分组和分组筛选功能。
- 更新 README,补充部署说明和界面截图。