存在重复字符输出问题, 硬件K100 AI, docker
类似这样的输出:电力: 电压(V) 频率(Hz) 相数 ▲低压氮气(MPaG) ▲高压氮气(MPaG) ▲低压氦气(MPaG) ▲低压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG) ▲高压氦气(MPaG)
同一份文档,解析多次多出现,只是字符有可能不一样,这次是“高压氦气”,下一次可能是“电流”。
docker 用了代码仓推荐的:image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.5.1-ubuntu22.04-dtk25.04.2-py3.10
同时也换了其他如:harbor.sourcefind.cn:5443/dcu/admin/base/vllm:0.9.2-ubuntu22.04-dtk25.04.2-1226-das1.7-py3.10-20251226
docker pull harbor.sourcefind.cn:5443/dcu/admin/base/vllm:0.9.2-ubuntu22.04-dtk25.04.2-das1.7-py3.10-20251203
大概率还是vllm和torch版本过低。