# magic_pdf ## 安装 ### 以下演示在223节点安装pdf解析模块(可以直接使用镜像:1177ea7959ce) 下载本项目 ### 1、安装需要的依赖库 #### pip install -e . ### 2、安装需要的模型 `git clone https://www.modelscope.cn/opendatalab/PDF-Extract-Kit.git` #### 修改magic-pdf.template.json cd MinerU
需要注意,"models-dir":"/home/practice/model/PDF-Extract-Kit/models" 路径指向PDF-Extract-Kit/models 将magic-pdf.template.json 拷贝到/root目录下并改名为magic-pdf.json
### 4、启动qwen-ocr模块: `python magic_pdf/dict2md/ocr_server.py` 默认使用6020端口,0号DCU卡 ,可以通过--dcu_id 指定卡,--server_port指定端口号 qwen-ocr模块启动成功:
### 5、启动pdf-server解析服务: `python magic_pdf/tools/pdf_server.py`
启动成功:
### 6、解析pdf `python magic_pdf/parse/common_parse.py -p [文件/目录 路径] -o [输出地址]`
-p指定pdf路径,-o指定输出路径