Merge pull request #1208 from myhloli/dev

fix(multi-threading ):Enable multi-threading support for PaddleOCR.

Merge pull request #1208 from myhloli/dev
fix(multi-threading ):Enable multi-threading support for PaddleOCR.
92c10d1e · Xiaomeng Zhao · GitHub · 272014c4 · 30220233 · 92c10d1e
Unverified Commit 92c10d1e authored Dec 06, 2024 by Xiaomeng Zhao Committed by GitHub Dec 06, 2024
3 changed files
--- a/magic_pdf/model/doc_analyze_by_custom_model.py
+++ b/magic_pdf/model/doc_analyze_by_custom_model.py
@@ -143,8 +143,10 @@ def doc_analyze(pdf_bytes: bytes, ocr: bool = False, show_log: bool = False,
    if lang == "":
        lang = None
-    model_manager = ModelSingleton()
+    # model_manager = ModelSingleton()
-    custom_model = model_manager.get_model(ocr, show_log, lang, layout_model, formula_enable, table_enable)
+    # custom_model = model_manager.get_model(ocr, show_log, lang, layout_model, formula_enable, table_enable)
+    custom_model = custom_model_init(ocr, show_log, lang, layout_model, formula_enable, table_enable)
    with fitz.open("pdf", pdf_bytes) as doc:
        pdf_page_num = doc.page_count

--- a/magic_pdf/model/pdf_extract_kit.py
+++ b/magic_pdf/model/pdf_extract_kit.py
@@ -22,7 +22,7 @@ except ImportError:
 from magic_pdf.config.constants import *
 from magic_pdf.model.model_list import AtomicModel
-from magic_pdf.model.sub_modules.model_init import AtomModelSingleton
+from magic_pdf.model.sub_modules.model_init import AtomModelSingleton, ocr_model_init
 from magic_pdf.model.sub_modules.model_utils import (
    clean_vram, crop_img, get_res_list_from_layout_res)
 from magic_pdf.model.sub_modules.ocr.paddleocr.ocr_utils import (
@@ -37,6 +37,7 @@ class CustomPEKModel:
        """
        ======== model init ========
        """
+        self._lock = Lock()
        # 获取当前文件（即 pdf_extract_kit.py）的绝对路径
        current_file_path = os.path.abspath(__file__)
        # 获取当前文件所在的目录(model)
@@ -152,9 +153,14 @@ class CustomPEKModel:
                device=self.device,
            )
        # 初始化ocr
-        self.ocr_model = atom_model_manager.get_atom_model(
+        # self.ocr_model = atom_model_manager.get_atom_model(
-            atom_model_name=AtomicModel.OCR,
+        #     atom_model_name=AtomicModel.OCR,
-            ocr_show_log=show_log,
+        #     ocr_show_log=show_log,
+        #     det_db_box_thresh=0.3,
+        #     lang=self.lang
+        # )
+        self.ocr_model = ocr_model_init(
+            show_log=show_log,
            det_db_box_thresh=0.3,
            lang=self.lang
        )
@@ -211,18 +217,17 @@ class CustomPEKModel:
        # ocr识别
        ocr_start = time.time()
        # Process each area that requires OCR processing
-        lock = Lock()
        for res in ocr_res_list:
            new_image, useful_list = crop_img(res, pil_img, crop_paste_x=50, crop_paste_y=50)
            adjusted_mfdetrec_res = get_adjusted_mfdetrec_res(single_page_mfdetrec_res, useful_list)
            # OCR recognition
            new_image = cv2.cvtColor(np.asarray(new_image), cv2.COLOR_RGB2BGR)
-            with lock:
+            # with self._lock:
-                if self.apply_ocr:
+            if self.apply_ocr:
-                    ocr_res = self.ocr_model.ocr(new_image, mfd_res=adjusted_mfdetrec_res)[0]
+                ocr_res = self.ocr_model.ocr(new_image, mfd_res=adjusted_mfdetrec_res)[0]
-                else:
+            else:
-                    ocr_res = self.ocr_model.ocr(new_image, mfd_res=adjusted_mfdetrec_res, rec=False)[0]
+                ocr_res = self.ocr_model.ocr(new_image, mfd_res=adjusted_mfdetrec_res, rec=False)[0]
            # Integration results
            if ocr_res:

--- a/magic_pdf/pdf_parse_union_core_v2.py
+++ b/magic_pdf/pdf_parse_union_core_v2.py
@@ -31,7 +31,7 @@ try:
 except ImportError:
    pass
-from magic_pdf.model.sub_modules.model_init import AtomModelSingleton
+from magic_pdf.model.sub_modules.model_init import AtomModelSingleton, ocr_model_init
 from magic_pdf.para.para_split_v3 import para_split
 from magic_pdf.pre_proc.construct_page_dict import ocr_construct_page_component_v2
 from magic_pdf.pre_proc.cut_image import ocr_cut_image_and_table
@@ -231,10 +231,15 @@ def txt_spans_extract_v2(pdf_page, spans, all_bboxes, all_discarded_blocks, lang
    if len(empty_spans) > 0:
        # 初始化ocr模型
-        atom_model_manager = AtomModelSingleton()
+        # atom_model_manager = AtomModelSingleton()
-        ocr_model = atom_model_manager.get_atom_model(
+        # ocr_model = atom_model_manager.get_atom_model(
-            atom_model_name="ocr",
+        #     atom_model_name="ocr",
-            ocr_show_log=False,
+        #     ocr_show_log=False,
+        #     det_db_box_thresh=0.3,
+        #     lang=lang
+        # )
+        ocr_model = ocr_model_init(
+            show_log=False,
            det_db_box_thresh=0.3,
            lang=lang
        )