前言

LayoutParser

专为文档布局解析设计，能精准识别试卷中的文本块、标题、列表等区域，适配不同版式试卷，常作为试卷分割的优先选择，无需复杂二次开发。

环境要求

依赖中使用到了zoneinfo ，zoneinfo 模块是从 Python 3.9 开始引入的。

所以我们的Python的最低要求是3.9。

添加依赖

# 清除旧的源缓存
pipenv lock --clear

# 安装依赖
pipenv install layoutparser==0.3.4

# 安装DL布局模型工具包 
pipenv install "layoutparser[layoutmodels]"  

# 安装OCR工具包
pipenv install "layoutparser[ocr]"

不建议使用下面的方式安装，这种相当于跳过pipenv的版本验证，直接安装依赖的，并且依赖不会记录在Pipfile中。

1	pipenv run pip install layoutparser

代码示例

编写代码实现分割：加载预训练模型，读取试卷图像并完成分割与可视化

示例代码如下

import layoutparser as lp
from PIL import Image
# 加载预训练的布局检测模型
model = lp.AutoLayoutModel('lp://EfficientDet/PubLayNet')
print(f"模型加载结果：{model}")  # 必须输出非 None 的模型对象
if model is None:
    raise ValueError("模型加载失败！请检查模型标识符、依赖或缓存文件")
# 读取试卷图片
image = Image.open("test_paper.jpg")
# 执行布局检测（分割试卷区域）
layout = model.detect(image)
# 绘制分割框并可视化结果
lp.draw_box(image, layout, box_width=1, show_element_id=True, box_alpha=0.5)
image.show()

结果

模型下载不下来，没法测试。

LayoutLMv3

在安装LayoutLMv3前，请确保您的系统已满足以下条件：

Python 3.7及以上版本
PyTorch 1.7.0及以上版本
至少4GB内存（推荐8GB以上）
支持CUDA的GPU（可选，用于加速计算）

Clone仓库

1 2	git clone https://gitcode.com/hf_mirrors/microsoft/layoutlmv3-base cd layoutlmv3-base

虚拟环境

在项目下添加文件.env

1	PIPENV_VENV_IN_PROJECT=1

当系统环境变量和.env文件同时存在某个配置的时候，pipenv 会优先使用.env里的值。

添加

Pipfile

[[source]]
url = "https://mirrors.huaweicloud.com/repository/pypi/simple"
verify_ssl = false
name = "pip_conf_index_global"

[packages]

[dev-packages]

[requires]
python_version = "3.9"

安装依赖包

清除缓存

1	pipenv lock --clear

安装依赖

1	pipenv install transformers torch pillow pytesseract

1
2
3

git clone https://github.com/imzhuhl/LayoutLMv3-PaperSegment.git
cd LayoutLMv3-PaperSegment
python download_weights.py   # 拉取 huggingface 权重，~800 MB

文档分类

from transformers import LayoutLMv3Processor, LayoutLMv3ForTokenClassification
 
# 加载处理器和模型
processor = LayoutLMv3Processor.from_pretrained('./')
model = LayoutLMv3ForTokenClassification.from_pretrained('./')

def classify_document(image, text):
    # 处理输入数据
    encoding = processor(image, text, return_tensors="pt")
    # 模型预测
    outputs = model(**encoding)
    # 获取分类结果
    predictions = outputs.logits.argmax(-1)
    return predictions

数据标注框架 Label Studio

数据标注开源框架 Label Studio

安装

# 首先创建conda环境
conda create -n labelstudio python=3.11 
# 进入虚拟环境
conda activate labelstudio
# 安装
pip install label-studio
# 启动，默认8080端口
label-studio start
# 指定端口启动
label-studio start --port 9001

我是码客，我是全栈工程师，我为自己代言。

试卷试题分割实现(Python)

前言