pdf 文字内容提取服务,不使用 GPU && 基于 YOLO && PaddleOCR。 支持容器部署 docker-compose。 本服务提供基本的 pdf/picture 内容识别,识别内容以数组形式返回。 TODO: 1. 表格返回格式凌乱,需要调整排版 2. 排版恢复,转为 docx 返回文件流 3. pdf/picture 转 htmldocker-compose build docker-compose up -d # 使用的是 fastapi, swagger 地址为 http://127.0.0.1:5555/docspython main.py cd test && python test.py