RapidOcr-Java

🪧 项目起源

现有的JavaOCR工具包识别效果差强人意，PaddleOCR在实现前沿算法的基础上，考虑精度与速度的平衡，进行模型瘦身和深度优化，使其尽可能满足产业落地需求。
PaddleOCR官方并未提供Java版本，而RapidOcr解决了这个问题，其提供了Kotlin和Java混合版本的Demo-onnx和Demo-ncnn

RapidOcr是完全开源、免费并支持多平台、多语言OCR离线部署
而实际使用过程中，项目中并不想再引入Kotlin，因此本项目将Kotlin部分移除，并在此基础上加以完善，使调用者方便使用

👏 项目特点

纯Java代码调用RapidOcr
使用ncnn~~和onnx~~推理引擎方式，并编写了简单工具类

❗️本项目暂时移除onnx，如有需要请提issue

🎉 快速开始

1⃣️ 引入jar包(需要自己下载项目打包，过程略)

<dependency>
    <groupId>com.github.monster</groupId>
    <artifactId>RapidOcr-Java</artifactId>
    <version>0.0.2</version>
</dependency>

2⃣️ 调用

public class OcrUtilTest {

    @Test
    public void runParamConfig() {
        // 配置参数
        ParamConfig paramConfig = new ParamConfig();
        paramConfig.setDoAngle(true);
        paramConfig.setMostAngle(true);
        // 开始识别
        OcrResult ocrResult = OcrUtil.runOcr("images/1.jpg", paramConfig);
        System.out.println(ocrResult);
    }

    @Test
    public void runOcr() {
        // 开始识别
        System.out.println("第一次OCR >>>>>>>> ");
        OcrResult ocrResult1 = OcrUtil.runOcr("images/img.png");
        System.out.println(ocrResult1);
        // 开始识别
        System.out.println("第二次OCR >>>>>>>> ");
        OcrResult ocrResult2 = OcrUtil.runOcr("images/40.png");
        System.out.println(ocrResult2);
        // 开始识别
        System.out.println("第三次OCR >>>>>>>> ");
        OcrResult ocrResult3 = OcrUtil.runOcr("images/40.png");
        System.out.println(ocrResult3);
    }

    @Test
    public void runHardWareConfig() {
        // 配置可变参数
        ParamConfig paramConfig = new ParamConfig();
        paramConfig.setDoAngle(true);
        paramConfig.setMostAngle(true);
        // 配置硬件参数：4核CPU，不使用GPU
        HardwareConfig hardwareConfig = new HardwareConfig(4, 0);
        // 开始识别
        OcrResult ocrResult = OcrUtil.runOcr("images/1.jpg", paramConfig, LibConfig.getDefaultConfig(), hardwareConfig);
        System.out.println(ocrResult);
    }
}

🔝 OcrConfig参数调优

LibConfig参数说明如下：

参数名	说明	类型	权限
libraryDir	动态链接库路径	String	读写
modelsDir	模型路径	String	读写
deleteOnExit	是否在JVM退出时删除动态链接库和模型文件	boolean	读写
detName	Det文件名称	String	只读
clsName	Cls文件名称	String	只读
recName	Rec文件名称	String	只读
keysName	词单	String	只读

HardWareConfig参数说明如下：

参数名	说明	类型	权限
numThread	CPU 核心数量	int	读写
gpuIndex	GPU0一般为默认GPU，参数选项：使用CPU(-1)/使用GPU0(0)/使用GPU1(1)/...，默认0	int	读写

⚠️ 本项目ncnn暂时不支持使用GPU，即使用默认值0

ParamConfig参数说明如下：

参数名	说明	类型	权限
padding	图像外接白框，用于提升识别率，文字框没有正确框住所有文字时，增加此值。默认50。	int	读写
maxSideLen	按图像长边进行总体缩放，放大增加识别耗时但精度更高，缩小减小耗时但精度降低，maxSideLen为0表示不缩放	int	读写
boxScoreThresh	文字框置信度门限，文字框没有正确框住所有文字时，减小此值，默认0.5f	float	读写
boxThresh	值越大，文字部分会越小，默认0.3f	float	读写
unClipRatio	单个文字框大小倍率，越大时单个文字框越大，默认1.6f	float	读写
doAngleFlag	启用(1)/禁用(0) 文字方向检测，只有图片倒置的情况下(旋转90~270度的图片)，才需要启用文字方向检测，默认关闭	boolean	读写
mostAngleFlag	启用(1)/禁用(0) 角度投票(整张图片以最大可能文字方向来识别)，当禁用文字方向检测时，此项也不起作用，默认关闭	boolean	读写

✍️ 想更深入了解，请移步config.yaml参数解释

🗣️ 目录说明

Resources目录

存放RapidOcr使用ncnn编译后的结果

想要更新ncnn请前往

models: 模型文件
libRapidOcrNcnn-silicon.dylib: 使用Mac系统 M系列架构编译
libRapidOcrNcnn-intel.dylib: 使用Mac系统 Intel架构编译
libRapidOcrNcnn.so: 使用Linux系统编译
RapidOcrNcnn.dll: 使用Windows系统编译

src目录

com.benjaminwan.ocrlibrary: 核心代码，用来与dll、so、dylib进行交互。‼️ 千万不要改包名！！！
com.github.monster.OcrUtil: 调用核心代码工具类

⚠️ 版本说明

当前使用版本如下

ncnn

libRapidOcrNcnn-silicon.dylib: v1.2.0
libRapidOcrNcnn-intel.dylib: 1.1.2
libRapidOcrNcnn.so: 1.1.2
RapidOcrNcnn.dll: 1.1.2

onnx

libRapidOcrOnnx-intel.dylib: 1.2.2
libRapidOcrOnnx.so: 1.2.2
RapidOcrOnnx.dll: 1.2.2

📌 TODO

根据系统版本自适应加载动态库
动态库集成到jar中
是否删除临时文件夹配置为可选项
jvm未退出场景连续调用识别结果集乱码#1

鸣谢

开源许可

使用 Apache License 2.0

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
images		images
src		src
.gitignore		.gitignore
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

RapidOcr-Java

🪧 项目起源

👏 项目特点

🎉 快速开始

🔝 OcrConfig参数调优

🗣️ 目录说明

Resources目录

src目录

⚠️ 版本说明

ncnn

onnx

📌 TODO

鸣谢

开源许可

About

Uh oh!

Releases

Packages

Languages

chuchumaolu555/RapidOcr-Java

Folders and files

Latest commit

History

Repository files navigation

RapidOcr-Java

🪧 项目起源

👏 项目特点

🎉 快速开始

🔝 OcrConfig参数调优

🗣️ 目录说明

Resources目录

src目录

⚠️ 版本说明

ncnn

onnx

📌 TODO

鸣谢

开源许可

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages