Skip to content

Latest commit

 

History

History
 
 

watermask_remover_and_split_data

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
功能:
    1,从图片中提取水印部分,去除水印并复原
    2,对图片进行切割,提取身份证中各个元素部分
    3,将签发机关和地址转化成一行,并截取文字部分,过滤空白部分
    4,对图像进行识别前预处理,滤波,改变尺寸
    5,将每套图片的各个元素的图片名写入一个txt文件,用于识别
文件介绍:
tools:
    extract_test_img_to_txts.py: 功能5的实现
    fix_img_address_unit.py: 功能3的实现
    preprocess_for_test.py:功能4的实现
    split_img_generate_data.py:功能2的实现
watermask_process.py:对外接口包,里面调用了各个功能的接口和调用了去水印模块去除数据集上的水印
template_imgs:模板文件,里面包含用于标定图片坐标的图片

!!!注:复现的测试数据跟初赛和复赛的数据格式需要保持一致,每面身份证左上角需要有:"仅限DBCI比赛(复赛)使用"字样,
      且字体大小格式位置应该跟初赛和复赛的保持一致,否则将严重影响识别的准确性甚至代码运行出错