当前位置: 首页 > news >正文

天津建设工程信息网b1新北路站百度搜索网

天津建设工程信息网b1新北路站,百度搜索网,清溪仿做网站,福建省建设厅网站 保证金一、需求 OCR算法在处理合同等文件时,会由于印章等遮挡导致文本误识别。因此在OCR预处理时,有一个很重要的步骤是“去除印章”。其中本文主要聚焦在“去除印章”任务中的数据构建步骤:“合同伪印章”的数据构建。下面直接放几张批量合成后效果…

一、需求

        OCR算法在处理合同等文件时,会由于印章等遮挡导致文本误识别。因此在OCR预处理时,有一个很重要的步骤是“去除印章”。其中本文主要聚焦在“去除印章”任务中的数据构建步骤:“合同+伪印章”的数据构建。下面直接放几张批量合成后效果。

二、原理实现      

        合成合同印章的步骤有三个“随机”需要控制。1.印章样式需要“随机”;2.印章“随机”角度、位置贴在合同上的;3.合同版面色泽需要“随机”。

2.1 随机印章样式

        我采用的是第三方接口,这里借鉴了这位大佬方法二的思路:【Python】实现公章自动化生成以及自动盖章效果-CSDN博客,实现批量生成。主要的调用思路是,通过调用第三方印章生成网址跑批生成。

def func_get_stamp_png(name,use,seal_type):# 定义API的地址out_put_name =  os.path.join(seal_output_path,name+".png")url = "http://www.yinzhang8.com.cn/seal/index.php?name={}&str={}&type={}".format(str(name),str(use),str(seal_type))# 发送HTTP请求response = requests.get(url)assert response.status_code == 200assert 1<=types<=4# 将返回的二进制数据保存为本地文件with open(out_put_name, "wb") as f:f.write(response.content)

然而第三方网址需要公司名,这里我采用的是faker库,随机生成公司名然后去调用跑批。代码如下。这里公司长度一般在[8,11]字长范围较合适

    #批量随机生成公司名def get_faker_company(self,n,control_len):# 一般公司名的字长范围为,限制 control_len = [8,11]from faker import Fakermy_fake = Faker("zh-CN")comany_list = set()while len(comany_list) < n:tmp_company = my_fake.company()if control_len[0]<=len(tmp_company)<=control_len[1]:comany_list.add(tmp_company)return list(comany_list)

 2.2 随机印章位置角度

        在贴上合同的时候,需要用PIL的paste函数中的position来实现控制位置,随机角度需要采用PIL.Image库首先将印章完成旋转,然后再贴上去。部分代码如下。

 # 随机选择一个倾斜角度
angle = random.randint(-15, 15)
watermark = watermark.rotate(angle)
# 计算印章可以放置的位置范围
x_range = [int(doc_width * 0.2),int(doc_width * 0.8)]
y_range = [int(doc_height * 0.5),int(doc_height * 0.9)]
# 随机选择一个位置
x_position = random.randint(x_range[0], x_range[1])
y_position = random.randint(y_range[0], y_range[1])
watermark = watermark.resize((int(doc_width*0.1),int(doc_height*0.1)))
# 将水印添加到基本图像
base_image.paste(watermark, (x_position,y_position), watermark)

2.3 随机合同样式

        这部分考虑到,由于是做图像复原任务,所以在torch里做比较好,对image和label做同一个转换,就能保持图像前后的一致性。

三、秀效果

        随便贴张图,展现效果。全部源码传送门:coming soon。

http://www.zhongyajixie.com/news/20372.html

相关文章:

  • ssm框架网站开发 参考文献自己怎么做引流推广
  • 杭州计算机公司排名培训seo去哪家机构最好
  • 网站建设套模板下载免费加客源
  • 菏泽网站建设多少钱河北疫情最新情况
  • 动易学校网站管理系统 漏洞百度搜索收录
  • 广州微网站网站的营销推广方案
  • wordpress怎么做好看的图片页面关键词优化排名软件推荐
  • 青岛做网站哪家专业seo关键词优化公司哪家好
  • 专门做简历的网站淘客推广怎么做
  • 百度快照 直接进入网站百度链接提交
  • 网站建设培训公司排名百度推广多少钱一个月
  • 网站建设必要性2345网址导航官方网站
  • 新民个人网站建设优势sem是什么缩写
  • 北京有名的设计公司有哪些企业站seo案例分析
  • 济南做网站最好的公司google竞价推广
  • 学做家常菜的网站长尾关键词网站
  • 惠州网站建设哪家好中国旺旺(00151) 股吧
  • 小程序开发费用多少钱西安百度网站排名优化
  • c sql网站开发网络营销的特点是什么
  • 网站推广打包苏州seo
  • wordpress做外贸网站百度推广手机版
  • 怎么做虚拟币网站网站推广与优化平台
  • 广州网站建设亅新科送推广百度上做广告怎么收费
  • 佛山网站制作哪家好中国体育新闻
  • 如何做网页游戏网站今天新闻头条新闻
  • 网站流量攻击软件软文营销名词解释
  • wordpress空间 论坛seo软件服务
  • 杭州网站制作武汉现在最好的营销方式
  • 商丘企业网站服务个人网站网页首页
  • 海南省做购房合同网站广州百度搜索优化