当前位置: 首页 > news >正文

河北省疫情防控最新政策网络优化是干什么的

河北省疫情防控最新政策,网络优化是干什么的,网站引流怎么做的,做菠菜网站多少钱昨天突然发现,百度旋转验证码发生了变化,导致使用老版本验证码训练出来的识别模型效果不佳。所有昨天花了一天时间完成了新版模型的训练。 老版本验证码 新版本验证码 新版的验证码感觉像是AI绘画随机生成的,还有随机阴影出现。 验证码识别…

昨天突然发现,百度旋转验证码发生了变化,导致使用老版本验证码训练出来的识别模型效果不佳。所有昨天花了一天时间完成了新版模型的训练。

老版本验证码

新版本验证码

 

新版的验证码感觉像是AI绘画随机生成的,还有随机阴影出现。 

验证码识别过程

1、利用爬虫采集图像

首先我们开发爬虫去采集新版本的图片素材。爬取过程中发现cookie有一定的时效性,没有花过多时间在图片的反爬上做研究。

2、人工标记

为了保障识别的精度,这里需要进行大量的人工标记,旋转角度可能有误差,最好控制在1-2度以内,数据质量决定了模型预测效果

  3、训练模型

4、测试验证

我们将训练好的模型用100张图片来进行测试,虽然识别出来角度有所偏差,但是这个误差范围都能够使验证通过,所以正确率接近100%。因为100张测试图片比较少,所以保守估计正确率应该在99%左右。

如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。

5、免费使用地址

我将训练好的模型放在了网上,可以供大家免费学习使用:得塔云

6、总结分析
(1)目前见到的验证码图片可能是AI生成的,所以出现新图片的概率会很大,所以对标注、识别难度会大大增加。

(2)和老版本相比,新版本图像采集加入了一些反爬措施,也增加了一些难度。

(3)目前我没有使用 selenium 进行实战测试,可能会遇到更多反爬措施。

各位大神也请指出我的不足,或者有其他建议都可以给我留言,或私信我,谢谢指点。
 

 

http://www.zhongyajixie.com/news/25308.html

相关文章:

  • 北京建委安全员c证百度seo软件首选帝搜软件
  • 如何使用框架来建设网站小网站关键词搜什么
  • 视频号怎么经营seo快速排名培训
  • 樟木头网站做seo要投入什么
  • 网站建设项目背景广州百度关键词推广
  • wordpress 禁止缩略图网站seo如何优化
  • wordpress文章分享seo研究协会网app
  • 检测公司宣传册设计样本武汉百度快照优化排名
  • 图片交易网站源码软件制作
  • logo制作在线生成器长沙网站托管优化
  • 灯塔网站建设南京最大网站建设公司
  • 旅游b2b网站开发巨量数据分析入口
  • 网站建设考核指标男生短期培训就业
  • 上海网站建设渠道多用户建站平台
  • 网站弹出咨询这个怎么做国内手机搜索引擎十大排行
  • 有关中国文明网联盟网站建设活动方案刚刚地震最新消息今天
  • wordpress导航站模板最新热点新闻事件
  • 简单5步_制作wordpress留言板手机优化软件排名
  • 网络服务器在哪个国家网络营销就是seo正确吗
  • 怎么给网站命名广东省人大常委会
  • 广东党员两学一做考试网站北京效果好的网站推广
  • 巩义做网站推广郑州技术支持seo
  • 网站做程序需要多久杭州网络优化公司排名
  • 怎么查询网站是哪家公司做的营销推广网
  • 如何建立个人免费网站免费关键词排名优化软件
  • 做网站做论坛赚钱吗如何搭建网站平台
  • 网站安装部署网络营销品牌有哪些
  • 企业网站建设方式百度指数是干嘛的
  • 怎么优化自己的网站百度在西安有分公司吗
  • 四川眉山今天疫情实时动态防控深圳网络seo推广