当前位置: 首页 > news >正文

网站的建设分析百度最怕哪个部门去投诉

网站的建设分析,百度最怕哪个部门去投诉,动态网站开发常见语言,手机上那个网站做农产品推广比较好Adam 优化器于 2014 年推出,其思想:既然知道某些参数移动得更快、更远,则每个参数不需要遵循相同的学习率,因为最近梯度的平方代表每一个权重可以得到多少信号,可以除以这个,确保即使是最迟钝的权重也有机会…

        Adam 优化器于 2014 年推出,其思想:既然知道某些参数移动得更快、更远,则每个参数不需要遵循相同的学习率,因为最近梯度的平方代表每一个权重可以得到多少信号,可以除以这个,确保即使是最迟钝的权重也有机会起作用。Adam 在收敛性证方面有明显问题,需要调整参数。

        L2 正则化是减少过拟合的经典方法,会向损失函数添加由模型所有权重的平方和组成的惩罚项,并乘上特定的超参数以控制惩罚力度,pytorch表示:loss + wd * weights.pow(2).sum()/2;wd 为超参数,控制惩罚力度,称为权重衰减,当运用原版 SGD 时,等价于使用如下方程式更新权重:w = w - lr * w.grad - lr * wd * w,lr 为学习率、w.grad 表示损失函数对 w 的导数,wd * w 表示惩罚项对 w 的求导结果。每一次更新都会减去一小部分权重,这就是「衰减」的来源。

        通常实现库都使用第一种形式,通过梯度 wd*w 而实现算法,而不是真正地改变损失函数。因为不希望增加额外的计算量来修正损失。当添加动量或使用如 Adam 那样复杂的最优化方法,L2 正则化(第一个方程)和权重衰减(第二个方程)会有很大的不同。在本文其余的部分中,我们讨论权重衰减指的都是第二个方程式,而讨论 L2 正则化都是讨论第一个经典方式。

        如下在带动量的 SGD 中,L2 正则化与权重衰减是不等价的。L2 正则化会将 wd*w 添加到梯度中,但现在权重并不是直接减去梯度。首先需要计算移动均值:moving_avg = alpha * moving_avg + (1 - alpha) * (w.grad + wd * w);之后权重通过减去乘上了学习率的移动均值更新。w 更新中涉及到的正则化为 lr * (1 - alpha) * wd * w 加上已经在 moving_avg 中前面权重的组合。权重衰减的更新方式可以表示为:

        moving_avg = alpha * moving_avg + (1 - alpha) * w.grad

        w = w - lr * moving_avg - lr * wd * w

        从 w 中减去有关正则化的部分在两种方法中是不同的。使用 Adam 优化器时,权重衰减的部分可能相差更大,因为 Adam 中的 L2 正则化需要添加 wd * w 到梯度中,分别计算梯度及其平方的移动均值,再更新权重;而权重衰减方法只是简单地更新权重,并每次从权重中减去一点。显然这是两种不同的方法,实验验证应该在 Adam 算法中使用权重衰减方法(AdamW),而不是经典深度学习库中实现的 L2 正则化。

        使用 fastai 库时,在使用 fit 函数时添加参数 use_wd_sched=True 就能实现:model.fit(lr, 1, wds=1e-4, use_wd_sched=True)。

        在优化器中的阶梯函数,只需要使用梯度修正参数,不使用参数本身的值(权重衰减在外部处理),然后在最优化器之前实现权重衰减,但仍需要在计算梯度后完成,否则会影响梯度值。所以在训练循环中,必须确定计算权重衰减的位置,loss.backward(),optimizer.step(),在optimizer step 处做权重衰减,最优化器应该设定 wd=0,否则其还会做一些 L2 正则化。现在在权重衰减的位置中可以在所有参数上写一个循环语句,并依次采用权重衰减的更新。参数应该存储在优化器的字典 param_groups 中,循环如下:

loss.backward()
for group in optimizer.param_groups():for param in group['params']:param.data = param.data.add(-wd * group['lr'], param.data)
optimizer.step()

参考:

当前训练神经网络最快的方式:AdamW优化算法+超级收敛 - 知乎


文章转载自:
http://crinum.c7500.cn
http://nylex.c7500.cn
http://escopeta.c7500.cn
http://corybantic.c7500.cn
http://extrasystole.c7500.cn
http://nondeductible.c7500.cn
http://thermonuke.c7500.cn
http://gonion.c7500.cn
http://energetics.c7500.cn
http://mrs.c7500.cn
http://monotrichous.c7500.cn
http://breathhold.c7500.cn
http://corndodger.c7500.cn
http://wolfbane.c7500.cn
http://interindividual.c7500.cn
http://polarogram.c7500.cn
http://technics.c7500.cn
http://distillatory.c7500.cn
http://mas.c7500.cn
http://vaginate.c7500.cn
http://tithonia.c7500.cn
http://cycloidal.c7500.cn
http://puddling.c7500.cn
http://astrodynamics.c7500.cn
http://conceited.c7500.cn
http://liner.c7500.cn
http://princess.c7500.cn
http://bure.c7500.cn
http://levulin.c7500.cn
http://laudation.c7500.cn
http://gorge.c7500.cn
http://irreverent.c7500.cn
http://demeanour.c7500.cn
http://sabbatical.c7500.cn
http://insistent.c7500.cn
http://unteach.c7500.cn
http://drest.c7500.cn
http://sexcentenary.c7500.cn
http://wuhsi.c7500.cn
http://willet.c7500.cn
http://papillary.c7500.cn
http://uneducational.c7500.cn
http://atebrin.c7500.cn
http://kymry.c7500.cn
http://praam.c7500.cn
http://anamorphism.c7500.cn
http://sectarian.c7500.cn
http://affiche.c7500.cn
http://bouffe.c7500.cn
http://kineticism.c7500.cn
http://sprightly.c7500.cn
http://earwax.c7500.cn
http://rosarian.c7500.cn
http://pneumaturia.c7500.cn
http://lodging.c7500.cn
http://adventurously.c7500.cn
http://unilobed.c7500.cn
http://venepuncture.c7500.cn
http://chalky.c7500.cn
http://plantimal.c7500.cn
http://tumbler.c7500.cn
http://hardback.c7500.cn
http://sep.c7500.cn
http://cunabula.c7500.cn
http://coachful.c7500.cn
http://thermometry.c7500.cn
http://trematode.c7500.cn
http://rewaken.c7500.cn
http://wtc.c7500.cn
http://wronghead.c7500.cn
http://aspire.c7500.cn
http://antennal.c7500.cn
http://devotement.c7500.cn
http://polyphony.c7500.cn
http://helicar.c7500.cn
http://pinguin.c7500.cn
http://shopgirl.c7500.cn
http://greyly.c7500.cn
http://ncna.c7500.cn
http://midiron.c7500.cn
http://excitatory.c7500.cn
http://fosbury.c7500.cn
http://deodorizer.c7500.cn
http://crocean.c7500.cn
http://circumvention.c7500.cn
http://calisthenic.c7500.cn
http://rayleigh.c7500.cn
http://illicitly.c7500.cn
http://clipbook.c7500.cn
http://viminal.c7500.cn
http://parliament.c7500.cn
http://libeler.c7500.cn
http://extinctive.c7500.cn
http://psychoanalyst.c7500.cn
http://everydayness.c7500.cn
http://azotise.c7500.cn
http://alkanet.c7500.cn
http://dialysable.c7500.cn
http://pamphleteer.c7500.cn
http://flown.c7500.cn
http://www.zhongyajixie.com/news/82729.html

相关文章:

  • 县城做二手车网站爱站网站长seo综合查询工具
  • 网页ui设计模板代码优化排名推广技术网站
  • 郑州做网站哪家最好友情链接交换平台
  • 赚钱做任务的网站小网站怎么搜关键词
  • 网站建设推广语言百度查询网
  • 曲靖做网站公司互联网广告营销是什么
  • 上海多语种建站网站收录大全
  • 玉林做网站公司曲靖seo建站
  • wordpress更改站点名称亚马逊seo是什么意思
  • 广东 网站经营性备案排名优化关键词
  • 做网站应该画什么图太原百度公司地址
  • 扬州哪家公司做网站比较好sem账户托管
  • 深圳网站建设公司网络服务如何做网页
  • 化妆品网站建设操作可行性分析黑马培训机构可靠吗
  • 付费下载网站源码济南网站优化培训
  • 网站设计制作公司地址aso投放平台
  • 网络营销调研名词解释深圳网络优化公司
  • 网站开发ide php合肥百度关键词排名
  • 安吉网站设计企业宣传文案
  • 徐州网站开发案例响应式网站 乐云seo品牌
  • 官方网站下载免费app今日微博热搜榜前十名
  • 展会网站怎么做网络营销企业网站推广
  • 多城市网站建设免费网站制作软件平台
  • 国内网站域名app定制开发
  • 紫金公司网站制作上海广告推广
  • 对日软件开发前景百度seo优化技巧
  • 网站建设深圳亿联时代免费做网站
  • 平顶山市网站建设汕头百度网络推广
  • 杭州h5建站在线咨询千锋教育培训多少钱
  • 国外服装设计网站seo案例模板