当前位置: 首页 > news >正文

丹阳网站设计教你免费申请个人网站

丹阳网站设计,教你免费申请个人网站,wordpress添加表,义乌做网站公司哪家好残差连接和层规范化 层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。 以下代…

残差连接和层规范化

层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。

以下代码对比不同维度的层规范化和批量规范化的效果。

ln = nn.LayerNorm(2)
bn = nn.BatchNorm1d(2)
X = torch.tensor([[1, 2], [2, 3]], dtype=torch.float32)
# 在训练模式下计算X的均值和方差
print('layer norm:', ln(X), '\nbatch norm:', bn(X))
layer norm: tensor([[-1.0000,  1.0000],[-1.0000,  1.0000]], grad_fn=<NativeLayerNormBackward0>)
batch norm: tensor([[-1.0000, -1.0000],[ 1.0000,  1.0000]], grad_fn=<NativeBatchNormBackward0>)

现在可以使用残差连接和层规范化来实现AddNorm类。暂退法也被作为正则化方法使用。

#@save
class AddNorm(nn.Module):"""残差连接后进行层规范化"""def __init__(self, normalized_shape, dropout, **kwargs):super(AddNorm, self).__init__(**kwargs)self.dropout = nn.Dropout(dropout)self.ln = nn.LayerNorm(normalized_shape)def forward(self, X, Y):return self.ln(self.dropout(Y) + X)

残差连接要求两个输入的形状相同,以便加法操作后输出张量的形状相同。 

add_norm = AddNorm([3, 4], 0.5)
add_norm.eval()
add_norm(torch.ones((2, 3, 4)), torch.ones((2, 3, 4))).shape

 torch.Size([2, 3, 4])

 

 

 

http://www.zhongyajixie.com/news/46793.html

相关文章:

  • 网站建设 海豚弯服务营销的概念
  • 永川网站建设品牌软文案例
  • 苏州网络科技公司有哪些seo怎么收费seo
  • 做银行设计有好的网站参考吗百度手机网页版入口
  • 嘉兴做网站河南百度推广公司
  • 南通市住房建设局网站怎么自己做网址
  • 网站制作不用备案房地产最新消息
  • 微信版网站制作网站域名查询ip地址
  • 网站推广运作怎么做北京自动seo
  • 传统企业公司网站优化案例百度seo关键词工具
  • 个人做网站哪种类型的网站好品牌营销经典案例
  • 做海外市场什么网站推广seo网络推广员招聘
  • 网站优化怎么做外链百度seo排名原理
  • 网站分辨率做多大站长工具一区
  • 上海网站建设 paiky国际新闻快报
  • 番禺网站开发哪家强全国疫情高峰感染高峰进度查询
  • 深圳市龙岗区做网站的公司北京网络营销策划公司
  • 怎样建网站步骤百度推广开户渠道公司
  • 电子商务网站建设的目标seo云优化如何
  • php动态网站开发是干嘛的成品网站源码1688免费推荐
  • 自己做的网站怎么删除最新足球赛事
  • 牡丹江住房和城乡建设厅网站百度推广代理商赚钱吗
  • wordpress安卓源码分析搜索引擎优化通常要注意的问题有
  • 做街舞网站的素材网址查询工具
  • wordpress打赏后看全部资源网站优化排名优化
  • 旅游建设网站手机百度账号申请注册
  • 互联网网站建设问卷调查站长seo
  • 在线捐款网站开发百度推广代理公司哪家好
  • 帮人做推广的网站网站怎么收录到百度
  • 营销型网站案例易网拓佛山网站快速排名提升