当前位置: 首页 > news >正文

代发网站建设搜狗搜索引擎入口

代发网站建设,搜狗搜索引擎入口,城乡建设网站职业查询,山西做二级建筑资料在哪个网站评估简单循环神经网络的缺点。 描述门控循环单元(Gated Recurrent Unit,GRU)的架构。 使用GRU进行情绪分析。 将GRU应用于文本生成。 基本RNN通常由输入层、输出层和几个互连的隐藏层组成。最简单的RNN有一个缺点,那就是它们不…

·评估简单循环神经网络的缺点。

·描述门控循环单元(Gated Recurrent Unit,GRU)的架构。

·使用GRU进行情绪分析。

·将GRU应用于文本生成。

基本RNN通常由输入层、输出层和几个互连的隐藏层组成。最简单的RNN有一个缺点,那就是它们不能在序列中保持长期关系。为了纠正这个缺陷,需要在简单RNN网络中添加一个特殊的层,称为门控循环单元。

 

梯度爆炸

梯度不仅会消失,而且还会爆炸。也就是说,前面的层会学习得太快,每次训练迭代之间的值会有很大的偏差,而后面的层的梯度变化不会很快。这是怎么发生的呢?重新审视我们的方程,如果单个项的值远大于1,乘法效应会导致梯度变大,从而造成梯度不稳定,并引起学习问题。

梯度爆炸问题有一个强大的解决方案:裁剪。裁剪仅仅是指阻止梯度的值增长至超过预定义的值。如果该值未被裁剪,由于计算机的典型溢出,你将开始看到网络梯度和权重的NaS(非数字)。设定值上限将有助于避免这一问题。注意,裁剪仅限制梯度的大小,而不限制其方向。

门控循环单元

更新门

在时间步 t,我们首先需要使用以下公式计算更新门 z_t:

 

 其中 x_t 为第 t 个时间步的输入向量,即输入序列 X 的第 t 个分量,它会经过一个线性变换(与权重矩阵 W(z) 相乘)。h_(t-1) 保存的是前一个时间步 t-1 的信息,它同样也会经过一个线性变换。更新门将这两部分信息相加并投入到 Sigmoid 激活函数中,因此将激活结果压缩到 0 到 1 之间。

更新门帮助模型决定到底要将多少过去的信息传递到未来,或到底前一时间步和当前时间步的信息有多少是需要继续传递的。这一点非常强大,因为模型能决定从过去复制所有的信息以减少梯度消失的风险。我们随后会讨论更新门的使用方法,现在只需要记住 z_t 的计算公式就行。

重置门

本质上来说,重置门主要决定了到底有多少过去的信息需要遗忘,我们可以使用以下表达式计算:

 使用维度(n_h,n_x)将时间步长t的输入乘以权重W_r。然后,用维度(n_h,n_h)将前一个时间步长的激活函数(h[t-1])乘以另一组新的权重U_r。注意这里的乘法是矩阵乘法。然后将这两个项相加,并通过sigmoid函数将输出r[t]压缩到[0,1]的范围内。r[t]输出与激活函数具有相同的维度,即(n_h,1)。W_r和U_r参数也需要使用BPTT来学习。

http://www.zhongyajixie.com/news/35160.html

相关文章:

  • 门户网站做seo专注网络营销推广公司
  • 做地方黄页网站关键词歌曲歌词
  • 详情页设计教程seo搜索引擎优化方案
  • 个人建设纪检网站网站seo快速优化技巧
  • 任何做网站站内搜索引擎
  • wordpress插件汉化后更名千度seo
  • 网站费用怎么做分录网络服务器有哪些
  • 新手网站建设教程图书免费网站收录网站推广
  • 怎么知道别人网站是谁做的优化杭州百度快照优化排名
  • 做网站的工具网站站内关键词优化
  • 2024年楼市大局已定刷神马网站优化排名
  • 网站管理模板上海网络推广公司排名
  • 网站上传空间的ip地址吗线下推广方法有哪些
  • 高校网站建设 调查百度地址
  • 成都网站制作哪家专业福州网络推广运营
  • 怎么做外贸网站推广今日最新足球推荐
  • wordpress阿里云图片不显示不出来网站关键词优化办法
  • 网站开发人员介绍公司网络推广营销
  • 郑州免费网站建设哪家好线上直播营销策划方案
  • 青海门户网站建设seo资讯推推蛙
  • 建设摩托车报价及图片seo整站优化服务
  • 国家商标注册查询官网入口真实有效的优化排名
  • 企业为什么要验资郑州seo公司排名
  • 做网站需要简介百度账号快速注册入口
  • 西宁做网站的公司捌君博力请产品推广步骤
  • 网站哪里可以查到做ddos深企在线
  • php的网站模板seo黑帽优化
  • 文学类网站模板今日头条搜索引擎
  • o2o网站运维建设方案东莞网站seo公司哪家大
  • 网络优化网站360手机助手