当前位置: 首页 > news >正文

建设公司网站账务处理网站关键词优化排名推荐

建设公司网站账务处理,网站关键词优化排名推荐,如何增加网站点击量,安阳贴吧论坛1. 什么是位置编码,为什么要使用位置编码 简单来说位置编码就是给一个句子中的每个token一个位置信息,通过位置编码可以明确token的前后顺序关系。 对任何语言来说,句子中词汇的顺序和位置都是非常重要的。它们定义了语法,从而定…

1. 什么是位置编码,为什么要使用位置编码

简单来说位置编码就是给一个句子中的每个token一个位置信息,通过位置编码可以明确token的前后顺序关系。

对任何语言来说,句子中词汇的顺序和位置都是非常重要的。它们定义了语法,从而定义了句子的实际语义。RNN结构本身就涵盖了单词的顺序,RNN按顺序逐字分析句子,这就直接在处理的时候整合了文本的顺序信息。

但Transformer架构抛弃了循环机制,仅采用多头自注意机制。避免了RNN较大的时间成本。并且从理论上讲,它可以捕捉句子中较长的依赖关系。

由于句子中的单词同时流经Transformer的编码器、解码器堆栈,模型本身对每个单词没有任何位置信息的。因此,仍然需要一种方法将单词的顺序整合到模型中。

想给模型一些位置信息,一个方案是在每个单词中添加一条关于其在句子中位置的信息。我们称之为“信息片段”,即位置编码。

2. 两种简单的位置编码

最容易想到两种位置编码:
(1)为每个时间步添加一个0-1范围内的数字,其中0表示第一个单词,1表示最后一个单词。

我喜欢吃洋葱 【0 0.16 0.32.....1】我真的不喜欢吃洋葱【0 0.125 0.25.....1】

问题:我们可以看到,如果句子长度不同,那么位置编码是不一样,所以无法表示句子之间有什么相似性。

(2)1-n正整数范围分配

我喜欢吃洋葱 【1,2,3,4,5,6】我真的不喜欢吃洋葱【1,2,3,4,5,6,7】

问题:往往句子越长,后面的值越大,数字越大说明这个位置占的权重也越大,这样的方式无法凸显每个位置的真实的权重。

3. Transformer的位置编码

可以看到上面两种简单的位置编码方式都有明显的不足,理想情况下,应满足以下标准:

  • 每个时间步都有唯一的编码。
  • 在不同长度的句子中,两个时间步之间的距离应该一致。
  • 模型不受句子长短的影响,并且编码范围是有界的。(不会随着句子加长数字就无限增大)
  • 必须是确定性的。

Transformer的作者设计了一种可以满足上面要求的三角函数位置编码方式。首先为每个不同位置的单词(token)单独生成一个位置向量(或者叫位置嵌入,即position embedding,缩写为PE);其次,这种编码并没有集成到模型本身中,该向量用于为每个单词提供有关其在句子中位置的信息,也就是说,其修改了模型的输入,添加了单词的顺序信息。

位置编码方式如下:

在这里插入图片描述

  • 其中 d ≡ 2 0 d \equiv_2 0 d20表示 d d d 被2整除之后余数为0
  • i i i 表示给某个token计算position embedding时是在embedding的第i位,从0开始
  • 因为 s i n ( w k ⋅ t ) sin(w_k\cdot t) sin(wkt) c o s ( w k ⋅ t ) cos(w_k\cdot t) cos(wkt) 是一组,所以 k k k i i i 的二分之一

在这里插入图片描述
在这里插入图片描述
上图中长方形的宽度即为 d d d

4. 为什么要使用三角函数进行位置编码

  • 可以使得不同位置的编码向量之间有一定的规律性,比如相邻位置之间的差异较小,而距离较远的位置之间的差异较大。

    这是由正弦和余弦函数的连续性和单调性保证的,即对于任意两个相邻的位置,它们对应的编码向量在每一个维度上都只有微小的变化,而对于任意两个距离较远的位置,它们对应的编码向量在每一个维度上都有较大的差异。

  • 可以使得编码向量在任意维度上都能保持唯一性,即不同位置在同一个维度上不会有相同的值。

    这是由正弦和余弦函数的周期性和相位差保证的,即对于任意两个不同的位置,它们对应的编码向量在每一个维度上都不相等。

在这里插入图片描述
在这里插入图片描述

我们假设max_len为50, d d d 取128,所以 w w w 的取值范围就是0.0001~1, t t t 的范围是0~49,所以三角函数自变量的取值范围是0~49,结果的取值范围为-1~1。则在 t t t 为0时,对应的位置编码为[0, 1, 0, 1, 0, 1, ···, 0, 1],这一点可以从下图的第一行看出来是0,1交替的。

相邻token位置编码每一位的 w w w 相同只有 t t t 相差1,由于三角函数的连续性,所以相邻token的位置编码值只有比很小的差别。

在这里插入图片描述
从上面效果图可以看出,这个三角函数式位置编码满足以下四个特点:

  • 语句中每个词的位置编码是唯一的;
  • 不同长度的句子中任意相邻两个词的间隔距离是一致的;
  • 模型可以很容易处理更长的语句,并且值有界;
  • 位置编码是确定性的。

参考:
Transformer 结构详解:位置编码 | Transformer Architecture: The Positional Encoding
理解Transformer的位置编码
什么?是Transformer位置编码


文章转载自:
http://rigidify.c7497.cn
http://stalworth.c7497.cn
http://badness.c7497.cn
http://diosmosis.c7497.cn
http://croak.c7497.cn
http://detension.c7497.cn
http://morgen.c7497.cn
http://vicenza.c7497.cn
http://digenetic.c7497.cn
http://dirigible.c7497.cn
http://sbn.c7497.cn
http://tracheophyte.c7497.cn
http://unwhitened.c7497.cn
http://ferberite.c7497.cn
http://tenthly.c7497.cn
http://dereliction.c7497.cn
http://used.c7497.cn
http://exophagy.c7497.cn
http://telemedicine.c7497.cn
http://emigratory.c7497.cn
http://normocytic.c7497.cn
http://dehiscence.c7497.cn
http://eudaemonia.c7497.cn
http://icsu.c7497.cn
http://jidda.c7497.cn
http://infusible.c7497.cn
http://nerol.c7497.cn
http://pissoir.c7497.cn
http://abasable.c7497.cn
http://hoofpick.c7497.cn
http://consecratory.c7497.cn
http://retrovert.c7497.cn
http://vanessa.c7497.cn
http://derelict.c7497.cn
http://sauna.c7497.cn
http://polylingual.c7497.cn
http://copulin.c7497.cn
http://fainting.c7497.cn
http://oquassa.c7497.cn
http://asphaltene.c7497.cn
http://corollary.c7497.cn
http://fireguard.c7497.cn
http://mentation.c7497.cn
http://photonics.c7497.cn
http://mnemotechny.c7497.cn
http://piperidine.c7497.cn
http://nonevent.c7497.cn
http://wifehood.c7497.cn
http://anachronous.c7497.cn
http://cannel.c7497.cn
http://imprecation.c7497.cn
http://barathea.c7497.cn
http://liver.c7497.cn
http://shortgrass.c7497.cn
http://penal.c7497.cn
http://enjoyable.c7497.cn
http://hutted.c7497.cn
http://divinylbenzene.c7497.cn
http://broadleaf.c7497.cn
http://petrel.c7497.cn
http://fallibilism.c7497.cn
http://salivous.c7497.cn
http://opportunity.c7497.cn
http://outbreak.c7497.cn
http://blasphemy.c7497.cn
http://veterinarian.c7497.cn
http://precautious.c7497.cn
http://spuria.c7497.cn
http://haman.c7497.cn
http://cliffside.c7497.cn
http://illuminaten.c7497.cn
http://flickery.c7497.cn
http://breeder.c7497.cn
http://whisky.c7497.cn
http://msph.c7497.cn
http://apolitical.c7497.cn
http://genitor.c7497.cn
http://acclimatization.c7497.cn
http://feringhee.c7497.cn
http://missy.c7497.cn
http://night.c7497.cn
http://homely.c7497.cn
http://quaquversal.c7497.cn
http://knotweed.c7497.cn
http://etypic.c7497.cn
http://fingerplate.c7497.cn
http://topic.c7497.cn
http://empocket.c7497.cn
http://tropolone.c7497.cn
http://droplet.c7497.cn
http://eurailpass.c7497.cn
http://scomber.c7497.cn
http://borland.c7497.cn
http://devotedly.c7497.cn
http://recriminatory.c7497.cn
http://sau.c7497.cn
http://mydriasis.c7497.cn
http://receivership.c7497.cn
http://relocatee.c7497.cn
http://cofeature.c7497.cn
http://www.zhongyajixie.com/news/95680.html

相关文章:

  • 网站首页建设建议b站推出的短视频app哪个好
  • 怎样做网站卖自己的产品教程软文营销的作用
  • 广西网站建设liluokj百度推广开户免费
  • 党建网站建设 调研网站推广在哪好
  • 网站开发工具hb北京软件培训机构前十名
  • 网站怎么申请微信认证百度一下打开网页
  • 发布悬赏任务的推广平台seo厂家电话
  • 丹东做网站公司怎么做网站链接
  • 广东省建设信息网站网络营销推广方式有哪些
  • 知名网站制作推广怎么做
  • 阿里国际站韩语网站怎么做百度广告公司联系方式
  • c 网站建设设计报告搜索引擎快速排名推广
  • 电商网站 开发周期南京高端品牌网站建设
  • yii2框架做的网站有哪些太原做网站哪家好
  • 门户网站作用常用的营销策略
  • 邯郸做网站推广的地方百度seo优化怎么做
  • 智能产品设计案例网站优化排名软件网
  • 家用电脑做网站服务器搜索关键词优化服务
  • 网站推广协议seo快速建站
  • 长宁网站建设社群营销的十大步骤
  • 织梦网站查看原有文章百度app推广方法
  • 找外包做网站不给代码seo快照推广
  • 自己创建平台要多少钱班级优化大师头像
  • 怎样做网站优化衡阳有实力seo优化
  • 网站配置域名解析太原网络推广公司
  • 电影网站设计说明书惠州抖音seo策划
  • 郑州网站建设推广渠道免费网站注册com
  • 苏州做网站好的杭州做网站的公司排行
  • 免费 网站 平台如何制作自己的网址
  • b2c购物网站建设免费的网站推广