当前位置: 首页 > news >正文

宁波做网站优化多少钱网络公司取什么名字好

宁波做网站优化多少钱,网络公司取什么名字好,网络规划设计师工作,如何做网站站长人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌…

人不走空

                                                                      

      🌈个人主页:人不走空      

💖系列专栏:算法专题

⏰诗词歌赋:斯是陋室,惟吾德馨

目录

      🌈个人主页:人不走空      

💖系列专栏:算法专题

⏰诗词歌赋:斯是陋室,惟吾德馨

2.1 架构设计

自注意力机制(Self-Attention Mechanism)

前馈神经网络(Feedforward Neural Network)

残差连接(Residual Connection)和层归一化(Layer Normalization)

最终输出

2.2 自注意力机制详解

2.3 多头注意力机制

2.4 位置编码

2.5 训练过程

2.5.1 预训练

2.5.2 微调

作者其他作品:


 

2.1 架构设计

ChatGPT的核心架构是基于Transformer解码器。Transformer解码器主要由多个堆叠的解码器层(Decoder Layer)组成,每个层包括以下几个关键组件:

自注意力机制(Self-Attention Mechanism)

自注意力机制是解码器的核心组件之一,用于捕捉输入序列中各个单词之间的关系。通过计算查询(Query)、键(Key)和值(Value)向量之间的相似度,自注意力机制能够为每个单词分配不同的权重,反映其在当前上下文中的重要性。这一机制使得模型能够在生成过程中考虑到整个输入序列的各个部分,从而生成连贯且上下文相关的文本。

前馈神经网络(Feedforward Neural Network)

前馈神经网络由两个线性变换和一个非线性激活函数(通常是ReLU)组成。它对每个位置的表示进行非线性变换,以增强模型的表达能力。具体步骤如下:

  1. 第一层线性变换:将输入向量映射到一个更高维度的隐空间。
  2. 激活函数:应用ReLU激活函数,增加模型的非线性特性。
  3. 第二层线性变换:将激活后的向量映射回原始维度。

这种双层结构能够捕捉复杂的特征和模式,进一步提升模型的生成质量。

残差连接(Residual Connection)和层归一化(Layer Normalization)

为了缓解深层神经网络中常见的梯度消失和梯度爆炸问题,Transformer解码器引入了残差连接和层归一化技术。

  • 残差连接:在每个子层的输入和输出之间添加一个直接连接,使得输入能够跳跃式地传递到后面的层。这种连接方式不仅有助于梯度的反向传播,还能加快模型的收敛速度。
  • 层归一化:对每一层的输入进行归一化处理,使得输入在不同训练阶段保持稳定,有助于加速训练过程和提高模型的稳定性。

每个解码器层的输入是前一层的输出,经过自注意力机制、前馈神经网络、残差连接和层归一化的处理后,传递给下一层。通过多层堆叠,模型能够逐层提取和整合更加抽象和高层次的特征。

最终输出

在所有解码器层处理完毕后,模型的输出被传递到一个线性层,该层将高维表示映射到词汇表的维度。接着,通过Softmax函数计算每个单词的概率分布。这一步骤将解码器的输出转换为一个概率分布,用于预测下一个单词。整个生成过程是自回归的,即每次生成一个单词,然后将其作为输入,用于生成下一个单词。

2.2 自注意力机制详解

自注意力机制是Transformer中最关键的部分,它通过计算查询、键和值的点积来捕捉输入序列中的依赖关系。具体步骤如下:

  1. 查询、键和值的生成:输入序列通过线性变换生成查询(Q)、键(K)和值(V)矩阵。

    Q=XWQ​,K=XWK​,V=XWV​

  2. 计算注意力权重:通过点积计算查询和键的相似度,然后除以一个缩放因子(通常是键的维度的平方根),最后通过Softmax函数将相似度转换为概率分布。

  3. 加权求和:用注意力权重对值进行加权求和,得到每个位置的注意力表示。

2.3 多头注意力机制

为了捕捉输入序列中的多种关系,Transformer引入了多头注意力机制(Multi-Head Attention)。具体来说,将查询、键和值矩阵分成多个头,每个头独立地计算注意力,然后将各头的输出拼接起来,再通过线性变换得到最终的输出。

多头注意力机制的公式如下:

MultiHead(Q,K,V)=Concat(head1​,head2​,…,headh​)WO​

其中,每个头的计算方法为:

headi​=Attention(QWQi​​,KWKi​​,VWVi​​)

2.4 位置编码

Transformer没有循环结构,因此无法自然地捕捉序列中的位置信息。为了解决这个问题,Transformer引入了位置编码(Positional Encoding)。位置编码通过正弦和余弦函数生成,并加到输入序列的词嵌入中,使得模型能够区分序列中不同位置的单词。

位置编码的公式如下:

其中,pospospos表示位置,iii表示维度的索引,dmodeld_{model}dmodel​表示词嵌入的维度。

2.5 训练过程

ChatGPT的训练过程包括两个主要阶段:预训练和微调。

2.5.1 预训练

在预训练阶段,模型在大规模的无监督文本数据上进行训练。训练目标是最大化给定上下文条件下生成下一个单词的概率。具体来说,模型通过计算预测单词与真实单词之间的交叉熵损失来进行优化。

预训练的公式如下:

其中,xtx_txt​表示序列中的第ttt个单词,TTT表示序列的长度。

2.5.2 微调

在微调阶段,模型通过监督学习和强化学习在特定任务或领域的数据上进行进一步训练。监督学习使用标注数据进行训练,强化学习则通过与环境的交互,优化特定的奖励函数。

微调过程包括以下步骤:

  1. 监督学习微调:使用人工标注的数据进行监督学习,优化模型在特定任务上的性能。
  2. 强化学习微调:使用强化学习算法(如策略梯度)进行优化,通过与环境的交互,最大化奖励函数。

强化学习微调的公式如下:

其中,πθ​表示模型的策略,R(x)表示奖励函数。


作者其他作品:

【Java】Spring循环依赖:原因与解决方法

OpenAI Sora来了,视频生成领域的GPT-4时代来了

[Java·算法·简单] LeetCode 14. 最长公共前缀 详细解读

【Java】深入理解Java中的static关键字

[Java·算法·简单] LeetCode 28. 找出字a符串中第一个匹配项的下标 详细解读

了解 Java 中的 AtomicInteger 类

算法题 — 整数转二进制,查找其中1的数量

深入理解MySQL事务特性:保证数据完整性与一致性

Java企业应用软件系统架构演变史 


文章转载自:
http://autodecrement.c7498.cn
http://feudatorial.c7498.cn
http://traveller.c7498.cn
http://pelles.c7498.cn
http://ectoderm.c7498.cn
http://bonne.c7498.cn
http://lumisome.c7498.cn
http://honiton.c7498.cn
http://robertsonian.c7498.cn
http://brasil.c7498.cn
http://idc.c7498.cn
http://sapped.c7498.cn
http://embed.c7498.cn
http://cadetcy.c7498.cn
http://conation.c7498.cn
http://nickle.c7498.cn
http://distraction.c7498.cn
http://galactose.c7498.cn
http://dynacomm.c7498.cn
http://treaty.c7498.cn
http://accrescent.c7498.cn
http://cerebration.c7498.cn
http://insofar.c7498.cn
http://argumentation.c7498.cn
http://whereafter.c7498.cn
http://sandbluestem.c7498.cn
http://retool.c7498.cn
http://virginhood.c7498.cn
http://inburst.c7498.cn
http://dynamax.c7498.cn
http://watchful.c7498.cn
http://atempo.c7498.cn
http://mosotho.c7498.cn
http://catacomb.c7498.cn
http://interactant.c7498.cn
http://paludicolous.c7498.cn
http://quotidian.c7498.cn
http://photoreaction.c7498.cn
http://anywhither.c7498.cn
http://wetproof.c7498.cn
http://flurr.c7498.cn
http://hemoglobinuria.c7498.cn
http://soekarno.c7498.cn
http://peronism.c7498.cn
http://hesperornis.c7498.cn
http://noticeable.c7498.cn
http://dermatozoon.c7498.cn
http://ilex.c7498.cn
http://isabelline.c7498.cn
http://splatter.c7498.cn
http://marbleize.c7498.cn
http://tallis.c7498.cn
http://submedian.c7498.cn
http://deplane.c7498.cn
http://dermatozoon.c7498.cn
http://speir.c7498.cn
http://trusteeship.c7498.cn
http://conchiolin.c7498.cn
http://szeged.c7498.cn
http://sudamina.c7498.cn
http://antipersonnel.c7498.cn
http://rhino.c7498.cn
http://rounded.c7498.cn
http://agrologist.c7498.cn
http://ecce.c7498.cn
http://impecunious.c7498.cn
http://mahoe.c7498.cn
http://available.c7498.cn
http://twiddle.c7498.cn
http://squaresville.c7498.cn
http://hodden.c7498.cn
http://cablephoto.c7498.cn
http://pastie.c7498.cn
http://intertwist.c7498.cn
http://culpably.c7498.cn
http://suzuribako.c7498.cn
http://observe.c7498.cn
http://puissance.c7498.cn
http://cephalochordate.c7498.cn
http://streaked.c7498.cn
http://languidly.c7498.cn
http://saltirewise.c7498.cn
http://outargue.c7498.cn
http://mazy.c7498.cn
http://nevadan.c7498.cn
http://dodecagonal.c7498.cn
http://mambo.c7498.cn
http://lombardy.c7498.cn
http://pharmacotherapy.c7498.cn
http://flippancy.c7498.cn
http://shetland.c7498.cn
http://bursary.c7498.cn
http://augmentor.c7498.cn
http://volumeless.c7498.cn
http://lipocyte.c7498.cn
http://erato.c7498.cn
http://unseduced.c7498.cn
http://shrink.c7498.cn
http://stamnos.c7498.cn
http://quantitatively.c7498.cn
http://www.zhongyajixie.com/news/53214.html

相关文章:

  • 滕州市住房城乡建设局网站网络推广引流方式
  • 做市场调研的网站一站式营销平台
  • 专业网站制作设营销型网站建设模板
  • 铜川网站建设优化排名 生客seo
  • 电商网站用什么做的苏州企业网站关键词优化
  • 顺德电子画册网站建设营销渠道管理
  • 电源网站模版重庆最新数据消息
  • 做算命类网站违法吗?百度seo指数查询
  • Wordpress中毒企业站seo报价
  • 成都网站建设v竞价网站推广
  • 内江做网站多少钱东莞推广公司
  • 重庆企业网站备案要多久时间百度竞价排名危机事件
  • 亳州市建设局网站最近的国际新闻热点
  • 江苏省建设主管部门网站成都官网seo厂家
  • 网站建设费计入销售费用的子目百度指数分析报告
  • 企业网站建设立项书百度网盘下载app
  • 手机创建个人网站 免费百度登录个人中心
  • 做网站时新闻的背景图宁波 seo排名公司
  • 外链博客网站谷歌搜索引擎在线
  • 餐饮品牌策划设计公司网站seo优化案例
  • 做淘宝店和做网站微信营销软件有哪些
  • 安居客做网站西安霸屏推广
  • 做网站的资金来源上海网站排名优化怎么做
  • 旅游网站建设与规划深圳百度代理
  • 建设中网站首页网站seo诊断
  • jsp 网站建设百度权重是什么
  • 可以做网站的appgoogle 浏览器
  • 网站评论管理怎么做东莞海外网络推广
  • 网站建设公司代理网站seo优化教程
  • 如何加强网站建设和信息宣传百度文库官网入口