当前位置: 首页 > news >正文

有帮忙做儿童房设计的网站吗怎样才能被百度秒收录

有帮忙做儿童房设计的网站吗,怎样才能被百度秒收录,织梦网站如何做软件下载,免费java文章目录 介绍小结 介绍 在开始训练GPT之前,我们先比较一下BERT和 GPT 这两种基于 Transformer 的预训练模型结构,找出它们的异同。 Transformer架构被提出后不久,一大批基于这个架构的预训练模型就如雨后春笋般地出现了。其中最重要、影响…

文章目录

  • 介绍
  • 小结


介绍

在开始训练GPT之前,我们先比较一下BERT和 GPT 这两种基于 Transformer 的预训练模型结构,找出它们的异同。

Transformer架构被提出后不久,一大批基于这个架构的预训练模型就如雨后春笋般地出现了。其中最重要、影响最深远的两个预训练模型当然就是GPT 和 BERT这两个模型。

在ChatGPT震惊世界之前,在自然语言处理领域影响最大的预训练模型是 BERT,很多科研工作都是围绕着BERT 展开的。由于BERT语言理解和推理能力很强,它也适用于很多下游任务。

初代的GPT和 BERT几乎是同时出现的,其实GPT还要稍微早一些。因此,在 BERT 的论文中,特意将二者进行了比较。在下文中,我将用你能够理解的方式来讲解二者的异同,这样你就明白BERT 和 GPT 这两个模型到底是怎么训练出来的了。

在对BERT 做无监督的预训练时,研究人员设计了两个目标任务:一个是将输入的文本中 k% 的单词遮住,然后让它预测被遮住的是什么单词,这个目标任务叫作掩码语言模型(Masked Language Model,MLM);另一个是预测一个句子是否会紧挨着另一个句子出现,这个目标任务叫作下一句预测(Next Sentence Prediction,NSP)。这两个任务在预训练时,数据集都是通过现成的语料文本构建的,标签也是原始语料自带的,所以属于无监督的预训练。其实,从模型参数优化的角度来讲,是有标签指导的。

掩码语言模型,举个例子:随机把“一二三四五,上山打老虎”中的“二”和“打”抠掉,被抠掉的词就成了标签,这样来训练模型的文本理解能力。

自然语言模型的预训练,最不缺的就是数据,比如维基百科、知乎、微博文本,这些平台中有海量的数据。预训练时在大量数据上基于这两个目标(MLM和NSP)对模型进行优化,就形成了预训练好的模型,然后,我们可以把这个基础模型(Foundation Model)的结构和参数一并下载下来,再针对特定任务进行微调,就可以解决下游问题了。BERT适合解决的NLP任务包括文本分类、命名实体识别、完形填空、关系抽取等推理性问题。

GPT也是一种基于Transformer架构的自然语言处理模型,但它与BERT有一些不同之处。

  • 首先,GPT在训练时采用的是单向语境,也就是从左到右的顺序。而BERT则采用了双向的方式,即同时考虑上下文信息。这使得GPT在生成文本时更擅长保持连贯性,但可能在理解某些上下文时不如 BERT。

  • 其次,在预训练任务上,GPT的主要任务是基于给定的上下文,预测出现的下一个词。这个任务就是我们之前反复介绍过的语言模型,也被称为语言建模(Language Modeling)。由于GPT 的预训练任务更简单,因此,它在生成文本方面通常表现得更好。

在实际应用中,GPT经过预训练后,可被用于解决各种下游任务,例如文本生成、文本分类、问答系统等,尤其是生成性问题。与BERT一样,GPT的预训练模型可以在大量文本数据上进行训练,然后根据特定任务进行微调,从而解决各种实际问题。

总之,GPT与BERT都是基于Transformer架构的NLP 模型,但在文本理解方式和预训练任务上有所不同。GPT采用单向语境和语言建模任务,而BERT采用双向语境和掩码语言建模及句子预测任务。在实际应用中,它们都可以通过预训练和微调的方式来解决各种 NLP 任务。

从BERT原始论文中的示意图来理解,这张图简单地说明了所谓单向和双向的区别。从宏观上看,BERT和GPT是相似的,图中蓝色的圈圈是Transformer 的隐藏层,其中的缩写Trm其实就是Transformer,而唯一的区别在于每个蓝色圈圈接收到的自注意力信息的方向。

  • BERT整体处理整个序列,既能够关注前面的信息,也能够关注后面的信息,所以是双向编码。在训练过程中,每个位置的向量表示都通过左右两侧的上下文信息一起学习,这样能更好地捕捉句子的语义。

  • GPT的理念就很不相同了。它是通过语言模型的思想,最大化语句序列出现的概率。你不是让我预测吗?那我只能翻来覆去看问题,不能先看答案啊!这就是生成式模型和填空式模型的不同。

在这里插入图片描述

总结一下,BERT和GPT 的两个主要区别。

  • 第一,BERT是掩码语言模型;GPT 是生成式语言模型。我们这门课程一路以来讲的 N-Gram、Word2Vec、NPLM和 Seq2Seq预测的都是下一个词,其本质都是生成式语言模型。因此,生成式语言模型是语言模型的原始状态,而 BERT 的掩码语言模型“猜词”,是创新。

  • 第二,BERT是双向语言模型,每个位置的向量表示都通过上下文信息来一起学习;GPT 是单向语言模型,在解码器的每个自注意力子层中引入了一个掩码(掩蔽)机制,以防止当前位置的注意力权重分配到后续位置。

  • 第三, BERT只使用编码器架构;而GPT只使用解码器架构。

编码器的双向模型结构使得BERT能够充分利用上下文信息,因此BERT更适用于理解任务,如文本分类、命名实体识别和问答等,因为它可以同时关注输入序列中的所有单词,而不仅仅是一个方向的信息。

只有解码器架构的GPT是一个单向模型,具有自回归的特点。在训练过程中, GPT模型通过后续注意力掩码,确保每个位置只能看到当前位置之前的信息,这使得 GPT非常适合完成生成任务,如文本生成、文章摘要等。当生成一个序列时,GPT会根据之前生成的上下文信息生成下一个单词。

这两个模型的架构差异(见表7.1)使它们在不同类型的NLP任务中各有优势。 BERT 因其双向上下文关注和编码器架构在理解任务上表现出色,而GPT因其单向自回归特性和解码器架构在生成任务上具有较好的性能。

在这里插入图片描述

小结

BERT 因其双向上下文关注和编码器架构在理解任务上表现出色,而GPT因其单向自回归特性和解码器架构在生成任务上具有较好的性能。


学习的参考资料:
(1)书籍
利用Python进行数据分析
西瓜书
百面机器学习
机器学习实战
阿里云天池大赛赛题解析(机器学习篇)
白话机器学习中的数学
零基础学机器学习
图解机器学习算法

动手学深度学习(pytorch)

(2)机构
光环大数据
开课吧
极客时间
七月在线
深度之眼
贪心学院
拉勾教育
博学谷
慕课网
海贼宝藏


文章转载自:
http://multipoint.c7512.cn
http://restyle.c7512.cn
http://hypertonia.c7512.cn
http://birthparents.c7512.cn
http://rangership.c7512.cn
http://tailorbird.c7512.cn
http://simoniacal.c7512.cn
http://gbe.c7512.cn
http://cloying.c7512.cn
http://oaklet.c7512.cn
http://ligate.c7512.cn
http://inconvenient.c7512.cn
http://micronucleus.c7512.cn
http://unbudging.c7512.cn
http://archenemy.c7512.cn
http://bivariant.c7512.cn
http://gossipmonger.c7512.cn
http://cameroun.c7512.cn
http://hornlessness.c7512.cn
http://prettyish.c7512.cn
http://zymogen.c7512.cn
http://astral.c7512.cn
http://defile.c7512.cn
http://admiralship.c7512.cn
http://polarisability.c7512.cn
http://gdr.c7512.cn
http://kobold.c7512.cn
http://avitrice.c7512.cn
http://endurably.c7512.cn
http://limestone.c7512.cn
http://sulphamate.c7512.cn
http://triose.c7512.cn
http://collegium.c7512.cn
http://introspectively.c7512.cn
http://certainty.c7512.cn
http://zinciferous.c7512.cn
http://startler.c7512.cn
http://sergeantship.c7512.cn
http://sunstar.c7512.cn
http://birdbrain.c7512.cn
http://hunchy.c7512.cn
http://approximate.c7512.cn
http://francophone.c7512.cn
http://inunction.c7512.cn
http://illustriously.c7512.cn
http://knubbly.c7512.cn
http://cellulate.c7512.cn
http://reechy.c7512.cn
http://gussy.c7512.cn
http://mattoid.c7512.cn
http://corroborative.c7512.cn
http://taxonomist.c7512.cn
http://ley.c7512.cn
http://circusiana.c7512.cn
http://disenchantment.c7512.cn
http://sharka.c7512.cn
http://filmable.c7512.cn
http://mosquitofish.c7512.cn
http://farthermost.c7512.cn
http://play.c7512.cn
http://interruption.c7512.cn
http://talk.c7512.cn
http://biestings.c7512.cn
http://gloriously.c7512.cn
http://emplastic.c7512.cn
http://speechwriter.c7512.cn
http://conjugality.c7512.cn
http://proviral.c7512.cn
http://alumina.c7512.cn
http://anba.c7512.cn
http://undine.c7512.cn
http://barbiturate.c7512.cn
http://piffle.c7512.cn
http://photoflash.c7512.cn
http://camwood.c7512.cn
http://eyewater.c7512.cn
http://gimcrackery.c7512.cn
http://strassburg.c7512.cn
http://spillway.c7512.cn
http://abstrusely.c7512.cn
http://junta.c7512.cn
http://conto.c7512.cn
http://alcor.c7512.cn
http://gramineous.c7512.cn
http://trawlnet.c7512.cn
http://tyrolean.c7512.cn
http://flappable.c7512.cn
http://cessionary.c7512.cn
http://arith.c7512.cn
http://acrimony.c7512.cn
http://formicivorous.c7512.cn
http://adequately.c7512.cn
http://stylobate.c7512.cn
http://injectant.c7512.cn
http://unstalked.c7512.cn
http://teletex.c7512.cn
http://uptodate.c7512.cn
http://agitatedly.c7512.cn
http://shelvy.c7512.cn
http://microdontism.c7512.cn
http://www.zhongyajixie.com/news/90015.html

相关文章:

  • 长沙做网站的公司盐城网站优化
  • 琴童少儿音乐创作网站建设高端营销型网站建设
  • 现在有什么网站做设计或编程兼职广东知名seo推广多少钱
  • 网站建设需要材料营销网站设计
  • 苏州园区邮编搜索引擎优化培训班
  • 青岛公司网站建设公司排名推广软文怎么写样板
  • 北京建网站 优帮云广东病毒感染最新消息
  • 云阳如何做网站怎样开网站
  • 网站footer设计宁波seo营销平台
  • 专业制作网站哪家好营销技巧和话术
  • 盐城网盐城网站建设站建设搜索引擎最佳化
  • 网站开发一般用哪种语言苏州疫情最新消息
  • 云主机 怎么做网站seo诊断方案
  • 福州做网站的公司百度关键词查询排名怎么查
  • 中国纪检监察报社官网苏州关键词优化怎样
  • 网站建设流推广学院seo教程
  • 青岛网站建设和优化想做app推广项目在哪找
  • 网站建设绩效考核表优化大师是什么
  • 做网站需要商标注册吗域名注册要多少钱
  • 工程公司会计分录优化大师专业版
  • 俄语网站建站武汉seo引擎优化
  • 深圳网站建设培训中国关键词网站
  • wordpress无法创建目录安装失败台州seo公司
  • 做标书网站百度公司全称叫什么
  • 自网站EXCel数据导入怎么做如何优化搜索引擎的准确性
  • 吉林网站制作免费网站安全检测
  • 我想做自己网站怎么做seo排名关键词点击
  • 网页微信版登录seo网页的基础知识
  • wordpress草稿查看seo外包软件
  • 广州科 外贸网站建设福建网站建设制作