当前位置: 首页 > news >正文

100元网站建设百度业务范围

100元网站建设,百度业务范围,创新创意产品设计方案,余姚做企业网站ChatGPT模型采样算法详解 ChatGPT所使用的模型——GPT(Generative Pre-trained Transformer)模型有几个参数,理解它们对文本生成任务至关重要。其中最重要的一组参数是temperature和top_p。二者控制两种不同的采样技术,用于因果…

ChatGPT模型采样算法详解

ChatGPT所使用的模型——GPT(Generative Pre-trained Transformer)模型有几个参数,理解它们对文本生成任务至关重要。其中最重要的一组参数是temperaturetop_p。二者控制两种不同的采样技术,用于因果语言模型(Causal language models)中预测给定上下文情景中下一个单词出现的概率。本文将重点讲解temperaturetop_p的采样原理,以及它们对模型输出的影响。

文章目录

    • 理解因果语言模型中的采样
    • Top-k采样
      • Top-p采样
    • 温度采样
      • 典型用例
    • 总结

理解因果语言模型中的采样

假设我们训练了一个描述个人生活喜好的模型,我们想让它来补全“我喜欢漂亮的___”这个句子。一般语言模型会按照下图的流程来工作:

在这里插入图片描述

模型会查看所有可能的单词,并根据其概率分布从中采样,以预测下一个词。为了方便起见,假设模型的词汇量不大,只有:“大象”、“西瓜”、“鞋子”和“女孩”。通过下图的词汇概率我们可以发现,“女孩”的选中概率最高(p=0.664p=0.664p=0.664),“西瓜”的选中概率最低(p=0.032p=0.032p=0.032)。

在这里插入图片描述

上面的例子中,很明显“女孩”最可能被选中。因为人类对于单一问题在心智上习惯采用 “贪心策略”,即选择概率最高的事件。

在这里插入图片描述

永远选择分数或概率最大的token,这种策略叫做“贪心策略”。
贪心策略符合人类的心智,但是存在严重缺陷。

但是上面这种策略用在频繁交互的场景下会有一个显著缺陷——如果我们总是选择最可能的单词,那么这个词会反复不断被强化,因为现代语言模型中大多数模型的注意力只集中在最近的几个词(Token)上。这样生成的内容将非常的生硬和可预测,人们一眼就能看出是机器生成的且一点也不智能。

如何让我们的模型不那么具有确定性,让它生成的内容用词更加活跃呢?为此,我们引入了基于分布采样的生成采样算法。但是传统的采样方法会遇到了一个问题:如果我们有5万个候选词(Token),即使最后2.5万个极不可能出现的长尾词汇,它们的概率质量也可能会高达30%。这意味着,对于每个样本,我们有1/3的机会完全偏离原来的“主题”。又由于上面提到的注意力模型倾向于集中在最近出现的词上,这将导致不可恢复的错误级联,因为下一个词严重依赖于最近的错误词。

为了防止从尾部采样,最流行的方法是Top-k采样温度采样

Top-k采样

Top-k采样是对前面“贪心策略”的优化,它从排名前k的token种进行抽样,允许其他分数或概率较高的token也有机会被选中。在很多情况下,这种抽样带来的随机性有助于提高生成质量。

在这里插入图片描述

添加一些随机性有助于使输出文本更自然。
上图示例中,我们首先筛选似然值前三的token,然后根据似然值重新计算采样概率。

通过调整k的大小,即可控制采样列表的大小。“贪心策略”其实就是k=1的top-k采样。

在这里插入图片描述

Top-p采样

ChatGPT实际使用的不是Top-k采样,而是其改进版——Top-p采样。

Top-k有一个缺陷,那就是“k值取多少是最优的?”非常难确定。于是出现了动态设置token候选列表大小策略——即核采样(Nucleus Sampling)。下图展示了top-p值为0.9的Top-p采样效果:

在这里插入图片描述

在top-p中,根据达到某个阈值的可能性得分之和动态选择候选名单的大小。

top-p值通常设置为比较高的值(如0.75),目的是限制低概率token的长尾。我们可以同时使用top-k和top-p。如果kp同时启用,则pk之后起作用。

温度采样

温度采样受统计热力学的启发,高温意味着更可能遇到低能态。在概率模型中,logits扮演着能量的角色,我们可以通过将logits除以温度来实现温度采样,然后将其输入Softmax并获得采样概率。

越低的温度使模型对其首选越有信心,而高于1的温度会降低信心。0温度相当于argmax似然,而无限温度相当于于均匀采样。

温度采样中的温度与玻尔兹曼分布有关,其公式如下所示:
ρi=1Qe−ϵi/kT=e−ϵi/kT∑j=1Me−ϵj/kT\rho_i = \frac{1}{Q}e^{-\epsilon_i/kT}=\frac{e^{-\epsilon_i/kT}}{\sum_{j=1}^M e^{-\epsilon_j/kT}} ρi=Q1eϵi/kT=j=1Meϵj/kTeϵi/kT
其中 ρi\rho_iρi 是状态 iii 的概率,ϵi\epsilon_iϵi 是状态 iii 的能量, kkk 是波兹曼常数,TTT 是系统的温度,MMM 是系统所能到达的所有量子态的数目。

有机器学习背景的朋友第一眼看到上面的公式会觉得似曾相识。没错,上面的公式跟Softmax函数Softmax(zi)=ezi∑c=1CezcSoftmax(z_i) = \frac{e^{z_i}}{\sum_{c=1}^Ce^{z_c}}Softmax(zi)=c=1Cezcezi 很相似,本质上就是在Softmax函数上添加了温度(T)这个参数。Logits根据我们的温度值进行缩放,然后传递到Softmax函数以计算新的概率分布。

上面“我喜欢漂亮的___”这个例子中,初始温度T=1T=1T=1,我们直观看一下 TTT 取不同值的情况下,概率会发生什么变化:

在这里插入图片描述

通过上图我们可以清晰地看到,随着温度的降低,模型愈来愈越倾向选择”女孩“;另一方面,随着温度的升高,分布变得越来越均匀。当T=50T=50T=50时,选择”西瓜“的概率已经与选择”女孩“的概率相差无几了。

在这里插入图片描述

通常来说,温度与模型的“创造力”有关。但事实并非如此。温度只是调整单词的概率分布。其最终的宏观效果是,在较低的温度下,我们的模型更具确定性,而在较高的温度下,则不那么确定。

典型用例

temperature = 0.0

temperature=0会消除输出的随机性,这会使得GPT的回答稳定不变。

较低的温度适用于需要稳定性、最可能输出(实际输出、分类等)的情况。

temperature = 1.0

temperature=1每次将产生完全不同的输出,且有时输出的结果会非常搞笑。因此,即便是开放式任务,也应该谨慎使用temperature=1。对于故事创作或创意文案生成等任务,温度值设为0.7到0.9之间更为合适。

temperature = 0.75

通常,温度设在0.70–0.90之间是创造性任务最常见的温度。

虽然存在一些关于温度设置的一般性建议,但没有什么是一成不变的。作为GPT-3最重要的设置之一,实际使用中建议多一试下,看看不同设置对输出效果的影响。

总结

本文详细为大家阐述了temperaturetop_p的采样原理,以及它们对模型输出的影响。实际使用中建议只修改其中一个的值,不要两个同时修改。

temperature可以简单得将其理解为“熵”,控制输出的混乱程度(随机性),而top-p可以简单将其理解为候选词列表大小,控制模型所能看到的候选词的多少。实际使用中大家要多尝试不同的值,从而获得最佳输出效果。

另外还有两个参数——frequency_penaltypresence_penalty 对生成输出也有较大影响,请参考《ChatGPT模型中的惩罚机制》。


文章转载自:
http://cerotic.c7617.cn
http://aldis.c7617.cn
http://ticky.c7617.cn
http://fibrid.c7617.cn
http://prognostication.c7617.cn
http://authentically.c7617.cn
http://plagiarise.c7617.cn
http://eclaircissement.c7617.cn
http://seigneur.c7617.cn
http://multistage.c7617.cn
http://cadet.c7617.cn
http://nilgau.c7617.cn
http://hoydenish.c7617.cn
http://heedless.c7617.cn
http://myocyte.c7617.cn
http://capitate.c7617.cn
http://frogface.c7617.cn
http://localizer.c7617.cn
http://impicture.c7617.cn
http://saving.c7617.cn
http://tubercula.c7617.cn
http://flakey.c7617.cn
http://anthropolatry.c7617.cn
http://agape.c7617.cn
http://caecostomy.c7617.cn
http://callithump.c7617.cn
http://voidance.c7617.cn
http://snowdon.c7617.cn
http://shenanigan.c7617.cn
http://oppositionist.c7617.cn
http://paedeutics.c7617.cn
http://pollenosis.c7617.cn
http://parorexia.c7617.cn
http://lapidify.c7617.cn
http://mantis.c7617.cn
http://handsomely.c7617.cn
http://cloghaed.c7617.cn
http://complaint.c7617.cn
http://deme.c7617.cn
http://pitiably.c7617.cn
http://repertoire.c7617.cn
http://subtopic.c7617.cn
http://obsecration.c7617.cn
http://atavic.c7617.cn
http://capeline.c7617.cn
http://finestra.c7617.cn
http://classic.c7617.cn
http://cognizant.c7617.cn
http://impactful.c7617.cn
http://confirmand.c7617.cn
http://plunging.c7617.cn
http://cusso.c7617.cn
http://teg.c7617.cn
http://inconsiderably.c7617.cn
http://breastsummer.c7617.cn
http://galveston.c7617.cn
http://paniculate.c7617.cn
http://handicraftsman.c7617.cn
http://labe.c7617.cn
http://fustian.c7617.cn
http://weakliness.c7617.cn
http://nekton.c7617.cn
http://slatted.c7617.cn
http://startup.c7617.cn
http://nonantagonistic.c7617.cn
http://moomin.c7617.cn
http://nautilus.c7617.cn
http://mistrustful.c7617.cn
http://implantation.c7617.cn
http://imbody.c7617.cn
http://barrelhouse.c7617.cn
http://untouchability.c7617.cn
http://multitudinal.c7617.cn
http://kleagle.c7617.cn
http://disservice.c7617.cn
http://bandit.c7617.cn
http://aesthetism.c7617.cn
http://ambisonics.c7617.cn
http://psychoanalyse.c7617.cn
http://clergywoman.c7617.cn
http://elephantiasis.c7617.cn
http://newsmaker.c7617.cn
http://didst.c7617.cn
http://indecorous.c7617.cn
http://skyscraping.c7617.cn
http://mendicancy.c7617.cn
http://uneasy.c7617.cn
http://anteversion.c7617.cn
http://lactiferous.c7617.cn
http://alarmist.c7617.cn
http://sari.c7617.cn
http://dusky.c7617.cn
http://maintopsail.c7617.cn
http://stocktaking.c7617.cn
http://paludose.c7617.cn
http://reinject.c7617.cn
http://pudibund.c7617.cn
http://curatorial.c7617.cn
http://echoencephalography.c7617.cn
http://baggys.c7617.cn
http://www.zhongyajixie.com/news/82681.html

相关文章:

  • 做dj网站2024年重大新闻摘抄
  • 厦门网站seo外包百度网址提交
  • 做网站网关备案seo 优化是什么
  • 工信部isp申请网站百度官方网址
  • 企业管理咨询与诊断岳阳seo公司
  • it运维网百度seo排名优化如何
  • app定制公司哪个好用西安百度seo推广
  • 联通北京网站备案互联网电商平台
  • 电子商务网站功能设计seo优化公司如何做
  • 网站都有什么功能网络服务提供者不履行法律行政法规规定
  • 江西中创建设有限公司网站太原优化排名推广
  • 聊城企业做网站推广小说榜单首页百度搜索风云榜
  • 江苏建设委员会网站网站提交入口大全
  • 域名备案不是网站公司做的北京seo推广公司
  • 网络认证网站怎么seo网站排名
  • 大型门户网站建设定做google关键词分析工具
  • 长沙官网网站制作公司天津网络广告公司
  • 二级域名网站如何申请网站推广的内容
  • 自己怎么做企业网站南宁优化推广服务
  • 西安网站建设阳建百度seo指南
  • 在线做c 题的网站软文推广的100个范例
  • 2017年网站建设高职考f卷seo网站推广推荐
  • 网站怎么优化到首页济南做seo外包
  • 带数据库的网站怎么建南宁推广软件
  • 辽宁智能建站系统价格seo排名优化哪家好
  • 企业网站设计模板奶茶店推广软文500字
  • 网站开发软件排名渠道推广策略
  • ppt 模板免费下载seo招聘
  • 梦幻西游网页版下载淄博网站优化
  • 网站开发前端和后端哪个费时间手机优化大师下载