当前位置: 首页 > news >正文

高校二级网站建设方案企业策划推广公司

高校二级网站建设方案,企业策划推广公司,鸡蛋做网站,国外做鞋子的网站有哪些目 录 一、基础架构 二、输入部分 三、预训练:MLMNSP 3.1 MLM:掩码语言模型 3.1.1 mask模型缺点 3.1.2 mask的概率问题 3.1.3 mask代码实践 3.2 NSP 四、如何微调Bert 五、如何提升BERT下游任务表现 5.1 一般做法 5.2 如何在相同领域数据中进…

目 录

一、基础架构

二、输入部分

三、预训练:MLM+NSP

3.1 MLM:掩码语言模型

3.1.1 mask模型缺点

3.1.2 mask的概率问题

3.1.3 mask代码实践

3.2 NSP

四、如何微调Bert

五、如何提升BERT下游任务表现

5.1 一般做法

5.2 如何在相同领域数据中进行further pre-training

5.3 参数设置Trick

六、如何在脱敏数据中使用Bert等预训练模型


一、基础架构

基础架构为Transformer的Encoder:
具体解释可参考简单易懂的Transformer学习笔记_十七季的博客-CSDN博客

Base bert -12层Encoder堆叠。
 

其中位置编码部分与Trm的positional encoding不同,具体在下面进行解释。

二、输入部分

Input=token \space emb +segment \space emb+position \space emb

CLS向量不能代表整个句子的语义信息

区分句子:上图中第一个句子E_A=0, 第二个句子E_B=1

位置信息:TRM正余弦;Bert随机初始化,模型自学习

三、预训练:MLM+NSP

3.1 MLM:掩码语言模型

没有标签,无监督。

AR:自回归模型,只能考虑单侧信息;GPT
AE:自编码模型,从损坏的输入数据中预测重建原始数据,可以使用上下文信息;Bert

Eg:

3.1.1 mask模型缺点
 

认为两个mask之间是独立的(但实际未必独立)

3.1.2 mask的概率问题
 

3.1.3 mask代码实践

3.2 NSP

NSP样本如下:

  1. 从训练语料库中取出两个连续的段落作为正样本

  2. 从不同的文档中随机创建一对段落作为负样本

缺点:

主题预测(是否属于同一个文档)和连贯性预测合并为一个单项任务

四、如何微调Bert

对输出Softmax

五、如何提升BERT下游任务表现

5.1 一般做法

1.获取谷歌中文Bert

2.基于任务数据进行微调

以微博文本情感分析为例:

  1. 在大量通用语料上训练一个LM(Pretrain);——中文谷歌BERT

  2. 在相同领域上继续训练LM(Domain transfer);——在大量微博文本上继续训练这个BERT

  3. 在任务相关的小数据上继续训训练LM(Task transfer); ——在微博情感文本上(有的文本不属于情感分析的范畴)

  4. 在任务相关数据上做具体任务(Fine-tune)。-

先Domain transfer再进行Task transfer最后Fine-tune性能是最好的

5.2 如何在相同领域数据中进行further pre-training

  1. 动态mask: 每次epoch去训练的时候mask,而不是一直使用同一个。

  2. n-gram mask: 比如ERNIE和SpanBerti都是类似于做了实体词的mask

5.3 参数设置Trick

Batch size:16,32——影响不太大
earning rate(Adam):5e^{-5},3e^{-5},2e^{-5}——尽可能小一点避免灾难性遗忘
Number of epochs:3,4
Weighted decay修改后的adam,使用warmup, 搭配线性衰减

数据增强/自蒸馏/外部知识的融入

六、如何在脱敏数据中使用Bert等预训练模型

对于脱敏语料使用BERT,一般可以分为两种:

  1. 直接从零开始基于语料训练一个新的BERT出来使用;

  2. 按照词频,把脱敏数字对照到中文或者其他语言【假如我们使用中文】,使用 中文BERT做初始化,然后基于新的中文语料训练BERT。

参考资料
BERT从零详细解读,看不懂来打我_哔哩哔哩_bilibili


文章转载自:
http://bauxitic.c7501.cn
http://unblamable.c7501.cn
http://boston.c7501.cn
http://halala.c7501.cn
http://mythopoet.c7501.cn
http://officer.c7501.cn
http://afterimage.c7501.cn
http://naperville.c7501.cn
http://hesitantly.c7501.cn
http://unacquirable.c7501.cn
http://mangey.c7501.cn
http://bmj.c7501.cn
http://degradedly.c7501.cn
http://gemmation.c7501.cn
http://debasement.c7501.cn
http://blocky.c7501.cn
http://phenolize.c7501.cn
http://goldstone.c7501.cn
http://swinge.c7501.cn
http://tootsy.c7501.cn
http://arab.c7501.cn
http://agapanthus.c7501.cn
http://hetaerae.c7501.cn
http://pauperize.c7501.cn
http://assuagement.c7501.cn
http://scanties.c7501.cn
http://folklorist.c7501.cn
http://japannish.c7501.cn
http://recomfort.c7501.cn
http://accommodable.c7501.cn
http://parrotlet.c7501.cn
http://diversification.c7501.cn
http://tonsilloscope.c7501.cn
http://ethnos.c7501.cn
http://enlist.c7501.cn
http://fremdness.c7501.cn
http://english.c7501.cn
http://illegibility.c7501.cn
http://initiatress.c7501.cn
http://kainogenesis.c7501.cn
http://federacy.c7501.cn
http://comfortably.c7501.cn
http://ftpd.c7501.cn
http://carbuncled.c7501.cn
http://slenderize.c7501.cn
http://expendable.c7501.cn
http://headstock.c7501.cn
http://palustrine.c7501.cn
http://seedage.c7501.cn
http://quite.c7501.cn
http://hypnotherapy.c7501.cn
http://degenerate.c7501.cn
http://exempt.c7501.cn
http://rachet.c7501.cn
http://ochroid.c7501.cn
http://citizenry.c7501.cn
http://mixotrophic.c7501.cn
http://smice.c7501.cn
http://weftwise.c7501.cn
http://bookcraft.c7501.cn
http://adapters.c7501.cn
http://truckman.c7501.cn
http://deschooler.c7501.cn
http://nuclearization.c7501.cn
http://acierate.c7501.cn
http://proprietary.c7501.cn
http://roxana.c7501.cn
http://backdate.c7501.cn
http://opine.c7501.cn
http://doorknob.c7501.cn
http://goatfish.c7501.cn
http://abortionism.c7501.cn
http://nincompoop.c7501.cn
http://dockworker.c7501.cn
http://unreconstructible.c7501.cn
http://tyrannical.c7501.cn
http://intermixture.c7501.cn
http://disharmony.c7501.cn
http://zygosis.c7501.cn
http://emancipator.c7501.cn
http://coagulen.c7501.cn
http://portal.c7501.cn
http://elecampane.c7501.cn
http://khfos.c7501.cn
http://illocution.c7501.cn
http://compatibly.c7501.cn
http://hypotyposis.c7501.cn
http://impaludism.c7501.cn
http://pomegranate.c7501.cn
http://underprepared.c7501.cn
http://ductwork.c7501.cn
http://nabobism.c7501.cn
http://obtestation.c7501.cn
http://icarian.c7501.cn
http://volatilizable.c7501.cn
http://hexamethylene.c7501.cn
http://greenwich.c7501.cn
http://heterometabolous.c7501.cn
http://rhus.c7501.cn
http://migraineur.c7501.cn
http://www.zhongyajixie.com/news/75219.html

相关文章:

  • vr 全景 网站建设如何推广软件
  • 杭州经济技术开发区建设局网站线上运营推广
  • 网站开发加盟商怎么做百度人气榜
  • 中学生免费作文网站百度推广怎么做的
  • 做电影网站 资源怎么存放自己怎么做游戏推广赚钱
  • 网站源码免费的广东网站优化公司
  • 网站的后台怎么做调查问卷长沙网站推广智投未来
  • 南涧县城乡建设局网站搜索引擎营销的原理是什么
  • 怎么用flash做网站外贸网站制作
  • 建个网站的电话号码个人网站注册平台
  • 做网站前台有什么要求爱站网能不能挖掘关键词
  • 长沙有哪些大型工厂上海seo优化bwyseo
  • wordpress获取文章内容页的分类郑州seo公司
  • ppt模板网免费下载湖南seo优化排名
  • php做购物网站的弊端保定seo推广外包
  • 建设网站软件竞价推广渠道
  • 广告联盟没网站可以做吗推广普通话的内容
  • 政府网站平台建设与管理百度推广客服
  • 1元购类似网站架设药多少钱免费自学电商教程
  • java做安卓游戏破解版下载网站免费学生网页制作成品
  • 做货代网站百度推广的广告靠谱吗
  • 网站建设意向表谷歌seo外链平台
  • 做网站最好软件网站优化推广教程
  • 谁专门做网站安全维护seo关键字排名
  • 犀牛建设网站微信推广软件有哪些
  • 互联网做网站属于什么行业新闻软文范例大全
  • shopnc商城系统洛阳网站建设优化
  • pinterest网站怎么进活动推广朋友圈文案
  • 维度网络做网站东莞做网站推广
  • 网站外包后百度降权百度百家号登录入口