当前位置: 首页 > news >正文

今天31个省新增最新消息视频讲解网站结构优化的内容和方法

今天31个省新增最新消息视频讲解,网站结构优化的内容和方法,axure怎么做响应式网站,wordpress古风主题参考视频: BERT 论文逐段精读【论文精读】_哔哩哔哩_bilibili 背景 BERT算是NLP里程碑式工作!让语言模型预训练出圈! 使用预训练模型做特征表示的时候一般有两类策略: 1. 基于特征 feature based (Elmo)…

参考视频:

 BERT 论文逐段精读【论文精读】_哔哩哔哩_bilibili

背景

BERT算是NLP里程碑式工作!让语言模型预训练出圈!

使用预训练模型做特征表示的时候一般有两类策略:

1. 基于特征 feature based (Elmo)把学到的特征和输入一起放进去做一个很好的特征表达

2. 基于微调 fine-tuning (GPT) 

但是都用的是单向语言模型↑ 预测模型,所以限制了语言架构,比如说只能从左往右读

 Masked Language Model

为了接触限制,BERT用的是一个带掩码的语言模型(MLM)(Masked Language Model),随机选字元,盖住,预测盖住的字

看多模态模型的时候有提到过!↑

 next sentence prediction

在原文中随机取两个句子,让模型判断句子是否相邻

贡献

1. 说明双向信息的重要性

 2.假设有比较好的预训练模型就不用对特定任务做特定的模型改动了

主要就是把前人的结果拓展到深的双向的模型架构上

相关工作

1. Unsupervised Feature-based Approches

2. Unsupervised Fine-tuning Approaches(GPT)

3. 在有标号的数据上进行迁移学习 (Transfer Learning from Supervised Data)

方法

模型

本篇工作调整了L:Transformer模块的个数,H:隐藏层的个数以及A:自注意力头的个数

BERT Base(L=12, H=768, A=12)

BERT Large(L=24, H=1024, A=16)

如何把超参数换算成可学习参数的大小?

可学习参数主要来自嵌入层以及Transformer Block

嵌入层

输入:字典的大小

Transformer Block(自注意力,MLP)

自注意力头个数A x 64 

Transformer Block 的可学习参数是H^2 *4 (自注意力)

MLP H^2 *8

此处合起来Transformer的参数是(H^2 *12)*L

输出:隐藏单元的个数H

总参数(36K * H + L*H*12)=110M

输入和输出

输入:

序列(sequence):既可以是句子,也可是句子对

切词方法: WordPiece,节省参数

序列的第一个词永远是序列[CLS],因为bert希望它最后输出代表整个序列的一个信息

把两个句子合在一起的时候需要区分两个句子:

1)把每个句子后面放上特殊的词[SEP]

2) 学一个嵌入层

对每个词元进入BERT的向量表示,是词元本身的embedding,加句子embedding加position embedding

缺点:

与GPT(Improving Language Understanding by Generative Pre-Training)比,BERT用的是编码器,GPT用的是解码器。BERT做机器翻译、文本的摘要(生成类的任务)不好做。

写的不算全,后面看到后面补。

http://www.zhongyajixie.com/news/50336.html

相关文章:

  • 做三级分销商城网站设计b站推广链接
  • 在线生成电子印章抖音seo是什么意思
  • 盐田做网站的公司最近中国新闻热点大事件
  • 腾讯云点播做视频网站免费推广的方式有哪些
  • 东莞免费做网站公司网络营销方案怎么写
  • 绍兴cms建站模板seo平台怎么样
  • 网站推广的策略有哪些sem是什么的缩写
  • 网页画图工具如何优化关键词排名到首页
  • 大型企业网站建设网站推广的概念
  • 学习网站建设的书seo收费标准
  • 上海徐汇做网站火星时代教育培训机构学费多少
  • 新闻录入网站模板网站建设纯免费官网
  • 没有营业执照 怎么做网站行者seo
  • 做同城网站需要哪些域名seo站长工具
  • 国际加速器永久免费版北京seo的排名优化
  • 凯里网站建设公司百度指数峰值查询
  • 去掉wordpress页面的分类归档厦门seo优化外包公司
  • 网站建设属于什么服务企业推广策划书
  • 上海网站建设 浦东深圳百度代理
  • 网站建设的重点百度关键词搜索趋势
  • pyton 网站开发竞价培训课程
  • 网站建设开发语言seo建站的步骤
  • 做全景哪个网站不模糊seo搜索引擎优化技术
  • 电子税局网站开发服务项目文档seo网站管理招聘
  • 网页打开app wordpress北京seo公司
  • smartschool 学校网站管理系统域名注册网站有哪些
  • 全国工商企业查询平台绍兴seo网站管理
  • 网站布局教程重庆搜索引擎seo
  • 咸阳网站开发联系方式网站seo排名优化软件
  • 公务员 做网站盈利宁波优化系统