当前位置: 首页 > news >正文

白山市住房和城乡建设局网站品牌宣传文案范文

白山市住房和城乡建设局网站,品牌宣传文案范文,网站建设的原则,做网站之前要备案是什么意思1.BERT-wwm 1-1 Whole Word Masking Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本,主要更改了原预训练阶段的训练样本生成策略。 原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词,在生成训练样本时&#xff…

1.BERT-wwm

1-1 Whole Word Masking

        Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本,主要更改了原预训练阶段的训练样本生成策略。 

        原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词,在生成训练样本时,这些被分开的子词会随机被mask。 在Whole Word Masking (wwm)中,如果一个完整的词的部分WordPiece子词被mask,则同属该词的其他部分也会被mask。这缓解了在训练前 BERT 中屏蔽部分 Wordpiece 分词的缺点。

2.Chinese-BERT-wwm

2-1 中文BERT-WWM

        2019年哈工大和科大讯飞联合发表中文BERT-WWM模型的论文,使用中文文本对整个单词进行掩蔽,即屏蔽整个单词而不是屏蔽汉字。由于谷歌官方发布的BERT中,中文以字粒度进行切分,没有考虑到传统NLP中的中文分词。 Chinese-BERT-wwm将 Whole Word Mask的方法应用在了中文中,使用了中文维基百科(包括简体和繁体)进行训练,并且使用了哈工大LTP作为分词工具,即对组成同一个的汉字全部进行Mask。

2-2 样例

3.总结

        BERT-WWM对Bert的改进主要体现在mask的方式上,使用全词mask。

        其改进点如下:BERT-WWM不仅仅是连续mask实体词和短语,而是连续mask所有能组成中文词语的字。具体做法是,针对中文,如果一个完整的词的部分字被mask,则同属该词的其他部分也会被mask,即对组成同一个词的汉字全部进行Mask,即为全词Mask。

        这样做的目的是:预训练过程中,模型能够学习到词的语义信息,训练完成后字的embedding就具有了词的语义信息了,这对各类中文NLP任务都是友好的。

http://www.zhongyajixie.com/news/31061.html

相关文章:

  • wordpress页面加轮播图网站推广优化之八大方法
  • 广东专业做网站排名公司哪家好外贸订单一般在哪个平台接?
  • 深圳网站建设服务哪家便宜营销型网站建设专家
  • 服装网站建设课程公司怎么做网站推广
  • 替网站做任务怎么做的长沙官网网站推广优化
  • 网站建设项目软件开发招标文件品牌全网推广
  • 个人备案域名做企业网站百度官方优化软件
  • 网站开发进度缓慢seo优化报价
  • wordpress导出数据库重装青岛seo霸屏
  • 西昌seo天猫seo搜索优化
  • 惠州仲恺住房和城乡建设局网站种子搜索器
  • 高网站建设自己建网站怎么推广
  • 网站关键词的使用浙江网站建设平台
  • 网站页面的滑动怎么做广州网站制作实力乐云seo
  • 深圳网站建设qwyx100营销策划经典案例
  • wordpress 开发功能seo网站关键字优化
  • dede医院网站模板优化推广排名网站教程
  • 如何找枪手做网站深圳网站公司排名
  • 四川省人民政府驻上海办事处百度自然排名优化
  • 山东汽车行业网站开发网址如何被快速收录
  • 西安网站建设小程序百度大数据查询
  • 代做毕业设计找哪个网站好网络营销的三大核心
  • 南阳网站建设域名公司免费网站收录入口
  • 免费学高中课程的软件郑州百度网站快速优化
  • 深圳网站设计 建设科技有限公司我在百度下的订单如何查询
  • 网站上上传图片 怎么做网站网址查询工具
  • 新手做自己的网站教程拉新注册app拿佣金
  • 做网站使用独享服务器的优点优化软件下载
  • 企业网站建设哪家公司好搜索引擎营销sem
  • 网站做竞价对优化有好处吗app制作一个需要多少钱