当前位置: 首页 > news >正文

小程序介绍内容怎么写优化外包服务公司

小程序介绍内容怎么写,优化外包服务公司,郑州网络推广培训,金融网站设计方向一.论文 1.1 P-tuning 区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中 上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入pro…

一.论文

1.1 P-tuning

区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中

上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入promote的过程可以表示为

其中x代表一系列离散的输入令牌,y代表目标(可以理解为希望模型想要给你的回答),e()表示对应的embedding,其实就是将其参数化映射成为伪tokens,即

通过最小化这些参数

1.2 promote生成

嵌入的promote实际上可以理解为不一定离散不相互关联的,而实际上的promote其实应该是高度离散的且具有关联性的,因此作者选择使用双向长短期记忆网络(LSTM),激活函数和MLP来建模这种关系

在推理中,我们只需要输出嵌入h,并且可以丢弃LSTM头

二.代码

本质上是使用一个PromptEncoder来生成伪的embedding添加到原先的embedding中

2.1 训练

训练过程只更新promote_encoder中的参数

 2.1.1 PromptEncoder

在PTuneForLAMA中实例化了PromptEncoder

 PromptEncoder本质上是一个(嵌入 + LSTM + MLP)

import torch
import torch.nn as nnclass PromptEncoder(torch.nn.Module):def __init__(self, template, hidden_size, tokenizer, device, args):super().__init__()self.device = deviceself.spell_length = sum(template)self.hidden_size = hidden_sizeself.tokenizer = tokenizerself.args = args# ent embeddingself.cloze_length = templateself.cloze_mask = [[1] * self.cloze_length[0]  # first cloze+ [1] * self.cloze_length[1]  # second cloze+ [1] * self.cloze_length[2]  # third cloze]self.cloze_mask = torch.LongTensor(self.cloze_mask).bool().to(self.device)self.seq_indices = torch.LongTensor(list(range(len(self.cloze_mask[0])))).to(self.device)# embeddingself.embedding = torch.nn.Embedding(len(self.cloze_mask[0]), self.hidden_size).to(self.device)# LSTMself.lstm_head = torch.nn.LSTM(input_size=self.hidden_size,hidden_size=self.hidden_size // 2,num_layers=2,dropout=self.args.lstm_dropout,bidirectional=True,batch_first=True)self.mlp_head = nn.Sequential(nn.Linear(self.hidden_size, self.hidden_size),nn.ReLU(),nn.Linear(self.hidden_size, self.hidden_size))print("init prompt encoder...")def forward(self):input_embeds = self.embedding(self.seq_indices).unsqueeze(0)output_embeds = self.mlp_head(self.lstm_head(input_embeds)[0]).squeeze()return output_embeds

2.1.2 调用

在PTuneForLAMA的forward函数中调用了embed_input来实现

http://www.zhongyajixie.com/news/23505.html

相关文章:

  • 外贸流程的基本流程图怎么进行网站关键词优化
  • 长春做高端网站公司网页制作三大软件
  • 如何建立自己公司的官方网站邵阳网站seo
  • 自己做的网站如何百度能搜索b站推广网站2022
  • 柳州网站建设网络推广优化招聘
  • 简述网站的建设方案网易游戏推广代理加盟
  • 公司名字大全3个字seo工具大全
  • 佛山做网站的哪个好网络营销产品的特点
  • 山西建筑劳务网站搜索最多的关键词的排名
  • 网站建设的方案厦门网络推广外包
  • 免费网站建设优化百度站长平台
  • 如何搭建静态网站天津建站网
  • 关于网站开发的网店计划书范文seo计费系统源码
  • 青岛网站搭建公司百度客服24小时人工电话
  • 做推广用的网站搜索引擎营销与seo优化
  • 商田科技网站登录百度app
  • 深圳网站建设卓企最新经济新闻
  • 农业机械网站模板seo系统优化
  • seo怎么做关键词排名seo公司
  • 个人做电影网站合法吗我要下载百度
  • 建设小型网站价钱杭州网站seo外包
  • 专业网站建设平台公司全世界足球排名前十位
  • 陕西营销型网站建设公司seo基础知识培训
  • 网站的程序和数据库怎么做白帽seo
  • b2b的典型电商平台廊坊seo建站
  • php制作网站后台seo关键词使用
  • 网站开发者常见问题seo百度站长工具查询
  • 做网络 批发的网站电商平台引流推广
  • 网站域名使用方法百度贴吧官网首页
  • 微信企业网站源码下载seo有什么作用