当前位置: 首页 > news >正文

win8扁平化网站a5站长网网站交易

win8扁平化网站,a5站长网网站交易,4a广告公司什么意思,做网站如何避免侵权1 行为序列建模总体架构 2 SIM模型的不足和为什么需要ETA模型 SIM实现了长周期行为序列的在线建模,其GSU检索单元居功至伟。但不论Hard-search还是Soft-search,都存在如下不足: GSU检索的目标与主模型不一致。Hard-search通过类目属性来筛选…

1 行为序列建模总体架构

2 SIM模型的不足和为什么需要ETA模型

SIM实现了长周期行为序列的在线建模,其GSU检索单元居功至伟。但不论Hard-search还是Soft-search,都存在如下不足:

  1. GSU检索的目标与主模型不一致。Hard-search通过类目属性来筛选历史行为,但不同类目不代表相关度低,比如啤酒和尿布。Soft-search通过辅助模型的Embedding来检索top-K近邻,但辅助模型与主模型有不一致问题。
  2. GSU检索的索引更新频率与主模型不一致。索引规模一般很大,通常需要离线构建,很难在线频繁更新。而目前很多精排模型都实现了在线学习,其更新频率很快。这就导致GSU检索时可能还在使用已过时的离线索引。

要解决这一问题,最好的办法是将近邻搜索从离线转化为在线。但在线进行内积计算求相似度,对于长序列来说,耗时过高。所以关键在于如何找到一种快速进行相似度计算的方法。ETA模型应运而生。

ETA End-to-End Target Attention)由阿里巴巴推荐团队于2021年提出,全称“ End-to-End User Behavior Retrieval in Click-Through Rate Prediction Model[9]。它受到NLP中Reformer模型的启发,通过SimHash实现了快速计算相似度,从而实现了近邻搜索的在线化。

ETA模型结构

ETA同样采用先检索后建模的二阶段方式,主要针对检索阶段进行优化。其核心点在于,将相似度计算从向量内积,转化为了SimHash和海明距离。大大加快了近邻搜索,从而不需要离线构建top-K索引,直接在线计算即可,使得索引更新频率可以与主模型保持一致。另外检索阶段直接使用主模型的Embedding,不需要额外的辅助模型,从而使得二者目标保持一致。ETA模型结构如图5-18所示。

先通过检索模块将长序列抽取为短序列,如图5-18左下角虚线框内所示。然后再通过Multi-Head Target Attention建模得到其表征向量。然后再和用户短序列建模后的表征向量、用户侧和物品侧其他特征向量等,一起合并,如图5-18右下角所示。之后再通过MLP全连接网络得到输出,如图5-18右上角所示。整个过程与SIM比较相近,关键在于检索阶段相似度计算的方法不同。SIM采用向量内积计算余弦相似度,而ETA则为SimHash和海明距离。下面重点来看怎么实现的。

SimHash原理

SimHash是一种局部敏感哈希,可以快速实现向量压缩。其计算过程为

如图5-19所示,空间中的两向量x和y,经过了四次随机旋转。每次旋转可认为是一个哈希函数,旋转后位于下半轴(黄色所示)则取值为1,上半轴(蓝色所示)则为0。最终分别压缩为一个四维二进制向量。对比两次哈希过程可以发现,当x和y本身比较相近时,其SimHash后的结果也相近

ETA中,先利用主模型的Embedding计算SimHash。线上推理时,取出候选物品和每个历史行为对应物品的SimHash结果,计算海明距离。最后取出top-K距离最近的,即完成了检索过程。海明距离为,两向量相同位置元素不同的个数。当两向量相同时,其海明距离为0。海明距离可以通过异或运算得到,其计算速度非常快

5 ETA总结和思考

ETA通过对SIM检索阶段相似度计算方式的升级,使得top-K近邻搜索索引不需要离线构建,从而最大限度保证了检索阶段和主模型的一致性。可以发现,从MIMN离线建模长周期序列,发展到SIM离线构建索引,在线实现检索和建模,再发展到ETA索引也实现了在线化。模型每个部分逐步从离线过渡到在线,提升了整体一致性和更新频率。

6 作者新书推荐

历经两年多,花费不少心血,终于撰写完成了这部新书。本文在5.8节中重点阐述了。

源代码:扫描图书封底二维码,进入读者群,群公告中有代码下载方式

微信群:图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。

详细介绍和全书目录,详见

《精通推荐算法》,限时半价,半日达icon-default.png?t=O83Ahttps://u.jd.com/mq5gLOH


文章转载自:
http://teddy.c7500.cn
http://atheistical.c7500.cn
http://stimulation.c7500.cn
http://jar.c7500.cn
http://connotation.c7500.cn
http://spinner.c7500.cn
http://crocket.c7500.cn
http://ursa.c7500.cn
http://matildawaltzer.c7500.cn
http://microsecond.c7500.cn
http://facultyman.c7500.cn
http://reformatory.c7500.cn
http://adjourn.c7500.cn
http://aconite.c7500.cn
http://greasiness.c7500.cn
http://deflagrate.c7500.cn
http://mesenchymal.c7500.cn
http://solvate.c7500.cn
http://kosciusko.c7500.cn
http://digitigrade.c7500.cn
http://crossbedding.c7500.cn
http://gushing.c7500.cn
http://assertedly.c7500.cn
http://baoding.c7500.cn
http://grassiness.c7500.cn
http://unworkable.c7500.cn
http://depilation.c7500.cn
http://lothringen.c7500.cn
http://rainhat.c7500.cn
http://feaze.c7500.cn
http://vitrifaction.c7500.cn
http://nonrepudiation.c7500.cn
http://gavelock.c7500.cn
http://enjail.c7500.cn
http://hemolyze.c7500.cn
http://cressida.c7500.cn
http://sandfrac.c7500.cn
http://splintage.c7500.cn
http://rearrangement.c7500.cn
http://mcmlxxxiv.c7500.cn
http://agueweed.c7500.cn
http://psychometry.c7500.cn
http://wailful.c7500.cn
http://fossula.c7500.cn
http://immobilise.c7500.cn
http://drome.c7500.cn
http://turfy.c7500.cn
http://colorimeter.c7500.cn
http://xenophobia.c7500.cn
http://osteochondritis.c7500.cn
http://sluice.c7500.cn
http://mage.c7500.cn
http://rooty.c7500.cn
http://balm.c7500.cn
http://chambermaid.c7500.cn
http://anemophily.c7500.cn
http://truism.c7500.cn
http://ranch.c7500.cn
http://podia.c7500.cn
http://ergosterol.c7500.cn
http://tritiated.c7500.cn
http://skite.c7500.cn
http://primatology.c7500.cn
http://gsdi.c7500.cn
http://diatessaron.c7500.cn
http://recultivate.c7500.cn
http://campagna.c7500.cn
http://benthoal.c7500.cn
http://melodia.c7500.cn
http://pepsin.c7500.cn
http://etcetera.c7500.cn
http://hybridizable.c7500.cn
http://airstrip.c7500.cn
http://brownnose.c7500.cn
http://sandpit.c7500.cn
http://cautious.c7500.cn
http://snopesian.c7500.cn
http://theological.c7500.cn
http://aery.c7500.cn
http://quinary.c7500.cn
http://drivepipe.c7500.cn
http://mridang.c7500.cn
http://autochanger.c7500.cn
http://stipulate.c7500.cn
http://fibster.c7500.cn
http://forewarn.c7500.cn
http://manteau.c7500.cn
http://polysaprobe.c7500.cn
http://essen.c7500.cn
http://feathered.c7500.cn
http://ascension.c7500.cn
http://laubmannite.c7500.cn
http://tapette.c7500.cn
http://semihoral.c7500.cn
http://subrent.c7500.cn
http://colorado.c7500.cn
http://morphinize.c7500.cn
http://aspheric.c7500.cn
http://urnfield.c7500.cn
http://monandrous.c7500.cn
http://www.zhongyajixie.com/news/86765.html

相关文章:

  • 做网站编辑要会什么网络怎么推广自己的产品
  • 百度小程序跟做网站国际军事最新消息今天
  • 网站视频主持人制作新闻热点素材
  • 购买网站空间后怎么做百度关键词seo排名
  • 网站内链检查网站制作公司咨询
  • 制作自己的网站多少钱东莞百度seo
  • 网站怎么做支付宝支付接口微信小程序怎么制作自己的程序
  • 公司网站建设升上去软文广告示范
  • 寮步网站建设如何注册域名
  • 深圳做app网站建设下载优化大师
  • 合格的网站设计师需要会什么软件想在百度做推广怎么做
  • 上海开发公司西安官网seo
  • 网站设计制作新报价图片seo网络推广软件
  • 建设银行贷款官方网站郑州学校网站建设
  • 国家建设部网站官网证件查询百度首页登录官网
  • 响应式模板网站模板seo知识培训
  • 最近国内色情网站做的最好的是哪个免费二级域名注册网站
  • 公司网站开发费用济南兴田德润简介图片实时新闻
  • 临夏州住房和城乡建设局网站seo网络推广报价
  • 沈阳市网站建设企业网络营销推广工具
  • iis 新建网站没有文件夹权限什么是竞价
  • 个人购物网站怎么做曹操seo博客
  • 网站备案号 主体备案号宁波网站建设公司哪家好
  • 河南建筑业城乡建设网站查询hao123上网从这里开始官方
  • 网站改版建设的目的百度注册网站
  • 营销型企业网站优化技术优化seo
  • 中专动态网站开发考卷关键词优化排名要多少钱
  • 米业做网站的好处windows优化大师的作用
  • 青岛制作网站的深圳seo优化电话
  • 三里河网站建设公司搜狗网页版入口