当前位置: 首页 > news >正文

山东省建设局网站首页东营优化路网

山东省建设局网站首页,东营优化路网,网站响应是什么问题吗,嘉兴手机端建站模板原文链接 字节前几天2024年9年19日公开发布的论文《HLLM:通过分层大型语言模型增强基于物品和用户模型的序列推荐效果》。 文字、图片、音频、视频这四大类信息载体,在生产端都已被AI生成赋能助力,再往前一步,一定需要一个更强势…

原文链接

字节前几天2024年9年19日公开发布的论文《HLLM:通过分层大型语言模型增强基于物品和用户模型的序列推荐效果》。

文字、图片、音频、视频这四大类信息载体,在生产端都已被AI生成赋能助力,再往前一步,一定需要一个更强势的、更有效率的推荐分发机制。因为只有分发到位,才会激发更多的供给生产…

传统推荐

传统的推荐项目是将user与item转换为ID并创建对应的embedding table,在得到向量后,可以基于item进行推荐和基于user进行推荐,目前常用的还有单塔和双塔模型等。

在提取制作item embedding table方面,可以提取物品中文描述的关键词,然后再把关键词转换为词向量来代表物品,随着深度学习的发展,提取关键词再转为向量的过程逐渐被LSTM或Bert等具备语言能力的序列模型代替,现在更有M3E等专门把自然语言转换成稠密向量的模型。而LLMs具备强大的语义理解能力,所以大厂自然把转向量的思路往大模型的方向靠近。

使用大模型进行推荐

大模型分为 Item LLM 和 User LLM,两者参数并不共享,直接基于已经预训练好的LLMs进行文本到向量的转换。

Item LLM:使用 item 的描述作为输入,例如:Title、Tag、Description,最后再加上一个特殊 token [ITEM],特殊token对应输出代表该 item 的 embedding

User LLM:输入是用户历史行为(浏览、加购、成交)的交互序列,输入序列中每个embedding就来自于 Item LLM 的输出。由于输入并非文本token,所以对于User LLM会去除预训练模型的 word embedding

那么大模型的优化是通过next token prediction进行优化的,但是现在的输入不再是word embedding,该怎么做呢?其实很简单,我们不看大模型的输入与输出,只利用大模型的主体框架,把它看成一个普通的序列生成模型或者判别模型就好。

序列生成模型:我们在app上实际购物浏览是,行为是有顺序的,对于某个物品 E i E_i Ei模型输出的 E i + 1 ′ E_{i+1}^{'} Ei+1是正样本,在序列的尾端就是预测你下一步要浏览的物品,我可以随机抽取的其他物品为负样本,将对比学习的InfoNCE作为预测next token的损失函数。

判别模型:其实就是目前最常用的单塔与双塔模型,目标是二分类。单塔模型将用户历史浏览的物品embedding( E 1 − E n E_1-E_n E1En,由Item LLM生成)依次输入,然后拼上一个待预测物品,让模型预测用户是否会购买这个物品。双塔模型是使用用户历史浏览物品生成一个USER用户向量,然后再使用这个用户向量与目标物品向量进行打分预测。

在实际应用中,使用双塔模型更多一些,因为会有一个稳定的中间量即用户向量可以储存,计算效率更高。单塔模型可以动态抽取实时浏览数据进行预测,效果更好但是计算效率低。

实验结论

字节提出的 Hierarchical Large Language Model(HLLM)网络架构,通过训练Item LLM与User LLM,通过实验表明在公开数据集上显著超越 ID-based方法,并呈现了Scaling Law特性。在抖音落地,A/B实验显示在重要指标上增长0.705%。其下是一些模型指标:

  • 采用 [ITEM] token 提取 embedding比mean pooling方法好
  • Item LLM 采用Tag + Title + Description = length 256比其短的效果更好
  • 输入用户序列长度采用length=50相比其他短的会更好
  • 工业场景下Item LLM和User LLM采用7B更好比其小的更好,User LLM输入长度采用1k比其短的更好

在这里插入图片描述

http://www.zhongyajixie.com/news/10893.html

相关文章:

  • 江西网站建设价位哈尔滨seo和网络推广
  • 漂亮html个人简历代码seo到底是做什么的
  • 国内做服装的网站有哪些私人做网站建设
  • 浦东网站制作四年级写一小段新闻
  • 网站开发实训报告总结app开发公司哪家好
  • 甘肃省临夏州建设局网站百度网站排名优化价格
  • c2c网站代表网站营销策略有哪些
  • wordpress 显示当前日期厦门关键词seo排名网站
  • jsp高级动态网站开发试卷网站seo优化案例
  • 怎么搭建网站视频教程哪个杭州seo好
  • 湖南大事今日新闻石家庄百度快速排名优化
  • 温州网站建设小程序今日财经最新消息
  • java ee只是做网站吗四川整站优化关键词排名
  • 网站建设中面包屑导航的特点实体店铺引流推广方法
  • 开锁都在什么网站做谷歌商店下载不了软件
  • 武汉网络公司排行榜郑州靠谱seo整站优化
  • 贵州网站优化品牌推广方案案例
  • 免费网站建设网站搜索引擎关键词怎么优化
  • 服装设计师网哪里能搜索引擎优化
  • 重庆网站优化服务怎么办网站平台
  • 做网站通常又什么开发完成百度站长工具平台登录
  • 宜春网站建设推广百度一下网页入口
  • 济南网站优化渠道网络
  • 国际军事新闻今日头条北京搜索优化排名公司
  • 怎么自己做整人网站关键词优化排名首页
  • 做网站用什么代码百度后台登录
  • 网站开发项目建设规范电商网站对比
  • 哪些网站做的好看的全网营销老婆第一人
  • 政府网站群集约化建设推广赚钱的平台有哪些
  • 制作网站要步骤网络推广需要多少费用