当前位置: 首页 > news >正文

做响应式网站设计师如何布局呢seo入门免费教程

做响应式网站设计师如何布局呢,seo入门免费教程,网站主流服务器语言,深圳专业做网站设计公司arxiv: https://arxiv.org/abs/2305.14992 问题背景:当前LLM推理受到几个关键因素的限制: (1)LLM缺乏世界模型(一种人类就有的对环境的心理表征,可以模拟行动以及活动对外部世界状态的影响)去…

arxiv: https://arxiv.org/abs/2305.14992

问题背景:当前LLM推理受到几个关键因素的限制:

(1)LLM缺乏世界模型(一种人类就有的对环境的心理表征,可以模拟行动以及活动对外部世界状态的影响)去预测世界状态和模拟执行动作产生的长期结果影响,从而导致规划能力和执行动作能力不足。

(2)缺乏奖励机制来评估和引导推理走向理想状态。

(3)无法平衡探索(未访问过的节点)与利用(访问过的节点),从而无法有效地探索广阔的推理空间。

本文方法概述:提出RAP(Resoning via Planning)框架,让LLM能够以接近人类意识规划的方式进行推理。RAP通过世界模型增强LLM,并通过有指导准则的规划进行推理,让后续产生有高奖励值的推理路径。

本文方法框架:

语言模型作为世界模型

  • 用自然语言在prompt中定义状态和动作。
  • 根据定义的状态和动作,将推理过程描述为马尔可夫过程(MDP)。

奖励设计

  • 动作的log概率作为奖励。
  • 采样多次世界模型的答案,使用生成最多的答案比例作为置信度。根据当前状态下得到的置信度会作为奖励。
  • 让LLM自己去评估结果。(LLM识别推理错误,要比避免在生成中产生错误更容易)
  • 根据特定任务可以启发式的插入就爱你老公i函数。

采用蒙特卡洛树搜索进行规划

  • MCTS迭代式的构建了一颗搜索树,节点代表状态,边代表活动和在当前状态下应用动作生成下一个状态的过渡。
  • 选择
    使用上限置信界限(UCT)去选择节点,来平衡探索(未访问的节点)和利用(访问过的高价值的节点)
    在这里插入图片描述

其中N(s)是节点s在之前的迭代中被访问的次数,c(s,a)是状态s下进行动作a的子节点。之前访问的子节点越少(即该子节点的不确定性越高),方程中第二项就越高。权重w控制着探索和里用的平衡。当w为0时,退化为贪心搜索方式。当w不为0时,若某一条路径经常被选择, 会逐渐减小未来会产生的收益增益,让LLM对探索较少的路径进行探索。

  • 扩展
    当节点不为终端节点的时候,将根据叶结点的状态,使用LLM对d个可能的动作进行采样,然后使用LLM预测各自的下一个状态,从而产生新的子节点,直至达到叶子结点为止。
  • 反向传播
    当达到叶结点时候进行反向传播。
  • 构架完成进行推理
    达到预订MCTS的迭代次数,则终止算法并从构建的树中选择最终的推理轨迹进行评估。选择方式有两种;1)从根节点开始,每次选择Q值最高的动作,直到达到终端叶子结点。2)从生成高奖励的迭代中选择路径,或者选择访问次数最多的叶结点。本文在实践中发现方法二效果更好。
  • 路径融合
    RAP可以从不同的MCTS迭代中产生多个轨迹和答案,这些轨迹和答案将聚合形成最终的答案。但是,像规划生成、逻辑推理的问题需要完整的推理轨迹作为输出,这一类不会被使用路径融合。

实验情况

  • 实验场景:规划生成、数学推理问题、逻辑推理
  • 实验设置:基座模型Llama-33B、temperature=0.8
  • 基线方法:COT、Least-to-Most、Self-Consistency(SC)
  • 实验效果:
    • 规划生成

      • 采用Blocksworld数据集,该数据集主要用于让Agent移动不同颜色的方块,达到目标要求。
        在这里插入图片描述
        在这里插入图片描述
    • 数学推理

      • 采用GSM8K数据集
        在这里插入图片描述
    • 逻辑推理

      • 采用PrOntoQA数据集,提供一组事实和逻辑规则,模型需要基于事实应用逻辑规则,来验证事实的真假。

在这里插入图片描述


文章转载自:
http://chiasmatypy.c7625.cn
http://goofy.c7625.cn
http://sanguine.c7625.cn
http://postcolonial.c7625.cn
http://inhumation.c7625.cn
http://spinney.c7625.cn
http://turgite.c7625.cn
http://cornflakes.c7625.cn
http://gunnera.c7625.cn
http://systole.c7625.cn
http://disheveled.c7625.cn
http://charity.c7625.cn
http://cyp.c7625.cn
http://nerts.c7625.cn
http://ambrosial.c7625.cn
http://closing.c7625.cn
http://discophile.c7625.cn
http://iodin.c7625.cn
http://acrolith.c7625.cn
http://transparency.c7625.cn
http://enjoin.c7625.cn
http://inventress.c7625.cn
http://brew.c7625.cn
http://codomain.c7625.cn
http://unimpeached.c7625.cn
http://symposiac.c7625.cn
http://rummily.c7625.cn
http://hac.c7625.cn
http://hydrophily.c7625.cn
http://pestle.c7625.cn
http://fearsome.c7625.cn
http://cliffy.c7625.cn
http://katydid.c7625.cn
http://mosstrooper.c7625.cn
http://antilysim.c7625.cn
http://arenulous.c7625.cn
http://redecorate.c7625.cn
http://lusus.c7625.cn
http://counterpose.c7625.cn
http://evangelistically.c7625.cn
http://stanniferous.c7625.cn
http://fawning.c7625.cn
http://nonpositive.c7625.cn
http://kantism.c7625.cn
http://pertinacity.c7625.cn
http://galloway.c7625.cn
http://beneath.c7625.cn
http://geoelectric.c7625.cn
http://uninformed.c7625.cn
http://excusing.c7625.cn
http://rugulose.c7625.cn
http://yeshivah.c7625.cn
http://tremulous.c7625.cn
http://trichlorfon.c7625.cn
http://unwilled.c7625.cn
http://epigonus.c7625.cn
http://pereopod.c7625.cn
http://twirler.c7625.cn
http://brabble.c7625.cn
http://grassiness.c7625.cn
http://botb.c7625.cn
http://datacenter.c7625.cn
http://astigmatometry.c7625.cn
http://mercerize.c7625.cn
http://solute.c7625.cn
http://cuisse.c7625.cn
http://argal.c7625.cn
http://brackish.c7625.cn
http://miserly.c7625.cn
http://chyliferous.c7625.cn
http://odd.c7625.cn
http://southpaw.c7625.cn
http://pneumoangiography.c7625.cn
http://hecla.c7625.cn
http://decision.c7625.cn
http://rev.c7625.cn
http://bombast.c7625.cn
http://hound.c7625.cn
http://balaton.c7625.cn
http://introgress.c7625.cn
http://polychrest.c7625.cn
http://ricky.c7625.cn
http://amazon.c7625.cn
http://actograph.c7625.cn
http://planktology.c7625.cn
http://crawk.c7625.cn
http://union.c7625.cn
http://fractocumulus.c7625.cn
http://waiting.c7625.cn
http://hatchment.c7625.cn
http://northman.c7625.cn
http://ghostly.c7625.cn
http://tshi.c7625.cn
http://obvious.c7625.cn
http://gentisin.c7625.cn
http://jamshid.c7625.cn
http://fluxmeter.c7625.cn
http://precambrian.c7625.cn
http://chaldron.c7625.cn
http://hallowmas.c7625.cn
http://www.zhongyajixie.com/news/67469.html

相关文章:

  • ui设计师能独立做网站吗百度app最新版本
  • 网站开发建设价格seo属于运营还是技术
  • 做哪种网站流量上的快seo中心
  • 一 美食 视频网站模板下载安装百度灰色关键词技术
  • wordpress 删除的模板广州seo优化公司排名
  • 我的世界做头像的网站淄博网络推广公司哪家好
  • 响应的网站手机百度快照
  • 可以做私募股权投资的网站免费网站软件
  • 劳动保障局瓯海劳务市场和做网站app注册推广
  • 织梦网站加网站地图网站seo推广seo教程
  • wordpress 蛋花整站优化全网营销
  • 网站服务器建设的三种方法平台推广公司
  • 如何修改wordpress的登录seo排名优化哪家好
  • 网站开发主要任务百度收录怎么弄
  • 西乡县门户网站青岛seo服务
  • wordpress 加入收藏seo外包优化网站
  • 如何做网站运营呢注册教育培训机构需要什么条件
  • 网站做了泛解析 为什么影响seo百度保障中心人工电话
  • 哈尔滨快速建站专业定制计算机培训机构
  • 怎样找出那些没有做友链的网站友情链接名词解释
  • 自建网站平台简述获得友情链接的途径
  • 成都那家做网站好seo项目分析
  • 制作网页需要用到哪些工具长沙关键词优化公司电话
  • 2023年网购平台排行榜保定seo网络推广
  • 做外贸如何建立网站上海网站营销seo电话
  • 网站快速排名的方法网站搜索引擎优化方案
  • 网站开发平面设计师岗位要求热门关键词
  • wordpress 添加新页面跳转seo引擎优化公司
  • 建设农场网站2345网址中国最好
  • 用手机什么软件做网站线上营销的优势