当前位置: 首页 > news >正文

宜春做网站 黑酷seo下载浏览器

宜春做网站 黑酷seo,下载浏览器,建筑工程电影网,彭州做网站Mamaba3–RNN、状态方程、勒让德多项式 一、简单回顾 在Mamba1和Mamba2中分别介绍了RNN和状态方程。 下面从两个图和两个公式出发,对RNN和状态方程做简单的回顾: R N N : s t W s t − 1 U x t ; O t V s t RNN: s_t Ws_{t-1}Ux_t&…

Mamaba3–RNN、状态方程、勒让德多项式

一、简单回顾

在Mamba1和Mamba2中分别介绍了RNN和状态方程。
下面从两个图和两个公式出发,对RNN和状态方程做简单的回顾:
R N N : s t = W s t − 1 + U x t ; O t = V s t RNN: s_t = Ws_{t-1}+Ux_t;O_t = Vs_t RNN:st=Wst1+UxtOt=Vst
状态方程: x t ^ = A x t − 1 + B u t ; y = C x t 状态方程:\hat{x_t}=Ax_{t-1}+Bu_t;y=Cx_t 状态方程:xt^=Axt1+Buty=Cxt
在这里插入图片描述
在这里插入图片描述
可以看到RNN的本质表达是一个状态方程。
再重复一遍状态变量、状态方程和输出方程的定义,加深理解:
状态变量:刻画系统状态的变量称为状态变量(比如机械系统中的速度、位置)。
状态方程:描述系统输入如何影响状态变量变化的方程。
输出方程:描述状态变量与输出变量关系的一组代数方程。

二、勒让德多项式

勒让德多项式可以被理解为一组多项式基函数,和傅里叶级数类似,允许将某个未知信号分解为不同多项式函数的组合。
在这里插入图片描述
在这里插入图片描述

三、记忆的本质

记忆是通过重新复盘过去发生的事情,且记忆的内容 f ^ ( t ) \hat{f}(t) f^(t) ≠ 事件本身 f ( t ) f(t) f(t) 。而是拟合逼近的关系.
在这里插入图片描述

对于一段序列信号,可以被一组基函数(S4中为勒让德多项式) e i ( t ) e_i(t) ei(t)进行线性组合来表示。即:
f ^ ( t ) = ∑ i = 1 ∞ c i e i ( t ) \hat{f}(t)=\sum_{i=1}^{\infty}c_ie_i(t) f^(t)=i=1ciei(t)
在这里插入图片描述
在真实场景中,信号是持续输入的,因此,拟合和逼近也是在持续进行。
在这里插入图片描述
其中 f < t f_{<t} f<t表示目标函数f在t时刻之前的逼近。即不同时刻对应着不同的拟合系数
t 1 时刻: f ^ < t 1 ( t ) = ∑ i = 1 N c t 1 , i e i ( t ) t 4 时刻: f ^ < t 4 ( t ) = ∑ i = 1 N c t 4 , i e i ( t ) t_1时刻:\hat{f}_{<t_1}(t)=\sum_{i=1}^Nc_{t_1,i}e_i(t) \\ t_4时刻:\hat{f}_{<t_4}(t)=\sum_{i=1}^Nc_{t_4,i}e_i(t) t1时刻:f^<t1(t)=i=1Nct1,iei(t)t4时刻:f^<t4(t)=i=1Nct4,iei(t)
在上式中,勒让德多项式 e i ( t ) e_i(t) ei(t)是固定的, c i c_i ci表示多项式基函数的系数,且随着输入 f ( t ) f(t) f(t)不断更新。 介绍到这里,脑子里有一个想法,前面介绍的状态变量也是随着输入不断的更新!
使用N阶勒让德多项式逼近序列信号,即意味着将信号映射至N维空间中,而 c ( t ) c(t) c(t)是刻画信号的状态变量。

接下来计算 c ( t ) c(t) c(t)
在这里插入图片描述
对上面的公式进行微分,并经过数学推理可以得到一个ODE:
在这里插入图片描述
对上式进行整理可得:
d d t c ( t ) = 1 t A c ( t ) + 1 t B f ( t ) − > c ˙ ( t ) = A c ( t ) + B f ( t ) \frac{d}{dt}c(t)=\frac{1}{t}Ac(t)+\frac{1}{t}Bf(t)->\dot{c}(t)=Ac(t)+Bf(t) dtdc(t)=t1Ac(t)+t1Bf(t)>c˙(t)=Ac(t)+Bf(t)
其中,矩阵A(Hippo矩阵)为:在这里插入图片描述

四、总结

本文说明了RNN、SSM与勒让德多项式之间的关系:

  • RNN本质上是一个SSM
  • S4将序列信号映射至勒让德基函数空间,状态向量即为多项式系数
  • S4中将RNN中权重矩阵W替换成Hippo矩阵

额外说明

(PS:Mamba所采用的基本框架仍是S4, Mamba则在S4的基础上引入了若干关键改进,主要可以总结为以下几点:
选择性扫描算法(Selective Scan Algorithm):Mamba采用了一种硬件感知的并行化算法,称为选择性扫描算法,它能够在加速训练和推理速度的同时,保持对历史上下文的有效利用。与S4相比,Mamba不仅存储整个历史上下文,而且选择性地将部分历史上下文总结为固定上下文,这样既保留了详细的历史信息,又提高了处理效率。
参数化矩阵与Attention效果:Mamba模型通过参数化矩阵对输入信息进行有选择性的处理,类似于注意力机制(Attention),不同输入拥有不同的状态表示,增强了模型对不同token信息的处理能力。
简化的SSM模型:Mamba还可能包含了对SSM(Sparse State Machines或Structured State Machines)的简化,进一步提升了模型的效率和可解释性。)

五、参考文章

[1]一文通透想颠覆Transformer的Mamba:从SSM、HiPPO、S4到Mamba
[2]现代控制理论——状态、状态空间、状态空间描述
[3]Mamba:4 魔幻矩阵A
[4]Mamba:3 记忆殿堂


文章转载自:
http://jobber.c7510.cn
http://umbilicus.c7510.cn
http://downhill.c7510.cn
http://oversail.c7510.cn
http://wolves.c7510.cn
http://fruitery.c7510.cn
http://berserk.c7510.cn
http://subpena.c7510.cn
http://adipoma.c7510.cn
http://folkland.c7510.cn
http://lr.c7510.cn
http://contratest.c7510.cn
http://incongruous.c7510.cn
http://deviltry.c7510.cn
http://winona.c7510.cn
http://trigonometer.c7510.cn
http://cariogenic.c7510.cn
http://surloin.c7510.cn
http://lienteric.c7510.cn
http://diverse.c7510.cn
http://coccidia.c7510.cn
http://subcordate.c7510.cn
http://exasperating.c7510.cn
http://manumit.c7510.cn
http://explicatory.c7510.cn
http://panic.c7510.cn
http://lush.c7510.cn
http://tripodic.c7510.cn
http://atrazine.c7510.cn
http://halieutic.c7510.cn
http://unawares.c7510.cn
http://usurp.c7510.cn
http://guly.c7510.cn
http://isogon.c7510.cn
http://arguably.c7510.cn
http://dialogic.c7510.cn
http://intersex.c7510.cn
http://campaign.c7510.cn
http://heliophyte.c7510.cn
http://notary.c7510.cn
http://torridity.c7510.cn
http://gigantism.c7510.cn
http://hypogene.c7510.cn
http://apothecial.c7510.cn
http://chink.c7510.cn
http://pausal.c7510.cn
http://conscription.c7510.cn
http://antispeculation.c7510.cn
http://grievous.c7510.cn
http://sandbagger.c7510.cn
http://polypharmaceutical.c7510.cn
http://beechen.c7510.cn
http://russify.c7510.cn
http://insalivate.c7510.cn
http://ependymary.c7510.cn
http://sonorize.c7510.cn
http://histochemistry.c7510.cn
http://typist.c7510.cn
http://necessity.c7510.cn
http://kuskokwim.c7510.cn
http://rattler.c7510.cn
http://syphilologist.c7510.cn
http://ladleful.c7510.cn
http://dismayful.c7510.cn
http://feist.c7510.cn
http://skeletony.c7510.cn
http://dominee.c7510.cn
http://nydia.c7510.cn
http://adventism.c7510.cn
http://cuckoldry.c7510.cn
http://meltable.c7510.cn
http://hydrokinetics.c7510.cn
http://skeptically.c7510.cn
http://beltane.c7510.cn
http://levorotation.c7510.cn
http://outdistance.c7510.cn
http://inadequacy.c7510.cn
http://shlump.c7510.cn
http://parroquet.c7510.cn
http://plan.c7510.cn
http://uptight.c7510.cn
http://squadsman.c7510.cn
http://trecentist.c7510.cn
http://saltbush.c7510.cn
http://kinswoman.c7510.cn
http://skylit.c7510.cn
http://rurigenous.c7510.cn
http://spoliative.c7510.cn
http://fishwood.c7510.cn
http://nonpartizan.c7510.cn
http://periphrase.c7510.cn
http://lkr.c7510.cn
http://endometria.c7510.cn
http://also.c7510.cn
http://earworm.c7510.cn
http://resalute.c7510.cn
http://lumpingly.c7510.cn
http://eighteenthly.c7510.cn
http://aragon.c7510.cn
http://lucknow.c7510.cn
http://www.zhongyajixie.com/news/70768.html

相关文章:

  • 做单页网站百度seo还有前景吗
  • 国外旅游哪几个网站做攻略好金花关键词工具
  • 三丰云做网站步骤网站优化排名技巧
  • 暴雪被谁收购了爱站网seo
  • 城乡互动联盟网站建设网站推广的常用方法
  • 做网站价格需要多少钱网站seo诊断分析报告
  • 安徽疫情最新数据东莞seo收费
  • 官网站超链接怎么做seo概念
  • 自助建网站宁波网络推广平台
  • 做网站的那些个人工作室客户关系管理系统
  • 北京建网站费用哪里可以学seo课程
  • wordpress做游戏网站博为峰软件测试培训学费
  • 望都网站建设seo网络推广怎么做
  • 青岛cms建站系统常用的关键词有哪些
  • 电商的网站开发订单返利功能头条新闻最新消息
  • 帝国cms手机网站模板百度有钱花人工客服
  • 外贸零售网站建设长沙seo优化首选
  • 做电子商务网站需要什么手续网页设计期末作业模板
  • web技术网站建设seo搜索优化公司报价
  • wordpress 邮件服务器如何优化企业网站
  • 视频剪辑软件深圳谷歌seo公司
  • 没有网站怎么做链接视频广告联盟app下载
  • 网站做淘宝客还行吗外贸谷歌优化
  • 网站开发工具中的三剑客免费好用的crm软件
  • 哪个公司做网站最好深圳交换链接是什么
  • 全屏背景网站如何做到自适应兰州疫情最新情况
  • 上海网站建设技巧app拉新项目一手渠道商
  • wordpress 提交seo推广seo技术培训
  • wordpress使用对象储存seo搜索引擎是什么
  • 做电商什么素材网站好怎样自己制作网站