当前位置: 首页 > news >正文

seo站建立一个网站需要花多少钱

seo站,建立一个网站需要花多少钱,英文 网站 字体,学生管理系统 网站开发For压缩算法 这是倒排表的一种压缩算法。 还是那个问题,如果"小米" 这个词项,在多文档里都有,则就会导致倒排表很大,这时候就会设计到了压缩算法,这里说的是,倒排表。 那末我们来看看 for压缩…

For压缩算法

这是倒排表的一种压缩算法。

还是那个问题,如果"小米" 这个词项,在多文档里都有,则就会导致倒排表很大,这时候就会设计到了压缩算法,这里说的是,倒排表。

那末我们来看看 for压缩算法是怎么压缩数据呢?其实你可以理解为它是将posting list(无论数字多大都是用int去存的) 转换为一个差值list   (deltas list)去存的,也就是我们之前存的不是文件id吗,这回我们去存和前一个的差值,这样是不是存的这个数就会变小,那这样我们需要的位数是不是就会变小,靠这个来压缩我们的函数

不如说上边这个 我们得到一个差值集合之后呢

发现就可以用8位去存储这些数,这样是不是跟用int去存储就变小了

但是呢,我们又发现 比如 2 这个 数字用8位去存储是不是又浪费了

我们可以在保证顺序的时候去分 在2那分成一半一半把

细心的同学又发现了,为什么不把单独的数 拎出来那么分呢?2分5字节这不还浪费吗。

但是除了要保证高效的压缩方法,还要保证快速的解码啊,我们最终还得恢复成最原来的那个倒排表。我们每块数组用了几个数组,也是要记录在磁盘上的,如果我们一个一个差这会导致这个记录又浪费了空间。这个记录呢占用1个字节

那具体这个数组拆分到什么程度,如果这个数组足够稠密的时候,就不用拆了,就是说这一块的数字特别都比较接近。这个也是动态计算出来的。

RBM压缩算法

如果数值不密集,也就是说你一个很大一个很小,这时候我们就用RBM压缩算法。

我们这时候就不用减法了,我们用除法

 

因为我们int类型是32位。我们把32位这么看,一个高16位(商),一个低16位(余数)

所以我们先把每个数除以65536也就是2^16 得到一个除数和一个余数。我们就把一个大数换成了两个小数。

那么这两个数是怎么存储起来的。其实是用Container存的

我们把那个商作为一个key 用short方法去存储

然后余数存在对应key 所对应的容器之中。

如图你就知道了

Container 包括三种container

arraycontainer  我们的上述例子就是用的这个容器

Bitmapcontainer  这个占用的空间永远位8kb

Runcontainer

这三种容器可以自己去学习

http://www.zhongyajixie.com/news/32118.html

相关文章:

  • 有做材料的网站吗太原网络推广公司哪家好
  • 建设门户网站的重要性2022搜索引擎
  • 汕尾网站开发谷歌推广哪家公司好
  • 服务好的扬中网站优化旅游产品推广有哪些渠道
  • 临安营销型网站建设免费广告发布平台app
  • 建设银行网站用户注册不了武汉seo 网络推广
  • 加大政府网站建设做小程序公司哪家好
  • 济南市公众号网站建设求几个微信推广平台
  • 湘潭做网站价格 磐石网络百度seo点击工具
  • 想做cpa 没有网站怎么做百度站长平台网站提交
  • wordpress外贸网站建设2022知名品牌营销案例100例
  • 网站的日常维护巨量引擎官网
  • 终端平台网站建设免费网站收录入口
  • 网站推广的看法做网站一般需要多少钱
  • 建站系统破解源码培训机构有哪些
  • 长沙小升初有什么做试卷的网站广告网址
  • 烟台建设银行网站网站seo置顶
  • 网站建设背景分析论文网络推广靠谱吗
  • 手机网站设计规范网上销售都有哪些平台
  • 如何做网站淘客seo的优点和缺点
  • 做外汇的国外新闻网站网站制作的费用
  • 有没有好一点的网站网推和地推的区别
  • 公司网页设计公司招聘sem优化托管公司
  • 手机网站打开很慢南宁推广软件
  • 汝州网站建设今日热点新闻事件
  • 临沧网站开发品牌策划方案
  • 手机网站 模板合肥百度推广优化
  • 温州企业网站开发济南做网站公司
  • 在门户网站做产品seo想做电商应该怎么入门
  • 兖州网站建设20条优化措施