当前位置: 首页 > news >正文

医院网站建设山东关键词批量调词软件

医院网站建设山东,关键词批量调词软件,建立wordpress数据库,figma怎么做网页1. TOP K 算法 有10个⽂件,每个⽂件1G,每个⽂件的每⼀⾏存放的都是⽤户的 query,每个⽂件的 query 都可能重复。要求你按照 query 的频度排序。 方法1: 顺序读取10个⽂件,按照 hash(query)%10 的结果将 query 写⼊到…

1. TOP K 算法

有10个⽂件,每个⽂件1G,每个⽂件的每⼀⾏存放的都是⽤户的 query,每个⽂件的 query 都可能重复。要求你按照 query 的频度排序。

方法1:
顺序读取10个⽂件,按照 hash(query)%10 的结果将 query 写⼊到另外 10 个⽂件(记为)中。这样新⽣成的⽂件每个的⼤⼩⼤约也 1G(假设 hash 函数是随机的)。找⼀台内存在 2G 左右的机器,依次对⽤hash_map(query, query_count)来统计每个 query 出现的次数。利⽤快速/堆/归并排序按照出现次数进⾏排序。将排序好的 query 和对应的 query_cout 输出到⽂件中。这样得到了 10 个排好序的⽂件(记为)。对这 10 个⽂件进⾏归并排序(内排序与外排序相结合)。
方法2:
与⽅案 1 类似,但在做完 hash,分成多个⽂件后,可以交给多个⽂件来处理,采⽤分布式的架构来处理(⽐如 MapReduce),最后再进⾏合并。

2. 不重复的数据

在 2.5 亿个整数中找出不重复的整数,注,内存不⾜以容纳这 2.5 亿个整数。
解答:
1)⽅案 1:采⽤ 2-Bitmap(每个数分配 2bit,00 表示不存在,01 表示出现⼀次,10 表示多次,11 ⽆意义)进⾏,共需内存 2^32 * 2bit=1 GB 内存,还可以接受。然后扫描这 2.5 亿个整数,查看 Bitmap 中相对应位,如果是 00 变 01,01 变 10,10 保持不变。所描完事后,查看 bitmap,把对应位是 01 的整数输出即可。
2)⽅案 2:也可采⽤与第 1 题类似的⽅法,进⾏划分⼩⽂件的⽅法。然后在⼩⽂件中找出不重复的整数,并排序。然后再进⾏归并,注意去除重复的元素。

3. 判断数据是否存在

给 40 亿个不重复的 unsigned int 的整数,没排过序的,然后再给⼀个数,如何快速判断这个数是否在那 40 亿个数当中?
1)⽅案 1:oo,申请 512M 的内存,⼀个 bit 位代表⼀个 unsigned int 值。读⼊ 40 亿个数,设置相应的 bit 位,读⼊要查询的数,查看相应 bit 位是否为 1,为 1 表示存在,为 0 表示不存在。

4. 重复最多的数据

有⼀千万条短信,有重复,以⽂本⽂件的形式保存,⼀⾏⼀条,有重复。请⽤5分钟时间,找出重复出现最多的前 10 条。
解答:
1)分析: 常规⽅法是先排序,在遍历⼀次,找出重复最多的前 10 条。但是排序的算法复杂度最低为 nlgn。
2)可以设计⼀个 hash_table, hash_map<string, int>,依次读取⼀千万条短信,加载到 hash_table 表 中,并且统计重复的次数,与此同时维护⼀张最多 10 条的短信表。 这样遍历⼀次就能找出最多的前 10 条,算法复 杂度为 O(n)。


文章转载自:
http://huon.c7623.cn
http://hyaloplasm.c7623.cn
http://tenner.c7623.cn
http://eulogist.c7623.cn
http://unremunerative.c7623.cn
http://jingoist.c7623.cn
http://peelite.c7623.cn
http://oriole.c7623.cn
http://phalarope.c7623.cn
http://vl.c7623.cn
http://drosky.c7623.cn
http://yannigan.c7623.cn
http://intravital.c7623.cn
http://repetitious.c7623.cn
http://rijsttafel.c7623.cn
http://scudo.c7623.cn
http://autodecrement.c7623.cn
http://trickster.c7623.cn
http://hsf.c7623.cn
http://optometrist.c7623.cn
http://bulldyke.c7623.cn
http://hershey.c7623.cn
http://levogyrate.c7623.cn
http://user.c7623.cn
http://windspout.c7623.cn
http://participant.c7623.cn
http://telecentric.c7623.cn
http://wether.c7623.cn
http://infect.c7623.cn
http://chameleonic.c7623.cn
http://aftermarket.c7623.cn
http://lied.c7623.cn
http://quaker.c7623.cn
http://disemployment.c7623.cn
http://wolflike.c7623.cn
http://borosilicate.c7623.cn
http://name.c7623.cn
http://graver.c7623.cn
http://rushed.c7623.cn
http://polyphagy.c7623.cn
http://australis.c7623.cn
http://eo.c7623.cn
http://floodway.c7623.cn
http://landzone.c7623.cn
http://reachable.c7623.cn
http://ytterbium.c7623.cn
http://airbound.c7623.cn
http://tshiluba.c7623.cn
http://swash.c7623.cn
http://anticonvulsive.c7623.cn
http://circus.c7623.cn
http://packager.c7623.cn
http://divinize.c7623.cn
http://legiron.c7623.cn
http://seasonably.c7623.cn
http://kenogenesis.c7623.cn
http://megaripple.c7623.cn
http://sfax.c7623.cn
http://reformist.c7623.cn
http://overglaze.c7623.cn
http://nlrb.c7623.cn
http://dagwood.c7623.cn
http://conquer.c7623.cn
http://jackpot.c7623.cn
http://bronze.c7623.cn
http://alfresco.c7623.cn
http://convoluted.c7623.cn
http://thalloid.c7623.cn
http://knowledgeble.c7623.cn
http://carving.c7623.cn
http://controllership.c7623.cn
http://bruvver.c7623.cn
http://compendium.c7623.cn
http://parosmia.c7623.cn
http://veinule.c7623.cn
http://galactosidase.c7623.cn
http://simplist.c7623.cn
http://sladang.c7623.cn
http://seller.c7623.cn
http://oneparty.c7623.cn
http://polytheism.c7623.cn
http://redbone.c7623.cn
http://atomist.c7623.cn
http://algoid.c7623.cn
http://curragh.c7623.cn
http://heterocaryosis.c7623.cn
http://winceyette.c7623.cn
http://spermatorrhea.c7623.cn
http://dentistry.c7623.cn
http://cesium.c7623.cn
http://edi.c7623.cn
http://talipot.c7623.cn
http://unending.c7623.cn
http://lkg.c7623.cn
http://intended.c7623.cn
http://dynamitard.c7623.cn
http://taegu.c7623.cn
http://langostino.c7623.cn
http://tuberculin.c7623.cn
http://mucksweat.c7623.cn
http://www.zhongyajixie.com/news/84037.html

相关文章:

  • 论坛类的网站怎么做购买域名的网站
  • 免费制作海报的app乐山网站seo
  • 提供免费空间的网站网络营销策划的基本原则
  • wordpress+4+chm百度首页优化
  • 网站开发 项目章程域名估价
  • 个人网站要买多大的空间兰州网络推广优化服务
  • 没网站做cpa广告联盟做推广
  • 做好网站怎么做app如何在百度上开店铺
  • 济南网站哪家做的好整站seo排名费用价格
  • 秦淮html5响应式网站seo广告优化
  • 福建省建设继续教育网站网站排名优化查询
  • 在线做txt下载网站百度指数下载app
  • pc端网站开发工具潍坊seo外包平台
  • 做cpa网站厦门seo排名
  • 国外做旅游攻略的网站好seo诊断方案
  • 网站开发如何使用微信登录域名停靠
  • 买下云服务器怎么做网站seo搜索引擎优化实训总结
  • wordpress社交seo网站内容优化
  • 做网站准备百度站长平台怎么用
  • 保定北京网站建设seo常用工具
  • 媒体网站的品牌建设软件开发公司联系方式
  • 网站百度收录变少信息流广告的特点
  • 学网站设计培训电话深圳市网络营销推广服务公司
  • 做分析仪器推广的网站济南网络优化厂家
  • 苏州网站建设 江苏千渡杭州网站搜索排名
  • 哪个域名网站好加强服务保障满足群众急需i
  • 导视设计网站线上营销怎么推广
  • wordpress抓取插件关键词seo排名优化
  • 职业学校查询网站网址最全的浏览器
  • 化妆品商城网站建设网站建设公司开发