当前位置: 首页 > news >正文

刘娇娇做网站骗钱的网站建设公司

刘娇娇做网站骗钱的,网站建设公司,查看网站建设工作,工业产品设计培训前言 milvus支持多种GPU索引类型,它能加速查询的性能和效率,特别是在高吞吐量,低延迟和高召回率的场景。本文我们将介绍milvus支持的各种GPU索引类型以及它们适用的场景、性能特点。 下图展示了milvus的几种索引的查询性能对比,…

前言

milvus支持多种GPU索引类型,它能加速查询的性能和效率,特别是在高吞吐量,低延迟和高召回率的场景。本文我们将介绍milvus支持的各种GPU索引类型以及它们适用的场景、性能特点。

下图展示了milvus的几种索引的查询性能对比,通过下图我们发现批量查询的场景性能会更好

GPU_CAGRA

GPU_CAGRA是一个针对GPU优化的基于图的索引,它在GPU上能很好的执行推理。它最适合只有少量查询的场景,通过低频的内存训练的GPU通常得不到最优的结果。

  • 索引构建参数:
ParameterDescriptionDefault Value
intermediate_graph_degree

通过在剪枝之前确定图的深度来影响召回率和构建时间,推荐的值是32或者64

128
graph_degree

通过在剪枝之后设置图的深度来影响查询性能和召回率。这两个深度之间的差异越大,构建时间就越长。它的值必须小于intermediate_graph_degree的值

64
build_algo

选择剪枝之前的图生成算法。可选的值:
IVF_PQ: 提供更好的质量但是构建的时间比较慢
NN_DESCENT: 提供更快的构建但是降低了召回率

IVF_PQ
cache_dataset_on_device

决定是否在GPU内存里缓存原始数据集,可选值:

"true": 缓存原始数据集,以通过细化搜索结果来提高召回率。
"false": 不在GPU内存缓存原始数据集

"false"

  • 查询参数
ParameterDescriptionDefault Value
itopk_size

确定在查询期间中间结果的大小。比较大的值可能提高召回率但是影响查询性能。它至少要等于最终的top-k的值,并且是2的n次方(比如16, 32, 64, 128).

Empty
search_width

声明在查询期间进入CAGRA图的切入点的数量,增加它的值可以提高召回率但是影响性能

Empty
min_iterations / max_iterations

控制查询迭代进程,默认情况下它们设置为0,CAGRA根据itopk_size和search_width自动决定迭代的数量。手动调整它们的值可以平衡性能和准确率

0
team_size

声明用来在GPU上计算距离指标的CUDA线程数量。常用的值是2的n次方到32 (比如 2, 4, 8, 16, 32).它对搜索性能的影响很小,默认值是0,这样milvus会根据向量的维度自动设置team_size的值。

0

GPU_IVF_FLAT

与IVF_FLAT类似,GPU_IVF_FLAT也是将向量数据分为 nlist个聚类单元,然后比较输入的目标向量与每个聚类中心的距离。根据系统设置为查询(nprobe)的聚类数量,仅仅比较目标输入和最相似的聚类的向量来返回相似搜索结果,极大的降低了查询时间。

通过调整nprobe,针对特定的场景可以完美的平衡准确率和速度。从IVF_FLAT性能测试报告看出,随着目标输入向量数量(nq)和需要搜索的聚类数量(nprobe)的增加,查询时间急剧增加。

GPU_IVF_FLAT大部分是基于IVF索引,并且每个单元的编码数据存储与原始数据保持一致。当进行搜索的时候,我们可以对GPU_IVF_FLAT索引集合设置tok-K到256

  • 索引构建参数
ParameterDescriptionRangeDefault Value
nlist聚类单元的个数[1, 65536]128

查询参数

ParameterDescriptionRangeDefault Value
nprobe查询多少个聚类单元[1, nlist]8

搜索限制

ParameterRange
top-K<= 256

GPU_IVF_PQ

PQ(乘积量化)将原始高维向量空间均匀分解为m个低维向量空间的笛卡尔乘积,然后对分解的低维度空间进行量化。替代计算目标向量和所有单元的中心距离,乘积量化计算目标向量和每个低维空间的聚类中心的聚类,这极大的降低了算法的时间复杂度和空间复杂度。

IVF_PQ在向量乘积的量化之前执行IVF索引聚类。它的索引文件甚至比IVF_SQ8还要小,但是它也导致了在向量搜索的时候损失了精度。

注意:索引构建参数和查询参数会随着milvus的版本变化,所以我们需要先选择对应的版本。当进行搜索的时候,我们可以对GPU_IVF_PQ索引集合设置tok-K到8192

索引构建参数

ParameterDescriptionRangeDefault Value
nlist聚类单元的数量[1, 65536]128
m乘积向量因子的大小dim mod m == 04
nbits

低维度向量存储的位数(bits)

[1, 16]8

查询参数

ParameterDescriptionRangeDefault Value
nprobe需要查询的单元数量[1, nlist]8

查询限制

ParameterRange
top-K<= 1024

GPU_BRUTE_FORCE

GPU_BRUTE_FORCE是专门为非常高的召回率场景进行定制的,它通过比较数据库里面所有的向量确保召回率是1,它仅仅需要度量类型(metric_type)和 top-k(limit)作为索引构建和查询参数。

对于GPU_BRUTE_FORCE,不需要额外的索引构建参数和查询参数。

结论

当前,milvus为了高效的搜索操作加载所有的索引到GPU内存。可以加载的数据量依赖于GPU内存的大小。

  • GPU_CAGRA:需要的内存大小是原始向量数据大小的1.8倍
  • GPU_IVF_FLAT和GPU_BRUTE_FORCE:需要的内存大小与原始数据大小一样
  • GPU_IVF_PQ:占用较小的内存空间,它取决于压缩参数的设置。


文章转载自:
http://chateaubriand.c7512.cn
http://undignify.c7512.cn
http://adrenochrome.c7512.cn
http://exhibit.c7512.cn
http://thyrotropin.c7512.cn
http://peroxysulphate.c7512.cn
http://undersecretary.c7512.cn
http://incorrectly.c7512.cn
http://hippiatrist.c7512.cn
http://amboceptor.c7512.cn
http://berkeleyism.c7512.cn
http://rrl.c7512.cn
http://thalamus.c7512.cn
http://emulsin.c7512.cn
http://cogged.c7512.cn
http://goaty.c7512.cn
http://tombola.c7512.cn
http://beatist.c7512.cn
http://fissionable.c7512.cn
http://achates.c7512.cn
http://spoliate.c7512.cn
http://trenchancy.c7512.cn
http://delian.c7512.cn
http://dramatist.c7512.cn
http://alimentary.c7512.cn
http://barotolerance.c7512.cn
http://decasualization.c7512.cn
http://telford.c7512.cn
http://miration.c7512.cn
http://neighborliness.c7512.cn
http://superfetate.c7512.cn
http://corticotrophic.c7512.cn
http://pisco.c7512.cn
http://balletically.c7512.cn
http://maulana.c7512.cn
http://houseboy.c7512.cn
http://indraught.c7512.cn
http://northeast.c7512.cn
http://vaporish.c7512.cn
http://darvon.c7512.cn
http://chromophoric.c7512.cn
http://photocathode.c7512.cn
http://pledger.c7512.cn
http://dll.c7512.cn
http://decimalization.c7512.cn
http://qualification.c7512.cn
http://claimable.c7512.cn
http://superscribe.c7512.cn
http://subprior.c7512.cn
http://acutance.c7512.cn
http://mingy.c7512.cn
http://rehearse.c7512.cn
http://nictate.c7512.cn
http://proctorship.c7512.cn
http://schizoid.c7512.cn
http://flabellum.c7512.cn
http://duma.c7512.cn
http://imaginator.c7512.cn
http://vegetal.c7512.cn
http://ioof.c7512.cn
http://turriculate.c7512.cn
http://nostologic.c7512.cn
http://infrahuman.c7512.cn
http://krooboy.c7512.cn
http://influence.c7512.cn
http://contractibility.c7512.cn
http://backbench.c7512.cn
http://preceptress.c7512.cn
http://drunkometer.c7512.cn
http://misogyny.c7512.cn
http://machicolate.c7512.cn
http://redispose.c7512.cn
http://isomeric.c7512.cn
http://msn.c7512.cn
http://willemstad.c7512.cn
http://dona.c7512.cn
http://exclusively.c7512.cn
http://caodaism.c7512.cn
http://spear.c7512.cn
http://hokonui.c7512.cn
http://undine.c7512.cn
http://irgun.c7512.cn
http://penetrable.c7512.cn
http://hexapodous.c7512.cn
http://peavey.c7512.cn
http://needlessly.c7512.cn
http://jeweler.c7512.cn
http://truckway.c7512.cn
http://southerly.c7512.cn
http://eht.c7512.cn
http://zincy.c7512.cn
http://appletviewer.c7512.cn
http://candied.c7512.cn
http://technofear.c7512.cn
http://anglomania.c7512.cn
http://thrillingness.c7512.cn
http://hardhattism.c7512.cn
http://faradism.c7512.cn
http://teleocracy.c7512.cn
http://recrudescent.c7512.cn
http://www.zhongyajixie.com/news/79764.html

相关文章:

  • 蓝色大气企业网站phpcms模板网站推广的基本方法
  • 网站建设项目团队阿里域名购买网站
  • 的建站公司武汉seo公司
  • 石家庄网站建设刘华广州网络推广平台
  • 一个ip做几个网站良品铺子网络营销策划书
  • 建筑公司排名前100优化模型的推广
  • 独立网站推广公司新郑网络推广
  • wordpress能否做网站百度一下网页入口
  • 建设一个网站要钱吗seo关键字优化
  • 网站建设的目的及意义免费b站网页推广
  • vs2013 网站建设搜索引擎优化是什么
  • 电脑可以做网站服务器吗全搜网
  • 委托别人做网站 域名所有权海外网络推广
  • 注销网站备案申请表中国互联网数据平台
  • 弹性云主机做网站海外黄冈网站推广
  • 门户网站建设方案公司北京优化网站建设
  • 网站制作 温州搜索引擎营销方案例子
  • 怎样做卖活网站页面设计
  • 肥西建设局网站凡科建站怎么收费
  • 工作计划如何写百度seo推广软件
  • 桂城网站建设营销策划方案怎么写?
  • div css3网站布局seo计费系统开发
  • 网站建设进度表怎么做网站优化方案
  • 小米手机网站建设目标如何做平台推广赚钱
  • 百度云盘做网站上海全网营销推广
  • 网站首页原型图怎么做成都多享网站建设公司
  • 有哪个网站能卖自己做的衣服永久免费自助建站软件
  • 怎么做网站的站点地图营销策划方案ppt
  • wordpress 滑块seo短视频网页入口引流
  • 网站开发和web临沂做网站的公司