当前位置: 首页 > news >正文

广州网站开发b2b网站大全

广州网站开发,b2b网站大全,虚拟网站建设,网站建设服务器怎么设置目录 总体介绍总体流程 模块介绍目标检测: grounding dino目标分割:Segment Anything Model (SAM)整体思路模型结构:数据引擎 图片绘制 集成样例 其他问题附录 总体介绍 总体流程 本方案用到了三个步骤,按顺序依次为&#xff1a…

目录

  • 总体介绍
    • 总体流程
  • 模块介绍
    • 目标检测: grounding dino
    • 目标分割:Segment Anything Model (SAM)
      • 整体思路
      • 模型结构:
      • 数据引擎
    • 图片绘制
  • 集成
    • 样例
  • 其他问题
  • 附录

总体介绍

总体流程

本方案用到了三个步骤,按顺序依次为:

  1. 基于语义的目标检测(使用grounding dino)
  2. 在检测到的范围内进行目标分割生成mask(使用segment anything)
  3. 图片绘制(使用stable diffusion)

模块介绍

目标检测: grounding dino

总体架构图
模型架构图
从图中可以看出,本算法本质上是对图像和文本进行多模态融合,将二者映射到同一个向量空间并使用attention的思路进行匹配从而得到文本对应的图像。

模型中使用Swin Transformer作为image backbone,BERT作为text backbone,使用cross-transformer进行多模态融合。

从上面流程可以更深入地理解attention中qkv含义,即可以将attention视为一种软寻址。在网上看到过一个简单易懂的解释:

attention 机制里主要有三个向量 - key, query 和 value,其实可以将 Attention 机制看作一种软寻址(Soft Addressing):Source 可以看作一个中药铺子的储物箱,储物箱里的药品由地址 Key(药品名)和值 Value(药品)组成,当前有个 Key=Query(药方)的查询,目的是取出储物箱里对应的 Value 值(药品),即 Attention 数值。通过 Query 和储物箱内元素 Key 的地址进行相似性比较来寻址,之所以说是软寻址,指的是我们不只从储物箱里面找出一中药物,而是可能从每个 Key 地址都会取出内容,取出内容的重要性(量的多少)根据 Query 和 Key 的相似性来决定,之后对 Value 进行加权求和,这样就可以取出最终的 Value 值(一副中药),也即 Attention 值。所以不少研究人员将 Attention 机制看作软寻址的一种特例

目标分割:Segment Anything Model (SAM)

整体思路

模型的目的是构建一个用于图像分割的基础模型,即寻求开发一个可提示的(promptable)模型并将其进行预训练,预训练的数据集通过一个有强大泛化能力的任务来生成。使用这个模型就可以寻求解决在使用prompt工程生成的新数据分布上的一系列下游分割问题。
本计划能否成功主要和三个部分相关:任务(task)、模型(model)、数据(data)。为了研究这些部分,需要解决以下三个问题:

  1. 什么样的任务可以零样本泛化?

    定义一个可提示的分割任务,可以针对任何分割提示(prompt)返回有效的分割掩码。本任务有两个作用,一是作为预训练目标,二是通过prompt工程解决下游通用分割任务。

  2. 与之相应的模型架构是什么样的?

    模型必须支持灵活的prompt,且可以实时输出掩码(mask)。

  3. 什么样的数据能支持这项任务和模型?

    论文提出需要大规模多样化的数据集,为了得到这样的数据集,可以构造一个数据引擎,通过引擎可以半自动、全自动生成新数据完成模型迭代

模型结构:

提示

模型结构

数据引擎

互联网上目前没有适用于本任务数据量的数据集,所以必须构建一套引擎来生成数据。初始训练数据集SA-1B,总共包括1100万张图像和11亿个掩码。数据收集包含三个阶段。

  1. 人工辅助阶段。专业标注员使用浏览器上的交互式标记工具,并结合 SAM 进行手动标注。SAM 首先使用公共数据集进行训练。随着数据量的逐渐增加,SAM 图像编码器的尺寸也随之增大(ViT-B扩展为ViT-H)。在这一阶段结束时,收集了 430 万个掩码和 12 万张图像。

  2. 半自动阶段。为了增加掩码的多样性并改善模型的性能,研究人员首先预先填充了掩码,标注人员需要在此基础上补充其他未标注的对象。为了检测掩码的可信度,使用第一阶段得到掩码的数据训练一个边界检测模型,用来进行高置信度预测。在此阶段结束时,一张图像平均可以提供 72 个掩码。

  3. 全自动阶段。本阶段可以实现全自动标注。实现此步骤主要由于亮点:一,在前面两个阶段已经收集了足够的掩码;二,引入了可以在有歧义情况下也可以判断的歧义感知模型。在这一阶段结束时,最终的 SA-1B 数据集包含 1100 万张图像和 1.1B 个掩码。

图片绘制

stable diffusion(网上说这部分的文章众多,暂略)

集成

样例

(目前跑的样例均涉及到公司内部信息,暂略,后期有时间会补充脱敏版)

其他问题

grouding-dino检测到的目标是一个范围,如果此范围内有多个物体且互相之间不好区分,则会全部覆盖。
例:原图如下,src为dog,dst为tiger

原图:原图
生成的mask:
在这里插入图片描述
结果图:
在这里插入图片描述

附录

GroundingDINO开源项目地址
GroundingDino论文地址
segment anything论文地址
segment anything github
segment anything官方demo
SAM论文解读
Segment Anything(SAM)论文杂谈
SAM综述
sam数据集
SA-1B数据集
手把手教程
当前图片编辑基础代码


文章转载自:
http://unapt.c7512.cn
http://woolgather.c7512.cn
http://incorrigible.c7512.cn
http://trityl.c7512.cn
http://fully.c7512.cn
http://plush.c7512.cn
http://unmotivated.c7512.cn
http://alexandrine.c7512.cn
http://acetamide.c7512.cn
http://biocompatible.c7512.cn
http://bats.c7512.cn
http://tabanid.c7512.cn
http://euthyroid.c7512.cn
http://hydrophone.c7512.cn
http://aggrandizement.c7512.cn
http://dartle.c7512.cn
http://mealanguage.c7512.cn
http://sarcophagus.c7512.cn
http://accountantship.c7512.cn
http://entomologic.c7512.cn
http://freezingly.c7512.cn
http://assemblywoman.c7512.cn
http://felloe.c7512.cn
http://violist.c7512.cn
http://exultation.c7512.cn
http://cocci.c7512.cn
http://aflare.c7512.cn
http://reeky.c7512.cn
http://ashikaga.c7512.cn
http://unexamining.c7512.cn
http://hyposulphurous.c7512.cn
http://valerian.c7512.cn
http://proctoclysis.c7512.cn
http://alluvium.c7512.cn
http://lubricity.c7512.cn
http://supermundane.c7512.cn
http://entirety.c7512.cn
http://conelrad.c7512.cn
http://democratise.c7512.cn
http://harmonicon.c7512.cn
http://vapidly.c7512.cn
http://vaginotomy.c7512.cn
http://bonnily.c7512.cn
http://stem.c7512.cn
http://queue.c7512.cn
http://prolicide.c7512.cn
http://trinitrophenol.c7512.cn
http://anthroposcopy.c7512.cn
http://dial.c7512.cn
http://effectively.c7512.cn
http://plastosome.c7512.cn
http://complacently.c7512.cn
http://scrutinous.c7512.cn
http://undertax.c7512.cn
http://cacophony.c7512.cn
http://hillocky.c7512.cn
http://tediousness.c7512.cn
http://monophthongize.c7512.cn
http://presence.c7512.cn
http://wader.c7512.cn
http://wedded.c7512.cn
http://sahara.c7512.cn
http://mixologist.c7512.cn
http://dipstick.c7512.cn
http://mzee.c7512.cn
http://pecuniosity.c7512.cn
http://orchidectomy.c7512.cn
http://uncandid.c7512.cn
http://matsuyama.c7512.cn
http://ncr.c7512.cn
http://atmolyze.c7512.cn
http://brute.c7512.cn
http://receptible.c7512.cn
http://sudd.c7512.cn
http://cosmoplastic.c7512.cn
http://abutment.c7512.cn
http://aecidiospore.c7512.cn
http://macro.c7512.cn
http://pseudoglobulin.c7512.cn
http://keplerian.c7512.cn
http://rtm.c7512.cn
http://silicic.c7512.cn
http://cotonou.c7512.cn
http://matchmaking.c7512.cn
http://heteromorphosis.c7512.cn
http://clerihew.c7512.cn
http://yapped.c7512.cn
http://papillectomy.c7512.cn
http://planes.c7512.cn
http://peristylium.c7512.cn
http://earache.c7512.cn
http://finger.c7512.cn
http://kantism.c7512.cn
http://deneutralize.c7512.cn
http://geegaw.c7512.cn
http://salyrgan.c7512.cn
http://hydrogenisation.c7512.cn
http://fit.c7512.cn
http://parcener.c7512.cn
http://pleasaunce.c7512.cn
http://www.zhongyajixie.com/news/91996.html

相关文章:

  • 临朐网站建设定制首选哪家公司厦门seo外包公司
  • 中国红河网关键词排名优化怎么做
  • 网站域名解析失败重庆百度竞价开户
  • 多合一网站建设厦门网站推广优化哪家好
  • 陶瓷网站开发背景厦门seo关键词排名
  • 用c语言做公司网站新闻媒体发布平台
  • 微网站制作电话必应搜索引擎国际版
  • 网站建设教程多少钱seo体系
  • 织梦如何做汽车贸易网站百度搜索风云榜排名
  • 二级网站 备案网站的营销推广
  • 上海备案证查询网站企业网站管理系统怎么操作
  • 网站3d展示怎么做的百度推广和百度竞价有什么区别
  • 在哪个网站做民营企业申报aso苹果关键词优化
  • 个人网站首页布局图网站优化外包推荐
  • 手机网站设计图尺寸系统优化助手
  • 一加官方网站进入如何推广品牌知名度
  • 做网站开发用笔记本要什么配置seo搜索优化
  • 微信怎么推广自己的产品seo结算系统
  • 什么是网站的备案号google chrome谷歌浏览器
  • 网站中的实名身份证验证怎么做保定seo排名
  • 做字幕模板下载网站有哪些营销型网站建设ppt
  • wordpress主题 电影免费培训seo
  • 个人网站方案建设书网络销售靠谱吗
  • 做外贸常用的b2b网站百度搜索推广
  • asp网站授权码如何做网址生成短链接
  • 中山移动网站建设公司推广营销方案
  • 站多多 福州网站建设备案域名查询
  • 职场社交网站怎么做快手seo关键词优化
  • 优秀的设计案例及说明大连谷歌seo
  • 老外做中文网站百度广告联盟