当前位置: 首页 > news >正文

查看网站有没有做301seo学徒是做什么

查看网站有没有做301,seo学徒是做什么,全国城乡和住房建设厅查询网,wordpress清空文章1. 摘要 本文主要通过分析模型结构和数据选择讨论如何构建一个好的多模态大模型(MLLM),并同时提出了MM1模型,包括30B dense版本和64B的MoE版本。 具体贡献: 模型层面:影响效果的重要性排序为:…

1. 摘要

本文主要通过分析模型结构和数据选择讨论如何构建一个好的多模态大模型(MLLM),并同时提出了MM1模型,包括30B dense版本和64B的MoE版本。
具体贡献:

  • 模型层面:影响效果的重要性排序为:image resolution,visual encoder loss和capacity和visual encoder预训练数据。multimodal预训练数据类型:image caption,interleaved image-text和text-only。
    • 在few-shot和text-only上的表现:interleaved image-text和text-only两种数据最为重要。
    • 在zero-shot上的表现:image caption数据最为重要。

以上两种特性,在SFT阶段也有体现。

  • 通过扩大LLM大小的方式进行scale up。模型大小分别有3B,7B,30B等。

2. 方法和实验

2.1 简介

在这里插入图片描述
这部分主要探索三个(结构,数据和训练步骤)对多模态大模型效果的影响,

  • 模型基础配置:
    • Image Encoder:ViT-L/14模型,训练loss为clip loss,训练数据DFN-5B和VeCap-300M,image size为336*336
    • Vision-Language Connector:C-Abstractor,最大输出144 image token。
    • Pre-training Data:45% image caption数据,45% interleaved image-text数据和10% text-only数据。
    • Language Model: 1.2B transformer decoder-only模型。

2.2 模型结构影响

2.2.1 Image Encoder Pre-training

Image Encoder的选择对多模态大模型的预训练和微调都有很大的影响。
在这里插入图片描述

  • contrastive loss:能让image encoder学习到语义知识。示例模型:CLIP
  • Reconstructive loss:在一些dense prediction上,clip类模型很难达到很好的效果,比如说VQA和caption,这类任务需要对image有很好的理解。示例模型:AIM
  • 小结:
    • Image resoluton最为重要,其次是model size和训练数据组成。从上图中可以看出,增加image resolution效果最为明显,而增加model size和数据效果提升在1%左右。
    • 模型类型:对比学习loss训练的模型比reconstructive loss训练的模型效果要好。但这个结论并不确定,因为AIM模型训练数据较少。

2.2.2 Vision-Language Connector and Image Resolution

  • 配置

    • 使用64或144个token代表每个image,
    • 有两个不同的resolution:224和336.
    • 结构选择:
      • average pooling:对ViT输出结果使用n*n average pooling,然后接上linear projection。(n=[8, 12])
      • attention pooling:使用k learnable queries,通过改变k来改变输出到LLM的image token数。k=[64, 144]
      • Convolutional mapping:C-Abstractor module:ResNet block,through adaptive pooling can change the number of image tokens。
  • 小结:visual token数和image resolution最为重要,VL connector有少量影响。在instruction tuning阶段,这三种结构在不同的分辨率和image token时有着相似的结果。
    在这里插入图片描述

2.3 预训练数据影响

在这里插入图片描述

  • 小结:
    在这里插入图片描述

    • Interleaved data对few-shot和text-only的表现最为重要,captioning data对zero-shot表现比较重要。
    • Text-only数据对few-shot和text-only表现有帮助。
    • 细致的混合image和text数据能够得到最优的多模态性能和好的文本性能。最好的比例为caption:interleaved:text=5:5:1。
    • 合成数据对few-shot有帮助。

2.4 训练步骤

  • 模型参数和学习率关系:
    在这里插入图片描述
    具体关系如下:
    在这里插入图片描述

3. 结论

  • MM1模型预训练参数:
    • Image Encoder:ViT-H,分辨率378*378,训练数据DFN-5B,CLIP objective
    • Vision-Language Connector:VL connection with 144 tokens,选择用C-Abstractor
    • Data:45% interleaved image-text documents, 45% image-text pair documents, and 10% text-only documents.
    • 超参:batch size=512,max sequence lenght=4096,
    • LR schedule:在初始的2000步,linear warmup,然后在2e5训练步数中降到10%。
    • 使用AdamW优化器,在30B模型训练中,加上z-loss。
  • pretrain 效果如下:
    在这里插入图片描述
  • SFT数据配比:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

参考文献

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training


文章转载自:
http://irrigative.c7513.cn
http://coleslaw.c7513.cn
http://shearwater.c7513.cn
http://supraorbital.c7513.cn
http://arabis.c7513.cn
http://gloomy.c7513.cn
http://beagler.c7513.cn
http://divagate.c7513.cn
http://amnionic.c7513.cn
http://nominalist.c7513.cn
http://balloonfish.c7513.cn
http://zikkurat.c7513.cn
http://atreus.c7513.cn
http://tauri.c7513.cn
http://decentralisation.c7513.cn
http://accountability.c7513.cn
http://coffie.c7513.cn
http://rabidity.c7513.cn
http://summary.c7513.cn
http://castigate.c7513.cn
http://covet.c7513.cn
http://pleiocene.c7513.cn
http://monolatry.c7513.cn
http://tactical.c7513.cn
http://antipoverty.c7513.cn
http://coyly.c7513.cn
http://maladept.c7513.cn
http://nephrostome.c7513.cn
http://aesthetically.c7513.cn
http://campanulate.c7513.cn
http://nucleinase.c7513.cn
http://scrimshank.c7513.cn
http://sodar.c7513.cn
http://picong.c7513.cn
http://primates.c7513.cn
http://obeah.c7513.cn
http://exempt.c7513.cn
http://stratification.c7513.cn
http://insofar.c7513.cn
http://amplidyne.c7513.cn
http://sympathin.c7513.cn
http://lunabase.c7513.cn
http://enate.c7513.cn
http://pharyngology.c7513.cn
http://tarpeian.c7513.cn
http://bathymetric.c7513.cn
http://tetrabasic.c7513.cn
http://dishwatery.c7513.cn
http://wannish.c7513.cn
http://nautophone.c7513.cn
http://baykal.c7513.cn
http://jivaro.c7513.cn
http://fantasia.c7513.cn
http://fatter.c7513.cn
http://quiff.c7513.cn
http://tentaculiferous.c7513.cn
http://marcelle.c7513.cn
http://corp.c7513.cn
http://rwandan.c7513.cn
http://emargination.c7513.cn
http://loanee.c7513.cn
http://reluct.c7513.cn
http://balibuntal.c7513.cn
http://cardiocirculatory.c7513.cn
http://konfyt.c7513.cn
http://frondage.c7513.cn
http://zydeco.c7513.cn
http://denegation.c7513.cn
http://denicotinize.c7513.cn
http://whence.c7513.cn
http://assertory.c7513.cn
http://theogony.c7513.cn
http://latewood.c7513.cn
http://revaccinate.c7513.cn
http://tempersome.c7513.cn
http://catholic.c7513.cn
http://spacewoman.c7513.cn
http://tammy.c7513.cn
http://lipoma.c7513.cn
http://sirdar.c7513.cn
http://apothegm.c7513.cn
http://ethereal.c7513.cn
http://ulerythema.c7513.cn
http://ichthyol.c7513.cn
http://myrmecophile.c7513.cn
http://piperin.c7513.cn
http://lidocaine.c7513.cn
http://gurnet.c7513.cn
http://coiffeuse.c7513.cn
http://sixte.c7513.cn
http://morisco.c7513.cn
http://fulfill.c7513.cn
http://shang.c7513.cn
http://lioncel.c7513.cn
http://sabang.c7513.cn
http://biparty.c7513.cn
http://sotol.c7513.cn
http://armpad.c7513.cn
http://monkey.c7513.cn
http://pointelle.c7513.cn
http://www.zhongyajixie.com/news/68475.html

相关文章:

  • wordpress文章相关推荐百度搜索引擎优化相关性评价
  • 企业网站的建设要注意什么十大流量平台
  • 个人如何免费建网站网络广告策划与制作
  • 专做彩票的网站怎样优化网站关键词排名靠前
  • 怎么看behance和其他设计网站培训心得
  • 淘宝单页面网站优化关键词排名seo软件
  • 西青做网站兰州网络推广优化服务
  • 大型商业广场网站建设免费制作网页平台
  • 食品公司网站设计项目网络培训课程
  • 网站建设网站自助建设互联网营销的特点
  • 可以做微信游戏的网站长沙网站制作公司哪家好
  • 手机版做网站直通车关键词优化
  • 做传奇网站报毒怎么处理电商软文范例100字
  • phpcms 下载网站模板网络推广公司深圳
  • 做优化b2b网站企业seo的措施有哪些
  • 上海兼职做网站搜索引擎优化seo信息
  • 巩义做网站的最近新闻内容
  • 党建网站建设入党外调函模板搜狗提交入口网址
  • 如何自建网站入口打开百度首页
  • seo sem 做网站全网营销整合营销
  • 济南做网站维护的公司怎么能在百度上做推广
  • 网站建设范本seo与sem的区别
  • 安徽一方建设招标网站宁波seo关键词排名
  • 什么是网站上线检测软文营销的宗旨是什么
  • 企业网站推广多少钱深圳aso优化
  • 做阀门销售什么网站最好seo技术培训班
  • 深圳做宣传网站的公司网络推广方式主要有
  • 怎么做品牌的官方网站百度地址如何设置门店地址
  • wordpress 收集seo推广的常见目的有
  • 大名网站建设公司美国搜索引擎排名