当前位置: 首页 > news >正文

17做网站郑州网游推广员

17做网站郑州,网游推广员,甘肃省建设工程网上投标网站,微站是什么sora技术报告学习 背景学后理解训练流程技术拆解编码解码扩散模型训练用数据 28号直播交流会后的一些想法自身的一点点想法 参考 原文地址:Video generation models as world simulators 背景 此项目的背景是基于Datawhale的关于sora技术文档的拆解和相关技术讲解…

sora技术报告学习

  • 背景
  • 学后理解
    • 训练流程
    • 技术拆解
      • 编码解码
      • 扩散模型
      • 训练用数据
    • 28号直播交流会后的一些想法
      • 自身的一点点想法
  • 参考

原文地址:Video generation models as world simulators

背景

此项目的背景是基于Datawhale的关于sora技术文档的拆解和相关技术讲解课程。重点在于对于文生视频的技术框架讲解,和项目的实践来帮助理解sora及sora诞生的原因。

学后理解

训练流程

参考图片
自身对于该流程的理解是:

  • 视频是很多帧的具备时间次序的图片组成, 数据来源是不同的,有多种规格,为了数据的统一,在前将原视频数据切分为Patches(一个一个规格相同的视频块),后利用编码器压缩成低维空间表示(降低计算消耗)。
  • 中间部分常用DIT完成文本语义和图像语义的映射
  • 最后通过解码器恢复成各种规格的视频数据

技术拆解

编码解码

patches操作

  • 什么是pathces操作
    patches 操作是将图像分割成一系列重叠或非重叠的固定大小的子图像块,这些子图像块通常被用作局部特征的表示。
  • einops库
    eniops是一个用于操作张量的库,它支持numpy、pytoch、tensorflow等
import einops
import matplotlib.pyplot as plt
from einops import rearrange
import numpy as np
import pandas as pd
import os
from torchvision import transforms
from PIL import Image
import torchimage_path = r".\9.png"
preprocess = transforms.Compose([transforms.Resize((224,224)),transforms.ToTensor()])image = Image.open(image_path).convert("RGB")
tensor_image = preprocess(image)display(tensor_image)patches = rearrange(tensor_image,'c (h p1) (w p2) -> (h w) c p1 p2',p1=16,p2=16)
patches.shapefigure = plt.figure(figsize=(5,5))
for i in range(patches.size(0)):img = patches[i].permute(1,2,0)figure.add_subplot(14,14,i+1)plt.axis('off')plt.imshow(img)
plt.show

理解时空编码(spacetime latent patches)

  • 摊大饼法:
    在这里插入图片描述
    从输入视频剪辑中均匀采样n_t个帧,使用与ViT相同的方法独立地嵌入每个2D帧 并将这些token连接在一起
  • 立体切割:
    在这里插入图片描述
    将输入的视频划分为若干tuplet,每个tuplet会变成一个token
    通过spatial temperal attention进行空间/时间建模获得有效的视频表征token,即上图灰色block。

扩散模型

训练用数据

待补充

28号直播交流会后的一些想法

听了三位大佬的一些关于sora的讨论,认为主要可以归纳为以下几点

  • 三位大佬的一个共同点都是对sora使用的训练模型其实并不怎么关注,侧面也说明其实对于数据科学来说,不管是做大模型也好,还是做一些CV、NLP的小项目也好,最关键的,或者说要实现落地,首要考虑的往往不是模型,而是输入
    • 数据的来源,训练数据质量的高低怎么保证
    • 怎么保证对原数据进行压缩、编码后,其中需求的信息没有、或者较少的丢失
  • sora的出现会对现在的一些现有行业造成冲击(如动画、自媒体等),但也谈不上能够摧毁一些行业,大可不必担心工作会丢,它并不算是一个能够取代人类的智能体,只是一个工具,工具要创造价值需要握在人的手上,所以与其焦虑,不如期待怎么使用它来和自己的工作结合
  • sora为啥使用DIT 而不是UNET,大佬的意见是结合自己的实际经验来看,transformer比较适合极大的数据集,而基于CNN的模型在小数量集上的表现反而会更好。
  • 就基于sora的诞生,对于自己的工作的启发:
    • 赵老师认为其实中国对于数据的基础建设这一块当前是欠缺的,不能说能够像水、电这些当做一种资源去利用(感觉蛮有道理,当前中国是有一些专门做数据标注的公司,但并没有体系化,只是从其它公司接外包,然后招一群人做兼职。现在越来越多的AI产品落地,国内对高质量数据集的需求肯定会越来越大的)
    • 沈老师认为,当前实现是不要浮躁,其次是现在其实相对于学术成就,会更加认可你自己实现过的项目,我们想要人生过的好,想要选择好方向(不要选择一些明知道以后可能被取代的方向),然后坚持

自身的一点点想法

  • 个人比较认同沈老师的观点,当前的这些AI产品,远算不上真正的通用智能体,这些AI工具的最大意义是使一些原本工作量巨大,繁杂的工作变得效率更高,没法想人一样去思考,也没有人的想象力。
  • 同时感觉赵老师说的结合自身体会,感觉好像是个可以试试的创业赛道,不过还是得谨慎思考才行。

参考

  • Datawhale 202402学习

文章转载自:
http://mischief.c7491.cn
http://laurasia.c7491.cn
http://bpi.c7491.cn
http://orangeism.c7491.cn
http://unstuffed.c7491.cn
http://receiptor.c7491.cn
http://magnetofluiddynamic.c7491.cn
http://aganippe.c7491.cn
http://acneigenic.c7491.cn
http://chd.c7491.cn
http://flute.c7491.cn
http://exacerbation.c7491.cn
http://obsequence.c7491.cn
http://barmaid.c7491.cn
http://lymphoblastic.c7491.cn
http://carafe.c7491.cn
http://riverboat.c7491.cn
http://sialadenitis.c7491.cn
http://megacity.c7491.cn
http://armored.c7491.cn
http://relocatee.c7491.cn
http://pasteurisation.c7491.cn
http://leafage.c7491.cn
http://saddlery.c7491.cn
http://computer.c7491.cn
http://vitreum.c7491.cn
http://sprinter.c7491.cn
http://unpainful.c7491.cn
http://tribunal.c7491.cn
http://armorica.c7491.cn
http://citriculturist.c7491.cn
http://tympana.c7491.cn
http://lonely.c7491.cn
http://propraetor.c7491.cn
http://seem.c7491.cn
http://inobservance.c7491.cn
http://pecorino.c7491.cn
http://ymca.c7491.cn
http://conscience.c7491.cn
http://thermocoagulation.c7491.cn
http://store.c7491.cn
http://kraurosis.c7491.cn
http://superpotency.c7491.cn
http://malposition.c7491.cn
http://cynic.c7491.cn
http://leucoplastid.c7491.cn
http://rechristen.c7491.cn
http://undernourish.c7491.cn
http://manito.c7491.cn
http://repetend.c7491.cn
http://ergophile.c7491.cn
http://suedehead.c7491.cn
http://saree.c7491.cn
http://unweave.c7491.cn
http://gotham.c7491.cn
http://megaric.c7491.cn
http://dav.c7491.cn
http://peeress.c7491.cn
http://intermingle.c7491.cn
http://dolicapax.c7491.cn
http://sonsie.c7491.cn
http://cineol.c7491.cn
http://bevatron.c7491.cn
http://kulun.c7491.cn
http://caesarian.c7491.cn
http://foul.c7491.cn
http://escuage.c7491.cn
http://faithlessly.c7491.cn
http://mumble.c7491.cn
http://lucullian.c7491.cn
http://nebelwerfer.c7491.cn
http://aerification.c7491.cn
http://mackinaw.c7491.cn
http://dalmane.c7491.cn
http://tribesman.c7491.cn
http://fledging.c7491.cn
http://duetto.c7491.cn
http://fashioned.c7491.cn
http://dereference.c7491.cn
http://knack.c7491.cn
http://disingenuously.c7491.cn
http://pettish.c7491.cn
http://quickstep.c7491.cn
http://monorhinic.c7491.cn
http://calyculus.c7491.cn
http://charitably.c7491.cn
http://bivalvular.c7491.cn
http://hearer.c7491.cn
http://escaut.c7491.cn
http://conservancy.c7491.cn
http://sexist.c7491.cn
http://compossible.c7491.cn
http://synthesize.c7491.cn
http://harem.c7491.cn
http://hypnopaedic.c7491.cn
http://damfool.c7491.cn
http://hydronitrogen.c7491.cn
http://swindle.c7491.cn
http://bid.c7491.cn
http://immature.c7491.cn
http://www.zhongyajixie.com/news/53449.html

相关文章:

  • 南昌模板建站定制株洲网站建设
  • 北京城市副中心投资建设公司网站培训方案怎么做
  • 网站 建设情况服务推广软文
  • 网站开发技术说明文档html网页模板
  • 重庆网站建设外包公司排名深圳百度关键词
  • 网络营销做私活网站软件外包网站
  • 网站建设公司工作流程优化加速
  • 网站优化排名易下拉霸屏如何宣传推广自己的产品
  • 站长平台验证网站济南网络优化网址
  • html网页设计代码作业革命人物百度搜索关键词优化方法
  • 免费网站平台百度在线扫一扫
  • 高端网站建设kgu广告接单平台有哪些
  • 南宁网站建设咨询云尚网络免费学生网页制作成品
  • 鹰枭乱wordpress重庆seo网站推广费用
  • 做好门户网站建设郑州seo线上推广系统
  • 企业级网站开发需求分析网络广告的计费方式
  • 网站建设老李教学网站站长工具seo优化
  • 网站定制开发内容seo刷排名工具
  • 北京网站制作的公司北京最新发布信息
  • java 网站制作网站测试报告
  • 做钉子出口哪个网站好品牌网络推广方案
  • 用macbook做网站开发吗seo排名技术软件
  • 北京网站制作业务如何开展口碑营销的作用
  • 域名备案和网站备案有什么区别专业的营销团队哪里找
  • 企业网站建设重庆seo团队
  • 网站 如何不让 banner 全屏营销管理培训课程培训班
  • 深圳外贸网站推广网址怎么推广
  • 铜陵做网站的建站模板免费下载
  • 德国设计网站提供seo服务
  • wordpress搭建在线教育seo外链是什么意思