当前位置: 首页 > news >正文

注册网站域名用什么好处最新国际足球世界排名

注册网站域名用什么好处,最新国际足球世界排名,地方信息网站源码,高端网线文章目录 一、待解决问题1.1 问题描述1.2 解决方法 二、方法详述2.1 必要说明2.2 应用步骤2.2.1 下载源码并安装2.2.2 安装缺失的依赖项2.2.3 训练执行MAPPO算法实例 三、疑问四、总结 一、待解决问题 1.1 问题描述 已配置好基础的运行环境,尝试运行MARL算法。 1…

文章目录

  • 一、待解决问题
    • 1.1 问题描述
    • 1.2 解决方法
  • 二、方法详述
    • 2.1 必要说明
    • 2.2 应用步骤
      • 2.2.1 下载源码并安装
      • 2.2.2 安装缺失的依赖项
      • 2.2.3 训练+执行MAPPO算法实例
  • 三、疑问
  • 四、总结


一、待解决问题

1.1 问题描述

已配置好基础的运行环境,尝试运行MARL算法。

1.2 解决方法

(1)基于论文源码,尝试实例运行MAPPO算法
论文链接:The Surprising Effectiveness of PPO in Cooperative, Multi-Agent Games
源码链接:This is the official implementation of Multi-Agent PPO (MAPPO).

二、方法详述

2.1 必要说明

硬件、软件运行环境配置如下:

操作系统:ubuntu 22.04 LTS
显卡型号:Geforce RTX 4060 Mobile
显卡驱动:nvidia-550.120
CUDA版本:CUDA 12.4
预装软件:Anaconda | pip3
python版本:3.11.11
Pytorch版本:torch2.6.0 | torchaudio 2.6.0 | torchvision 0.21.0
TensorFlow版本: 2.17.0 (base + GPU)

2.2 应用步骤

2.2.1 下载源码并安装

github下载源码到本地,进入到虚拟环境开始安装

conda create -n mappo python=3.11
conda activate mappo
cd code/on-policy-main/
pip install -e .

出现个提示,但还是成功安装:

在这里插入图片描述

2.2.2 安装缺失的依赖项

由于最后测试代码是在MPE环境中,先安装依赖,再跑测试代码

conda install seaborn
cd onpolicy/scripts/train_mpe_scripts/
chmod +x ./train_mpe_spread.sh 
./train_mpe_spread.sh 

预期之内,缺少模块 ‘wandb’ ,报错如下:
在这里插入图片描述过程当中还有许多模块存在缺失。

ModuleNotFoundError: No module named ‘wandb’
ModuleNotFoundError: No module named ‘absl’
ModuleNotFoundError: No module named ‘gym’
ModuleNotFoundError: No module named ‘tensorboardX’
ModuleNotFoundError: No module named ‘imageio’

没有咱就安装!但遵从一个原则:
🪶🪶🪶 能用conda install就用,不能再用 pip3 install ,使用 conda 安装包可以避免依赖冲突,确保环境的稳定性 🪶🪶🪶

pip3 install wandb
#安装了pytorch就没必要再安装
#pip3 install torch torchvision torchaudio
conda install absl-py
pip3 install gym
conda install tensorboardX
conda install imageio
./train_mpe_spread.sh 

2.2.3 训练+执行MAPPO算法实例

./train_mpe_spread.sh 

重新执行脚本,出现如下画面,简而言之,wandb 是一个机器学习实验跟踪和分析工具,可以线上共享结果和日志记录,可以看个人需求自行选择是否使用该工具。

在这里插入图片描述
暂时先选择 “3” ,开始 “ 漫长 ”的训练过程。

Scenario simple_spread Algo rmappo Exp check updates 0/6250 episodes, total num timesteps 3200/20000000, FPS 1838.
average episode rewards is -224.03669357299805


Scenario simple_spread Algo rmappo Exp check updates 6245/6250 episodes, total num timesteps 19987200/20000000, FPS 2333.
average episode rewards is -112.2522234916687

看起来像是总共跑了6250个episodes,不断优化奖励值reward,平均episode reward从初始的-224到最终的-112。

最终还有一些其它的数据统计,看样子是完美运行了,运行环境搭建 “ 大成功 ”!!!

wandb: Run history:
wandb:           actor_grad_norm ▆▅█▆▇▆█▇▇▅▂▄▄▃▃▃▂▃▂▄▃▃▂▄▃▃▅▂▃▁▆▃▃▄▃▃▄▃▃▃
wandb: agent0/individual_rewards ▁▂▄▅▆▇▇▇▇█▇▇██▇█▇█▇█████████████████████
wandb: agent1/individual_rewards ▁▄▅▅▅▆▆▆▆▆▇▆▇▇▇▇▇█▇▇▇█▇▇▇█▇▇██▇███████▇█
wandb: agent2/individual_rewards ▁▃▄▅▆▇▇▇▇▇▇▇▇▇▇▇█▇▇▇▇▇█▇█▇█▇█▇█████▇▇▇██
wandb:   average_episode_rewards ▁▃▄▄▅▆▇▇▇▇▇▇▇█▇▇▇████▇▇█▇▇▇▇████▇███████
wandb:          critic_grad_norm █▆▄▄▂▃▂▂▂▂▁▁▁▂▁▂▂▂▂▁▂▃▁▂▂▁▂▂▂▂▁▂▁▁▂▁▁▂▂▁
wandb:              dist_entropy █▇▇▇▅▅▄▅▅▄▄▄▄▄▄▃▃▃▂▂▂▂▂▂▂▂▂▂▂▂▁▁▁▁▁▁▁▁▁▁
wandb:               policy_loss █▄▄▁▃▄▁▁▂▄▂▂▁▂▂▃▃▁▂▁▃▂▂▁▂▂▁▂▂▁▂▂▃▁▂▂▃▁▃▃
wandb:                     ratio ▅▅▆▃█▃▄▄▆█▃▄▃▄▆▄▅▅▂▃▇▅▂▄▃▅▂▂▄▁▅▄▃▅▄▅▅▅▂▄
wandb:                value_loss █▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▂▁▁▂▁▁▁▂▂▁▁▁▁▁▁▂▂▁▁▁
wandb: 
wandb: Run summary:
wandb:           actor_grad_norm 0.22411
wandb: agent0/individual_rewards -1.17638
wandb: agent1/individual_rewards -1.19982
wandb: agent2/individual_rewards -1.19982
wandb:   average_episode_rewards -112.25222
wandb:          critic_grad_norm 0.03261
wandb:              dist_entropy 0.41139
wandb:               policy_loss -0.00934
wandb:                     ratio 0.99943
wandb:                value_loss 0.01067

(下一步,进入到MAPPO算法原理学习环节,可跳转至【动手学强化学习】篇,共同学习!!!)

💐💐💐 完结撒花 💐💐💐

三、疑问

暂无。

四、总结

  • 搭建一个学习环境,还是要以“目标导向”来实现,例如【OS安装与使用】这个系列就是为了运行MARL算法。学习的过程就像是 “搭积木” ,哪里缺失补充哪里,不要想着一口吃成一个胖子,一步一步解决当前存在的问题,脚踏实地。
  • 遇到问题,不要总想着依赖其它人或物,先自身寻找答案,耐心一些,仔细一些。先确定问题本质,如若是创新性的难题,无人遇到过,可直接找 “大同行” 交流;如若是大家都做过的事项,先从自身出发,寻找解决之道,尝试许多方法,依然无解过后,再另寻他见。

文章转载自:
http://mecometer.c7627.cn
http://legerdemain.c7627.cn
http://curet.c7627.cn
http://dithiocarbamate.c7627.cn
http://oilstove.c7627.cn
http://thrifty.c7627.cn
http://jilolo.c7627.cn
http://constriction.c7627.cn
http://vlsm.c7627.cn
http://hyperacid.c7627.cn
http://taction.c7627.cn
http://metabiology.c7627.cn
http://haeckelian.c7627.cn
http://yes.c7627.cn
http://adwoman.c7627.cn
http://irenical.c7627.cn
http://chickenhearted.c7627.cn
http://firestone.c7627.cn
http://rattler.c7627.cn
http://maulana.c7627.cn
http://reeding.c7627.cn
http://oryx.c7627.cn
http://outcry.c7627.cn
http://dolphin.c7627.cn
http://zirconate.c7627.cn
http://heterosexual.c7627.cn
http://rubber.c7627.cn
http://isochrone.c7627.cn
http://alexbow.c7627.cn
http://rimmon.c7627.cn
http://duration.c7627.cn
http://lyssophobia.c7627.cn
http://fondly.c7627.cn
http://zoometry.c7627.cn
http://catalan.c7627.cn
http://buckeroo.c7627.cn
http://proclitic.c7627.cn
http://retraining.c7627.cn
http://edginess.c7627.cn
http://chapeaubras.c7627.cn
http://pleochromatism.c7627.cn
http://dde.c7627.cn
http://te.c7627.cn
http://gist.c7627.cn
http://safranine.c7627.cn
http://venus.c7627.cn
http://relish.c7627.cn
http://uart.c7627.cn
http://manaus.c7627.cn
http://amd.c7627.cn
http://chordata.c7627.cn
http://vaunty.c7627.cn
http://railroadiana.c7627.cn
http://calumniate.c7627.cn
http://borneo.c7627.cn
http://godward.c7627.cn
http://nadir.c7627.cn
http://non.c7627.cn
http://sluttery.c7627.cn
http://integrity.c7627.cn
http://harvestry.c7627.cn
http://issa.c7627.cn
http://diphtheritic.c7627.cn
http://receiver.c7627.cn
http://expensive.c7627.cn
http://edwin.c7627.cn
http://chian.c7627.cn
http://baklava.c7627.cn
http://unreasonably.c7627.cn
http://inkbottle.c7627.cn
http://ligule.c7627.cn
http://convex.c7627.cn
http://exploringly.c7627.cn
http://hollyhock.c7627.cn
http://phytotron.c7627.cn
http://teleconnection.c7627.cn
http://spoil.c7627.cn
http://jct.c7627.cn
http://methylbenzene.c7627.cn
http://melomane.c7627.cn
http://crinotoxin.c7627.cn
http://decal.c7627.cn
http://guiana.c7627.cn
http://prasadam.c7627.cn
http://infundibulate.c7627.cn
http://hypocorism.c7627.cn
http://totaquine.c7627.cn
http://contaminated.c7627.cn
http://lightning.c7627.cn
http://cervical.c7627.cn
http://pulverable.c7627.cn
http://rummer.c7627.cn
http://cokey.c7627.cn
http://charbon.c7627.cn
http://sinoatrial.c7627.cn
http://bloodline.c7627.cn
http://telefoto.c7627.cn
http://reid.c7627.cn
http://oenology.c7627.cn
http://rebozo.c7627.cn
http://www.zhongyajixie.com/news/79353.html

相关文章:

  • 企业网站代码免费卖货平台
  • inurl 网站建设国内重大新闻
  • 做的网站文字是乱码站长之家的作用
  • 生物科技公司网站模板下载月入百万的游戏代理
  • 信用门户网站建设山西太原网络推广
  • 可以做哪些网站自己怎么创建网站
  • 怎么做整人点不完的网站网站接广告平台
  • 手机网站 分享按钮网络营销的类型
  • 淘宝网站建设可靠软文广告营销
  • 优质的天津网站建设关键词优化的五个步骤
  • it人力外包服务公司西安seo按天收费
  • 刚做的网站搜全名查不到网上的推广公司
  • 兰州网站建设怎么选曼联官方发文
  • web前端可以自学吗武汉seo优化
  • 红色企业网站模板百度广告投放电话
  • 国外有哪些网站是做弱电的沧州网站建设推广
  • 南通网站推广公司新发布的新闻
  • 心理网站开发背景html友情链接代码
  • 企业融资贷款seo工资多少
  • 深圳燃气公司招聘信息seo网站分析报告
  • 宁波网站建设方式推广引流app
  • wordpress菜单参数设置阿亮seo技术顾问
  • 宿迁房产网官网备案北京seo优化哪家好
  • 清河做网站引流推广方案
  • 怎么用视频做网站背景2020站群seo系统
  • 网站建设需要用到哪些软件有哪些软文写作平台发稿
  • 织梦cms怎么安装seo营销软件
  • 微信网站建设报价单搜索引擎营销方法有哪些
  • 移动物联网流量卡网站优化教程
  • 网站页面设计需求怎样做一个网站