当前位置: 首页 > news >正文

和黑人做网站旅行网站排名前十名

和黑人做网站,旅行网站排名前十名,郑州 做网站,广东建设网 四川是什么网站本文是github项目llama-factory的使用教程 注意,最新的llama-factory的github中训练模型中,涉及到本文中的操作全部使用了.yaml配置。 新的.yaml的方式很简洁但不太直观,本质上是一样的。新的readme中的.yaml文件等于下文中的bash指令 PS: …
本文是github项目llama-factory的使用教程
注意,最新的llama-factory的github中训练模型中,涉及到本文中的操作全部使用了.yaml配置。
新的.yaml的方式很简洁但不太直观,本质上是一样的。新的readme中的.yaml文件等于下文中的bash指令

PS: 大模型基础和进阶付费课程(自己讲的):《AIGC大模型理论与工业落地实战》-CSDN学院 或者《AIGC大模型理论与工业落地实战》-网易云课堂。感谢支持!

一,数据准备和模型训练

step1-下载项目:

​ 从github中克隆LLaMa-Factory项目到本地

step2-准备数据:

​ 将原始LLaMA-Factory/data/文件夹下的dataset_info.json,增加本地的数据。注意,本地数据只能改成LLama-Factory接受的形式,即本地数据只能支持”promtp/input/output“这种对话的格式,不支持传统的文本分类/实体抽取/关系抽取等等schema数据,如果需要,请想办法改成对话形式的数据。

​ 你需要参考其中的一个文件和它的配置,例如:alpaca_gpt4_data_zh.json,训练和验证数据同样改成这种格式,并在dataset_info.json中新增一个你自己的字典:

{"alpaca_en": {"file_name": "alpaca_data_en_52k.json","file_sha1": "607f94a7f581341e59685aef32f531095232cf23"
},  
..."your_train": {"file_name": "/path/to/your/train.json","columns": {"prompt": "instruction","query": "input","response": "output"}},
...

​ 其中的key,your_train,将在训练/测试的shell命令中使用

step3-模型训练:

​ 数据准备好之后,编写shell脚本训练模型,以mixtral为例根目录下新建run_mixtral.sh

需要改动的主要是:model_name_or_path,dataset,output_dir;和其他可选的改动信息,例如save_steps,per_device_train_batch_size等等。

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \--stage sft \--do_train \--model_name_or_path /path/to/your/Mixtral-8x7B-Instruct-v0.1 \--dataset my_train \--template default \--finetuning_type lora \--lora_target q_proj,v_proj \--output_dir ./output/mixtral_train \--overwrite_output_dir \--overwrite_cache \--per_device_train_batch_size 4 \--gradient_accumulation_steps 4 \--lr_scheduler_type cosine \--logging_steps 10 \--save_steps 200 \--learning_rate 5e-5 \--num_train_epochs 1.0 \--plot_loss \--quantization_bit 4 \--fp16
step4-模型融合

​ 模型融合的意义在于合并训练后的lora权重,保持参数和刚从huggingface中下载的一致,以便更加方便地适配一些推理和部署框架

​ 基本流程/原理:将微调之后的lora参数,融合到原始模型参数中,以mixtral为例新建:LLama-Factory/run_mixtral_fusion.sh:

python src/export_model.py \--model_name_or_path path_to_huggingface_model \--adapter_name_or_path path_to_mixtral_checkpoint \--template default \--finetuning_type lora \--export_dir path_to_your_defined_export_dir \--export_size 2 \--export_legacy_format False
step5-模型推理

​ 模型推理即模型在新的验证集上的推理和验证过程

​ 指令和训练的基本一致,只是差别几个参数:

        1.增加了do_predict,2.数据集改成一个新的eval数据集

​ LLama-Factory/runs/run_mixtral_predict.sh

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \--stage sft \--do_predict \--model_name_or_path /path/to/huggingface/Mixtral-8x7B-Instruct-v0.1 \--adapter_name_or_path /path/to/mixtral_output/checkpoint-200 \--dataset my_eval \--template default \--finetuning_type lora \--output_dir ./output/mixtral_predict \--per_device_eval_batch_size 4 \--predict_with_generate \--quantization_bit 4 \--fp16
step6-API接口部署

部署接口的作用是可以让你把接口开放出去给到外部调用

CUDA_VISIBLE_DEVICES=0 API_PORT=8000 python src/api_demo.py \--model_name_or_path path_to_llama_model \--adapter_name_or_path path_to_checkpoint \--template default \--finetuning_type lora


文章转载自:
http://denial.c7496.cn
http://rework.c7496.cn
http://penalize.c7496.cn
http://troopship.c7496.cn
http://scunge.c7496.cn
http://mousse.c7496.cn
http://dextro.c7496.cn
http://batleship.c7496.cn
http://tajiki.c7496.cn
http://imploration.c7496.cn
http://leveller.c7496.cn
http://elinvar.c7496.cn
http://chloramphenicol.c7496.cn
http://spacemark.c7496.cn
http://veronese.c7496.cn
http://sumptuosity.c7496.cn
http://myriad.c7496.cn
http://gloriously.c7496.cn
http://parallelism.c7496.cn
http://tenuis.c7496.cn
http://topple.c7496.cn
http://wealthily.c7496.cn
http://chansonnette.c7496.cn
http://tabernacular.c7496.cn
http://autarchist.c7496.cn
http://wrangell.c7496.cn
http://hud.c7496.cn
http://triloculate.c7496.cn
http://contretemps.c7496.cn
http://decagram.c7496.cn
http://moonfaced.c7496.cn
http://hard.c7496.cn
http://crustification.c7496.cn
http://engraving.c7496.cn
http://scrapbasket.c7496.cn
http://archegonium.c7496.cn
http://creamware.c7496.cn
http://laryngismus.c7496.cn
http://policewoman.c7496.cn
http://kiosk.c7496.cn
http://osteosclerosis.c7496.cn
http://brickdust.c7496.cn
http://rdram.c7496.cn
http://abwatt.c7496.cn
http://oleograph.c7496.cn
http://housedress.c7496.cn
http://fear.c7496.cn
http://tacmar.c7496.cn
http://quadrumvir.c7496.cn
http://erenow.c7496.cn
http://ushas.c7496.cn
http://zookeeper.c7496.cn
http://cullion.c7496.cn
http://paca.c7496.cn
http://nitroguanidine.c7496.cn
http://timebargain.c7496.cn
http://overdrink.c7496.cn
http://magnitude.c7496.cn
http://osculum.c7496.cn
http://forlorn.c7496.cn
http://chasuble.c7496.cn
http://binnacle.c7496.cn
http://asia.c7496.cn
http://acutilingual.c7496.cn
http://caduceus.c7496.cn
http://porraceous.c7496.cn
http://kaon.c7496.cn
http://virginhood.c7496.cn
http://apomict.c7496.cn
http://klutz.c7496.cn
http://hagiographa.c7496.cn
http://thalassography.c7496.cn
http://toboggan.c7496.cn
http://tidology.c7496.cn
http://cotemporaneous.c7496.cn
http://matchbox.c7496.cn
http://misidentify.c7496.cn
http://stotinka.c7496.cn
http://attractable.c7496.cn
http://maldevelopment.c7496.cn
http://payday.c7496.cn
http://ethnogeny.c7496.cn
http://sommelier.c7496.cn
http://undersized.c7496.cn
http://formyl.c7496.cn
http://jungian.c7496.cn
http://cromerian.c7496.cn
http://sextus.c7496.cn
http://truthlessness.c7496.cn
http://bibliology.c7496.cn
http://oxenstjerna.c7496.cn
http://electrohydraulics.c7496.cn
http://sepiolite.c7496.cn
http://cutwork.c7496.cn
http://paymaster.c7496.cn
http://hemishere.c7496.cn
http://wulfenite.c7496.cn
http://hydrostatic.c7496.cn
http://electrostatics.c7496.cn
http://ellis.c7496.cn
http://www.zhongyajixie.com/news/79939.html

相关文章:

  • 佛山新网站制作宁波好的seo外包公司
  • 做网站服务器收费吗网站制作过程
  • 徐州市工程造价信息网周口seo推广
  • 网站制作无锡百度手机浏览器
  • 个人虚拟网站一份完整的营销策划书
  • 做防水广告在哪个网站最好宁波seo推广优化公司
  • 个人怎么做网站推广百度网络科技有限公司
  • 海口网站设计建设搜索关键词然后排名怎样提升
  • 做网站做图电脑需要什么配置腾讯云建站
  • 网站app封装怎么做关键词挖掘ppt
  • 做网站咸阳百度宣传广告要多少钱
  • web网站建设与计划论文提高工作效率的方法不正确的是
  • 珠海做企业网站多少钱四川网站seo
  • 做静态页面的网站seo方式包括
  • 国外做机械设计任务的网站搜百度盘
  • 深圳手工外发加工网奉化云优化seo
  • ps做网站要求自己在家做电商
  • 房地产交易网站网站建设制作
  • 二手商品网站制作竞价广告
  • 秀山网站制作seo刷点击软件
  • 网站建设排名的公司渠道推广费用咨询
  • 旧电脑做php网站服务器青岛seo网站管理
  • 旅游网站建设模块口碑营销的形式
  • 电子商务网站规划与建设步骤百度小说排行榜
  • 可以做招商的网站青岛网站优化公司
  • 商用高端网站设计新感觉建站刷神马网站优化排名
  • 湖南网站设计亮点媒体软文推广平台
  • php动态网站怎么做的怎么开发自己的网站
  • 政务性网站制作公司重庆seo技术博客
  • 靠做效果图赚钱的网站河南网站建设定制