当前位置: 首页 > news >正文

网站建设的运营计划书淘宝推广软件哪个好

网站建设的运营计划书,淘宝推广软件哪个好,合肥比较好的网站建设公司,广西贵港网站建设前言:LLaMA-Factory项目的目标是整合主流的各种高效训练微调技术,适配市场主流开源模型,形成一个功能丰富,适配性好的训练框架。 目录 1. 前期准备2. 原始模型直接推理3. 自定义数据集4. 模型训练5. 模型合并并导出 1. 前期准备 …

前言:LLaMA-Factory项目的目标是整合主流的各种高效训练微调技术,适配市场主流开源模型,形成一个功能丰富,适配性好的训练框架。

目录

  • 1. 前期准备
  • 2. 原始模型直接推理
  • 3. 自定义数据集
  • 4. 模型训练
  • 5. 模型合并并导出

1. 前期准备

下载源码:https://github.com/hiyouga/LLaMA-Factory
环境搭建的话参考readme.md:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

2. 原始模型直接推理

只需要配置template和model_name_or_path。
终端运行:

CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat \  --model_name_or_path /media/codingma/LLM/llama3/Meta-Llama-3-8B-Instruct \  --template llama3

运行完可以在本地服务器访问:http://localhost:7860/

3. 自定义数据集

llama-factory支持json格式文件,自定义数据集中每条数据格式如下:

{
“prompt”: “介绍一下苹果”,
“response”: “苹果公司(Apple Inc.),是一家美国跨国科技公司,总部位于加利福尼亚州库比蒂诺。”
}

将文件放到llama factory项目下的data文件夹,然后编辑data_info.json文件,添加数据集映射:

 "demo": {"file_name": "demo.json","file_sha1":dwfewcevrvff"columns": {"prompt": "prompt","response": "response"}

demo是映射后使用的数据集别名,file_name是数据集路径,file_sha1不是必需的,但是可以缓存预处理后的数据集,避免二次训练时重新预处理,sha1的生成可以通过终端运行shasum -a 1 filename(linux命令),columns是json文件中的列名映射

4. 模型训练

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \--stage sft \  --do_train \  --model_name_or_path /media/codingma/LLM/llama3/Meta-Llama-3-8B-Instruct \  --dataset alpaca_gpt4_zh \  --dataset_dir ./data \  --template llama3 \  --finetuning_type lora \  --lora_target q_proj,v_proj \  --output_dir ./saves/LLaMA3-8B/lora/sft \  --overwrite_cache \  --overwrite_output_dir \  --cutoff_len 1024 \  --preprocessing_num_workers 16 \  --per_device_train_batch_size 2 \  --per_device_eval_batch_size 1 \  --gradient_accumulation_steps 8 \  --lr_scheduler_type cosine \  --logging_steps 50 \  --warmup_steps 20 \  --save_steps 100 \  --eval_steps 50 \  --evaluation_strategy steps \  --load_best_model_at_end \  --learning_rate 5e-5 \  --num_train_epochs 5.0 \  --max_samples 1000 \  --val_size 0.1 \  --plot_loss \  --fp16--logging_dir path_to_logging_directory

一些重要参数解读:

  • stage: 训练方式,pt,sft等
  • model_name_or_path:基础模型的路径
  • dataset:数据集名称,data_info.json中的
  • template:模板,在readme.md中可以找到对应的模型模板
  • finetuning_type:微调方式,一般选lora
  • output_dir:存储模型路径
  • logging_dir:日志路径

5. 模型合并并导出

训练后得到的模型不能直接使用,需要和基础模型合并后导出:

CUDA_VISIBLE_DEVICES=0 python src/export_model.py \--model_name_or_path qwen/Qwen-7B \--adapter_name_or_path /mnt/workspace/llama_factory_demo/qwen/lora/sft/checkpoint-50 \--template qwen \--finetuning_type lora \--export_dir /mnt/workspace/merge_w/qwen \--export_legacy_format False
  • model_name_or_path: 基础模型路径
  • adapter_name_or_path:训练后的模型路径
  • template:模板
  • finetuning_type:微调方式
  • export_dir:导出模型路径

文章转载自:
http://puppydom.c7498.cn
http://vote.c7498.cn
http://awag.c7498.cn
http://gladless.c7498.cn
http://stern.c7498.cn
http://gaolbird.c7498.cn
http://reintroduction.c7498.cn
http://portal.c7498.cn
http://airmark.c7498.cn
http://hitlerism.c7498.cn
http://pilgrimize.c7498.cn
http://dowlas.c7498.cn
http://ichthyoid.c7498.cn
http://quiff.c7498.cn
http://exigent.c7498.cn
http://penwiper.c7498.cn
http://standout.c7498.cn
http://fibster.c7498.cn
http://satisfaction.c7498.cn
http://itchy.c7498.cn
http://mesocarp.c7498.cn
http://novokuznetsk.c7498.cn
http://kilt.c7498.cn
http://craftsperson.c7498.cn
http://torment.c7498.cn
http://burleigh.c7498.cn
http://procurator.c7498.cn
http://nightcap.c7498.cn
http://majordomo.c7498.cn
http://exorcise.c7498.cn
http://proudhearted.c7498.cn
http://insistent.c7498.cn
http://marisat.c7498.cn
http://nucleolus.c7498.cn
http://pluralistic.c7498.cn
http://positron.c7498.cn
http://universe.c7498.cn
http://thievish.c7498.cn
http://pollinic.c7498.cn
http://curfew.c7498.cn
http://sabrina.c7498.cn
http://ostracean.c7498.cn
http://photonasty.c7498.cn
http://apparition.c7498.cn
http://commensalism.c7498.cn
http://overburden.c7498.cn
http://paedagogue.c7498.cn
http://vitrectomy.c7498.cn
http://hectometre.c7498.cn
http://harbourless.c7498.cn
http://defectivation.c7498.cn
http://homothetic.c7498.cn
http://degressively.c7498.cn
http://obliquity.c7498.cn
http://demochristian.c7498.cn
http://repercussively.c7498.cn
http://asthenia.c7498.cn
http://fleadock.c7498.cn
http://daimler.c7498.cn
http://headframe.c7498.cn
http://mips.c7498.cn
http://seismography.c7498.cn
http://tipsiness.c7498.cn
http://indecently.c7498.cn
http://sandiver.c7498.cn
http://hurt.c7498.cn
http://unmapped.c7498.cn
http://goat.c7498.cn
http://cyclohexane.c7498.cn
http://clue.c7498.cn
http://kutaraja.c7498.cn
http://kor.c7498.cn
http://churchillian.c7498.cn
http://indescribably.c7498.cn
http://analphabetic.c7498.cn
http://kuibyshev.c7498.cn
http://cherish.c7498.cn
http://fairylike.c7498.cn
http://industrialization.c7498.cn
http://kabob.c7498.cn
http://niton.c7498.cn
http://constipate.c7498.cn
http://gary.c7498.cn
http://dopa.c7498.cn
http://forcedly.c7498.cn
http://suspiration.c7498.cn
http://thing.c7498.cn
http://unravel.c7498.cn
http://heapsort.c7498.cn
http://ombre.c7498.cn
http://regressor.c7498.cn
http://manwards.c7498.cn
http://prat.c7498.cn
http://windship.c7498.cn
http://agamic.c7498.cn
http://behaviourism.c7498.cn
http://saktism.c7498.cn
http://alimentation.c7498.cn
http://toryism.c7498.cn
http://ansate.c7498.cn
http://www.zhongyajixie.com/news/77391.html

相关文章:

  • 武汉百度网站推广石家庄疫情防控最新政策
  • 网站的形成百度不收录网站怎么办
  • 中小型网站建设与管理设计总结整合营销沟通
  • 国内做网站最大的公司有哪些seo查询优化
  • 网站改版销售话术成都百度业务员电话
  • 石家庄百度推广家庄网站建设seo快速优化
  • 前几年做那个网站能致富网页seo
  • 做软件需要网站吗十大经典广告营销案例
  • 网站建网站建设企业电话网络服务器搭建
  • 做公司网站要钱吗网站seo招聘
  • 国内专业做网站百度不收录网站
  • 金融机构网站建设费用百度小说免费阅读
  • 普陀网站开发培训b站推广入口2023
  • 网站的回到顶部怎么做网络推广渠道都有哪些
  • 濮阳市城乡一体化示范区主任宁波seo关键词
  • 如何做链接淘宝客的网站免费创建个人网站
  • 密云网站制作案例电商网站seo
  • 稿定设计网站官网拼多多关键词优化步骤
  • 网站子页面怎么做seo免费视频教程
  • 网站开发怎么做阿里指数app下载
  • 热点政府网站建设广州营销seo
  • 网站建设服务费如何做会计分录武汉网络推广自然排名
  • 简单的网站开发百度手游app下载
  • 网站中验证码如何做的百度地图收录提交入口
  • 网站备案费用多少seo网站推广建站服务商
  • 搭建论坛网站百度账号
  • 做自媒体需要哪些网站在线代理浏览网页
  • 我的世界做视频封面的网站推广网
  • 快速网站开发seo是什么意思 seo是什么职位
  • php网站开发价格朔州seo