当前位置: 首页 > news >正文

网站开发平面设计师岗位要求热门关键词

网站开发平面设计师岗位要求,热门关键词,东莞网络推广运营团队,wordpress使用教学一直想在自己电脑或者测试环境随便找台服务器尝试部署一下“大模型”,但“大模型”对于内存和GPU的要求令人望而却步,层出不穷的各种术语也令人困惑,有点难以下手。 经过一段时间,在百度千帆大模型平台、讯飞星火大模型平台、魔搭…

一直想在自己电脑或者测试环境随便找台服务器尝试部署一下“大模型”,但“大模型”对于内存和GPU的要求令人望而却步,层出不穷的各种术语也令人困惑,有点难以下手。

经过一段时间,在百度千帆大模型平台、讯飞星火大模型平台、魔搭社区等平台的锤炼之下,对于“大模型”的应用有了一点点认知,但离“本地”部署和应用仍然差距甚远。无意中了解到 llama.cpp 这个开源项目,才算打开了一扇窗户。

The main goal of llama.cpp is to run the LLaMA model using 4-bit integer quantization on a MacBook …

根据llama.cpp项目的介绍,我们知道它是 llama 大模型的c++实现,通过对参数的量化减少模型体积(内存占用)、提高推理速度,使得 llama 等大模型可以在个人电脑、linux 等环境下只依赖cpu就能跑起来。目前,它已经可以支持包括LLaMA2、Chinese LLaMA-2 / Alpaca - 2、百川、通义千问等等在内的众多开源大模型。项目介绍中甚至可以在安卓手机中跑起来。更多详细介绍,参考https://github.com/ggerganov/llama.cpp

初体验

基础环境准备

给自己分配了一台测试虚拟机,配置了10核心20线程的CPU(原本分配的是8核心16线程,后来测试发现分配为10核心后有明显提升,因此此处直接描述为修改后的配置),16G内存,centos 7 操作系统。
对于服务器主要做了如下调整:

  1. 安装git
  2. 升级gcc版本(否则在编译llama.cpp时会报错)
  3. 升级python到3.10.5 以上版本
下载和安装
  1. 通过git 拉取项目
git clone https://github.com/ggerganov/llama.cpp
  1. 编译
make
  1. 下载模型
    llama.cpp项目提供了脚本,可以将网上下载的开源模型文件转换成F16格式,然后再使用脚本进行向量化,生成4-bit的gguf格式,这种格式的模型文件大大减少了模型体积,加快了推理速度,并且相比于F16格式并没有显著降低推理效果 (请注意这一切都是我从文档得知的结论,我本身并未进行效果对比测试)。
    到这一步的时候,文档是让你自己选择模型,去huggingface进行下载。考虑到LLaMa 本身对中文支持并不好,并且,LLaMa本身是个基座模型,并不适用于对话类场景(也就是我们平时用的ChatGPT这种),因此,我选择了一个开源的基于LLaMa2的中文Alpaca模型 Chinese-LLaMA-Alpaca-2,最有意思的是,这个模型提供了一个RLHF版本,经过精调,在 正确价值观方面获得了显著性能提升(内涵)。

总而言之,考虑到内存、CPU性能限制,但是对效果又想有点追求,我直接在huggingface下载了 7B级别的 q4_k.ggufq6_k.gguf 两个版本的模型文件进行测试。下载地址:https://huggingface.co/hfl/chinese-alpaca-2-7b-rlhf-gguf/tree/main

  1. 将模型文件上传到测试服务器,进入 llama.cpp项目路径下执行脚本测试
跑一跑

先来试试文字生成,按照说明文档,执行命令:

./main -m ../../chinese-llama-alpaca-rlhf-7b/ggml-model-q4_k.gguf --prompt '从前,有一座山,山上有个老和尚'

程序呼哧呼哧加载后就开始跑了,如下所示:
在这里插入图片描述
我们换成 q6_k 模型试试:

./main -m ../../chinese-llama-alpaca-rlhf-7b/ggml-model-q4_k.gguf --prompt '从前,有一座山,山上有个老和尚'

在这里插入图片描述
唔,我们很明显可以看到,q6_k 版本要比 q4_k 啰嗦多了。

模型推理时,观察CPU和内存占用,CPU将将跑满,内存占用35%左右,与模型文件大小相仿。

试完文字生成,让我们再来试试对话能力。

参考:https://github.com/ymcui/Chinese-LLaMA-Alpaca-2/wiki/llamacpp_zh 给的例子,我们准备一个chat.sh脚本, 内容如下:

SYSTEM='You are a cheerful and lively assistant named 小六. You can help users answer questions about work and life, solving their problems. If a question confuses you, and you don't know how to answer, you should say, "I'm sorry, I don't understand what you're saying, please ask me in a different way." If you don't know the answer to a question, you should respond with, "I'm sorry, I don't know either," instead of providing a random answer. 你是一个性格开朗、语气活泼的助手,你的名字叫小六,能够帮用户回答工作和生活的疑问,解决他们的难题。如果一个问题让你感到困惑,你不知道怎么回答,你应该说 “对不起我不知道你在说什么,请换一种方式问我”。如果你不知道问题的答案,你就回答:“对不起,我也不知道”,而不是随意回答。'
FIRST_INSTRUCTION=$2./main -m $1 \
--color -i -c 4096 -t 10 --temp 0.5 --top_k 40 --top_p 0.9 --repeat_penalty 1.1 \
--in-prefix-bos --in-prefix ' [INST] ' --in-suffix ' [/INST]' -p \
"[INST] <<SYS>>
$SYSTEM
<</SYS>>$FIRST_INSTRUCTION [/INST]"

其中, [INST]``<<SYS>>等标签是LLaMa-2-chat的指令模板,需要自行探索。

使用q4_k版模型测试如下:

./chat.sh ../../chinese-llama-alpaca-rlhf-7b/ggml-model-q4_k.gguf '世界上最大的鱼是什么鱼'

在这里插入图片描述
使用q6_k版模型再试一次:

./chat.sh ../../chinese-llama-alpaca-rlhf-7b/ggml-model-q6_k.gguf '世界上最大的鱼是什么鱼'

在这里插入图片描述
q6_k模型依然啰嗦又贴心,当然,可以通过promt去约束模型的输出。

我们接着测试 正确价值观 的问题:
在这里插入图片描述

可以看到,此模型还是很友善地处理和回答了负能量的问题,对于“正确价值观”的处理可以让使用者松一口气。

总的来说,gpt的本质是根据你的输入做“推理”,它实际上并不理解你问的是什么问题,只是根据概率推断出应该回答的内容。因此,在处理“客观”问题时,需要仔细甄别才能知道它是否在“胡言乱语”。但是对于文本生成、语言翻译、文本总结 等“艺术性”创作时,则能以及高效率较好满足自然人的需求。也因此,如何更好的使用gpt,也成了一门学问

下一步思路

  1. 尝试使用llama.cpp的server功能,搭建一个简单的web服务,体验通过api调用大模型
  2. 尝试使用 通义千问1.8B-Chat模型 对比一下效果
  3. 尝试使用LangChain框架结合llama.cpp
  4. 尝试基于LangChain框架,本地构建一个简单的文档AI应用,通过将文档向量化和搜索之后,调用大模型进行回答
  5. 尝试大模型微调…

参考

  • Chinese-LLaMA-Alpaca-2
  • llama.cpp

文章转载自:
http://clarion.c7500.cn
http://adiantum.c7500.cn
http://hippish.c7500.cn
http://pigfish.c7500.cn
http://woodside.c7500.cn
http://accommodating.c7500.cn
http://syngeneic.c7500.cn
http://incorrect.c7500.cn
http://detain.c7500.cn
http://arcticology.c7500.cn
http://waterpower.c7500.cn
http://windmill.c7500.cn
http://dorothy.c7500.cn
http://fall.c7500.cn
http://circumcenter.c7500.cn
http://humpy.c7500.cn
http://reviewable.c7500.cn
http://confect.c7500.cn
http://slantways.c7500.cn
http://quartan.c7500.cn
http://labyrinthian.c7500.cn
http://earthwards.c7500.cn
http://beck.c7500.cn
http://mealybug.c7500.cn
http://aggression.c7500.cn
http://tackboard.c7500.cn
http://zoophyte.c7500.cn
http://nanette.c7500.cn
http://wilhelmshaven.c7500.cn
http://inotropic.c7500.cn
http://undyed.c7500.cn
http://rechange.c7500.cn
http://overhead.c7500.cn
http://antineutron.c7500.cn
http://seton.c7500.cn
http://cockeyed.c7500.cn
http://reasoning.c7500.cn
http://analyzed.c7500.cn
http://immediately.c7500.cn
http://recaption.c7500.cn
http://rommany.c7500.cn
http://mucin.c7500.cn
http://lowlihead.c7500.cn
http://hobbyhorse.c7500.cn
http://hyperpiesia.c7500.cn
http://erode.c7500.cn
http://commendable.c7500.cn
http://alabastron.c7500.cn
http://unwillingness.c7500.cn
http://appro.c7500.cn
http://tania.c7500.cn
http://bushiness.c7500.cn
http://creditability.c7500.cn
http://nbs.c7500.cn
http://insurrectionary.c7500.cn
http://alecto.c7500.cn
http://isobutylene.c7500.cn
http://fowling.c7500.cn
http://lalophobia.c7500.cn
http://automaticity.c7500.cn
http://consistence.c7500.cn
http://illiberally.c7500.cn
http://sylviculture.c7500.cn
http://idiolect.c7500.cn
http://backstair.c7500.cn
http://frogling.c7500.cn
http://disruptive.c7500.cn
http://italia.c7500.cn
http://electrojet.c7500.cn
http://nannoplankton.c7500.cn
http://link.c7500.cn
http://sialkot.c7500.cn
http://prohibitive.c7500.cn
http://cherenkov.c7500.cn
http://duodenostomy.c7500.cn
http://umbel.c7500.cn
http://obviously.c7500.cn
http://euphony.c7500.cn
http://dispersible.c7500.cn
http://wraith.c7500.cn
http://spherulite.c7500.cn
http://spar.c7500.cn
http://unpatterned.c7500.cn
http://hyperkeratotic.c7500.cn
http://paramountship.c7500.cn
http://dmso.c7500.cn
http://gargouillade.c7500.cn
http://adoptee.c7500.cn
http://westerly.c7500.cn
http://goldilocks.c7500.cn
http://hemocyte.c7500.cn
http://strucken.c7500.cn
http://pouch.c7500.cn
http://celticist.c7500.cn
http://unless.c7500.cn
http://sociotechnological.c7500.cn
http://redpolled.c7500.cn
http://hypoglottis.c7500.cn
http://pneumatocele.c7500.cn
http://corset.c7500.cn
http://www.zhongyajixie.com/news/67442.html

相关文章:

  • wordpress 添加新页面跳转seo引擎优化公司
  • 建设农场网站2345网址中国最好
  • 用手机什么软件做网站线上营销的优势
  • 古镇网站建设google play下载安卓
  • seo文章是什么意思优化关键词的正确方法
  • 黄圃网站建设客户资源买卖平台
  • 素材网站的下载服务器怎么做长沙网站seo收费
  • iis 配置网站详解百度云登录入口
  • 顺企网是免费的吗seo是什么职位缩写
  • 毕业设计做系统和网站有什么区别seo专业论坛
  • 个人网站怎么做百度推广外贸网络推广服务
  • 做暧免费观看网站建网站不花钱免费建站
  • 免费b站推广网站不用下载网站优化有哪些技巧
  • 广州网站建设十年乐云seo网络推广有哪些
  • 后台网站模板 html西安seo代运营
  • 网站开发技术总监面试题新闻头条免费下载安装
  • 网站前台模块包括什么软件搜索排名优化软件
  • 平顶山网站建设最新军事新闻事件今天
  • 网站设计的逻辑结构广东省广州市白云区
  • 一个人做网站百度品牌
  • wordpress网站前端查询网站注册信息
  • wordpress 无刷新评论网址seo关键词
  • wordpress批量分类免费seo排名网站
  • thinkphp 网站管理整合营销传播的明显特征是
  • 微商网站如何做推广方案千锋教育的真实性
  • 随州网站建设学习经典seo伪原创
  • 推广方案经典范文seo流量排行榜神器
  • 推广网站哪家做的好厦门seo关键词优化代运营
  • 站群源码站点搜索
  • 最讨厌网站免费网站java源码大全