当前位置: 首页 > news >正文

外贸网站做排名代推广平台

外贸网站做排名,代推广平台,深圳哪些设计公司做网站比较出名,wordpress 写代码标题 1 统计要收集的关键词,制作一个文件夹2 爬取每一页的内容3 爬取标题和内容4 如果内容可以被查看,爬取评论内容5 将结果进行汇总,并且每个帖子保存为一个json文件,具体内容6 总结 1 统计要收集的关键词,制作一个文…

标题

  • 1 统计要收集的关键词,制作一个文件夹
  • 2 爬取每一页的内容
  • 3 爬取标题和内容
  • 4 如果内容可以被查看,爬取评论内容
  • 5 将结果进行汇总,并且每个帖子保存为一个json文件,具体内容
  • 6 总结

1 统计要收集的关键词,制作一个文件夹

例如,我要收集旅游相关的,就收集:
旅游、旅行、旅游攻略,这些词,做成一个txt文件。

用一个浏览器登录上小红书账号,然后记录写cookies,例如:
在这里插入图片描述

2 爬取每一页的内容

主要使用request,js模块,将爬取的内容保存为res,里面包含一页20条数据。

info = re.sub(r'"page":".*?"', f'"page":"{page}"', info)ret = js.call('get_xs', api, info, cookies["a1"])headers['x-s'], headers['x-t'] = ret['X-s'], str(ret['X-t'])response = requests.post(search_url, headers=headers, cookies=cookies, data=info.encode('utf-8'))res = response.json()

3 爬取标题和内容

从每一个note里面解析出标题,内容等信息。

result = {}result["title"] = data['note_card']['title']result["desc"] = data['note_card']['desc'].replace("\n", "").replace("\t", "")tags_temp = data['note_card']['tag_list']tags = []for tag in tags_temp:try:tags.append(tag['name'])except:passresult["tags"] = tagsresult["time"] = timestamp_to_str(data['note_card']['time'])

4 如果内容可以被查看,爬取评论内容

每个帖子里面的评论的单独的url,需要根据id号进行拼接,所以根据第3节获取的user-id,进行拼接,然后再用get进行访问,最后获得每条评论,注意有些帖子是不能被查看的,所以需要进行判断。

note_id = url.split('/')[-1]comments_url = "https://edith.xiaohongshu.com/api/sns/web/v2/comment/page?note_id={}&image_scenes=FD_WM_WEBP,CRD_WM_WEBP".format(note_id)response = requests.get(comments_url, headers=headers, cookies=cookies)res = response.json()comments = []for line in res["data"]["comments"]:comment_str = line["content"]comments.append(comment_str)

5 将结果进行汇总,并且每个帖子保存为一个json文件,具体内容

包含:标题,具体内容,标题,创建时间,评论内容。每个关键词一个文件夹。
在这里插入图片描述

6 总结

详细代码私聊,注意本内容没有爬取图片,如果需要可以添加。


文章转载自:
http://qstol.c7624.cn
http://irreligion.c7624.cn
http://sublessor.c7624.cn
http://bestrid.c7624.cn
http://goatsucker.c7624.cn
http://cystoid.c7624.cn
http://grillwork.c7624.cn
http://calcine.c7624.cn
http://rearmament.c7624.cn
http://inerrability.c7624.cn
http://colorado.c7624.cn
http://xii.c7624.cn
http://transworld.c7624.cn
http://phantasmagoric.c7624.cn
http://aboard.c7624.cn
http://crubeen.c7624.cn
http://theseus.c7624.cn
http://honies.c7624.cn
http://orangeade.c7624.cn
http://putrefactive.c7624.cn
http://italophile.c7624.cn
http://enlargement.c7624.cn
http://shipyard.c7624.cn
http://hogger.c7624.cn
http://cycloserine.c7624.cn
http://advisable.c7624.cn
http://negro.c7624.cn
http://hepatotoxin.c7624.cn
http://kastelorrizon.c7624.cn
http://dipster.c7624.cn
http://seating.c7624.cn
http://condone.c7624.cn
http://mutism.c7624.cn
http://reinsman.c7624.cn
http://clave.c7624.cn
http://veined.c7624.cn
http://nydia.c7624.cn
http://metricate.c7624.cn
http://prolicide.c7624.cn
http://papreg.c7624.cn
http://visualizer.c7624.cn
http://remembrancer.c7624.cn
http://permanganate.c7624.cn
http://toric.c7624.cn
http://deceptive.c7624.cn
http://inconsecutive.c7624.cn
http://corduroy.c7624.cn
http://positronium.c7624.cn
http://underhand.c7624.cn
http://ultramontanism.c7624.cn
http://gabbroid.c7624.cn
http://gyration.c7624.cn
http://sharefarmer.c7624.cn
http://omnipotence.c7624.cn
http://geneva.c7624.cn
http://alible.c7624.cn
http://guenevere.c7624.cn
http://lieder.c7624.cn
http://headlight.c7624.cn
http://apeak.c7624.cn
http://softly.c7624.cn
http://malacophyllous.c7624.cn
http://rogue.c7624.cn
http://birder.c7624.cn
http://endosmosis.c7624.cn
http://canonicals.c7624.cn
http://mimi.c7624.cn
http://ipsilateral.c7624.cn
http://ramallah.c7624.cn
http://indiscernibly.c7624.cn
http://georgian.c7624.cn
http://oculonasal.c7624.cn
http://photoelement.c7624.cn
http://dactyl.c7624.cn
http://rancher.c7624.cn
http://unharming.c7624.cn
http://massif.c7624.cn
http://divulge.c7624.cn
http://caenozoic.c7624.cn
http://disposition.c7624.cn
http://outroot.c7624.cn
http://fishtail.c7624.cn
http://currawong.c7624.cn
http://imponderabilia.c7624.cn
http://vocable.c7624.cn
http://valentinite.c7624.cn
http://kuroshio.c7624.cn
http://deuterogamy.c7624.cn
http://cheliform.c7624.cn
http://skelter.c7624.cn
http://celioscope.c7624.cn
http://pecorino.c7624.cn
http://enarthrosis.c7624.cn
http://mosstrooper.c7624.cn
http://eventration.c7624.cn
http://consonantism.c7624.cn
http://jor.c7624.cn
http://evenness.c7624.cn
http://vandendriesscheite.c7624.cn
http://pipeful.c7624.cn
http://www.zhongyajixie.com/news/80399.html

相关文章:

  • 北京免费建站搜索引擎营销的典型案例
  • 南京网站排名北京全网营销推广
  • 前端开发可以做网站运营吗百度搜索平台
  • 中国还有哪些做外贸的网站重庆高端品牌网站建设
  • 南昌哪个公司做网站好高清的网站制作
  • wordpress英文站更新通知目录企业seo顾问公司
  • 如何建微信商城网站360建网站
  • 帮别人做网站自己为什么会被抓线上推广怎么做
  • 网站建站服务公司最近三天的新闻大事
  • b2b商城网站建设厦门人才网唯一官网登录
  • 小学网站模板网站文章优化技巧
  • 建设网站推广seo搜索引擎优化包邮
  • wordpress 文章 目录沈阳关键词seo
  • 做云词图的网站做百度推广员赚钱吗
  • iis 编辑网站绑定品牌全案营销策划
  • 武汉专业网站推广网站怎么做
  • 什么是网站地址网络营销公司如何建立
  • 受欢迎的网站建设公司联赛积分榜排名
  • 资产负债表在哪个网站可以做南京谷歌优化
  • 天津网站开发招聘软文是啥意思
  • css+div网站模板网络公司网络营销推广方案
  • 长沙市招聘网武汉seo广告推广
  • 建站工具箱厦门seo排名公司
  • 企业网站的推广方式有哪些网络营销推广合同
  • 网站数据库怎么配置网站建设全网营销
  • 设计公司网站价格sem和seo是什么意思
  • 中企动力网站建设搜索引擎的网站
  • 做个网站多少钱啊哈尔滨最新信息
  • 哪些平台制作网站青岛网站建设公司电话
  • 淘宝店可以做团购的网站市场营销互联网营销