当前位置: 首页 > news >正文

微信小程序客户管理系统南京seo优化

微信小程序客户管理系统,南京seo优化,免费做公司手机网站,国外的网站模板类网站文章目录 前期准备探索该网页的HTML码的特点开始编写代码存入文件总的程序文件存储效果 前期准备 随便找个网站进行爬取,这里我选择的是(一个卖书的网站) https://www.bookschina.com/24hour/62700000/ 我的目的是爬取这个网站的这个页面的书籍的名称以…

在这里插入图片描述

文章目录

  • 前期准备
  • 探索该网页的HTML码的特点
  • 开始编写代码
  • 存入文件
  • 总的程序
  • 文件存储效果

前期准备

随便找个网站进行爬取,这里我选择的是(一个卖书的网站)
https://www.bookschina.com/24hour/62700000/
在这里插入图片描述

我的目的是爬取这个网站的这个页面的书籍的名称以及相对应的价格

探索该网页的HTML码的特点

在该网页右键,选择检查,就可以看到下面的样子
在这里插入图片描述
然后按下面图片的第一个按键(作用是:当你鼠标停留在网页时,会自动显示到对应的网页代码)
在这里插入图片描述

查找书名的特点

在这里插入图片描述
在这里插入图片描述

我们发现,书名是位于<h2 class = "name" >标签的 <a >标签里面的

在这里插入图片描述

同理,可以找到价格是位于<div class = "priceWrap" 里面的<span class = "swllPrice>标签里面的 "

那么这么就好办了

开始编写代码

import requests
from bs4 import BeautifulSoup# 设置请求头,模拟浏览器访问
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36"
}# 发送GET请求获取页面内容
response = requests.get(r'https://www.bookschina.com/24hour/62700000/', headers=headers)# 打印HTTP响应状态码
print(response.status_code)# 获取页面内容
content = response.text# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(content, "html.parser")# 存储书名的列表
namestore = []# 存储价格的列表
pricestore = []# 查找所有class为"name"的h2标签
allname = soup.findAll("h2", attrs={"class": "name"})# 遍历每个h2标签
for name in allname:# 在每个h2标签中查找所有的a标签realnames = name.findAll("a")# 遍历每个a标签for realname in realnames:# 将书名添加到namestore列表中namestore.append(realname.string)# 查找所有class为"priceWrap"的div标签
allprice = soup.findAll("div", attrs={"class": "priceWrap"})# 遍历每个div标签
for price in allprice:# 在每个div标签中查找所有class为"sellPrice"的span标签realprices = price.findAll("span", attrs={"class": "sellPrice"})# 遍历每个span标签for realprice in realprices:# 将价格添加到pricestore列表中pricestore.append(realprice.string)# 使用zip函数将书名和价格对应起来,并打印结果
for a, b in zip(namestore, pricestore):print(a, b)

存入文件

# 打开文件,准备写入数据,使用UTF-8编码
with open(r"d:\Desktop\畅销书以及价格.txt", "w", encoding='utf-8') as f:# 使用zip函数将书名和价格对应起来,并写入文件for a, b in zip(namestore, pricestore):# 写入书名f.write(str(a) + '\n')# 写入价格f.write(str(b) + '\n')

总的程序

import requests
from bs4 import BeautifulSoupheaders ={"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36"
}responce = requests.get(r'https://www.bookschina.com/24hour/62700000/',headers = headers)print(responce.status_code)
content = responce.text
soup = BeautifulSoup(content,"html.parser")namestore = []
pricestore = []allname = soup.findAll("h2",attrs={"class" : "name"})
for name in allname:realnames = name.findAll("a")for realname in realnames:#print(realname.string)namestore.append(realname.string)allprice = soup.findAll("div",attrs={"class":"priceWrap"})
for price in allprice:realprices = price.findAll("span",attrs={"class" : "sellPrice"})for realprice in realprices:#print(realprice.string)pricestore.append(realprice.string)with open(r"d:\Desktop\畅销书以及价格.txt","w",encoding='utf-8') as f:for a, b in zip(namestore, pricestore):f.writelines(str(a) + '\n' )f.writelines(str(b) + '\n' )

文件存储效果

在这里插入图片描述

http://www.zhongyajixie.com/news/63576.html

相关文章:

  • 益阳网站建设企业合肥推广外包公司
  • 建设通网站是政府的么厦门seo新站策划
  • wordpress 挖矿脚本牡丹江seo
  • 网站名称与主体性质不符谷歌关键词推广怎么做
  • 中国建设银行公积金网缴网站广州网站建设技术外包
  • 网站后台报表统计系统必应搜索推广
  • 做网站是用源码还是模版seo 重庆
  • 企业不想做网站的原因手机游戏性能优化软件
  • 腾讯24小时人工热线seo排名优化是什么
  • 做动漫主题的网站推广赚钱的微信小程序
  • 提供免费网站建设国外网站怎么推广
  • 汉化wordpress插件app优化建议
  • 老师问我做网站用到什么创新技术网站排名优化服务公司
  • 广州一共13个区深圳seo外包
  • 肇庆网站关键词优化seo图片优化
  • 怎样设计手机网站建设html底部友情链接代码
  • 怎样做博客网站网络推广引流方式
  • 招商加盟网站大全seo社区
  • wordpress集成ckplayer谷歌seo优化公司
  • 南京做网站品牌镇江网站关键字优化
  • 哪些是用vue做的网站艾滋病多久能检查出来
  • 孝感网站建设目前较好的crm系统
  • linux 网站服务器搭建网站备案信息查询
  • 网站seo优化加推广郑州seo推广外包
  • 最后的目的是什么网站页面优化内容包括哪些
  • 做网站要学习什么搜索引擎优化服务公司哪家好
  • 千助做网站怎么样360广告推广平台
  • 关于做一动物网站的界面个电商平台怎么注册
  • 杭州建设企业网站的搜索引擎付费推广
  • 网站宣传模式百度网盘搜索引擎