当前位置: 首页 > news >正文

wordpress设置主页不显示整篇文章莱阳seo外包

wordpress设置主页不显示整篇文章,莱阳seo外包,网站都是用什么编写的,怎样用微信做购物网站案例需求: 1.爬取该新闻网站——(网易新闻)的数据,包括标题和链接 2.爬取所有数据(翻页参数) 3.利用jsonpath解析数据 分析: 该网站属于异步加载网站——直接网页中拿不到,需要…

案例需求:

1.爬取该新闻网站——(网易新闻)的数据,包括标题和链接

2.爬取所有数据(翻页参数)

3.利用jsonpath解析数据

分析:

该网站属于异步加载网站——直接网页中拿不到,需要借助fidder抓包工具拿取

可以看到第一页请求网址

https://news.163.com/special/cm_yaowen20200213/?callback=data_callback

6a92f0e00544494d8c21cf6b292dd5b6.png

第二页请求网址

https://news.163.com/special/cm_yaowen20200213_02/?callback=data_callback

4dc35985765e4390b31a2f426e9401c3.png

第五页(最后一页)请求网址:

https://news.163.com/special/cm_yaowen20200213_05/?callback=data_callback

2b51c098461745cd9e30bd5993d62358.png

所以翻页代码如下:

首页地址为第一页地址

for i in range(2,6):print('==========', '当前是第{}页'.format(i))page_url = 'https://news.163.com/special/cm_yaowen20200213_0{}/?callback=data_callback'.format(i)

利用josnpath解析数据

cd754152e4124f5d8cae70ca625e3d5b.png

因为该网页不是常规的josn源码数据,所以需要进行一些处理

text_data=data.split('data_callback(')[1]
# print(text_data)
text_data1 = text_data.split(')')[0]
# print(text_data1)
json_data = json.loads(text_data1)
title = jsonpath(json_data,'$..title')
url = jsonpath(json_data,'$..docurl')

处理解析数据

for i,j in zip(title,url):print(i)print(j)print('=======================================')

示例代码:

import requests
from jsonpath import jsonpath
import json
def get_data(url):headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'}r = requests.get(url,headers=headers)# print(r.text)return r.text# print(r.text)# print(r.json())
def parse_data(data):text_data=data.split('data_callback(')[1]# print(text_data)text_data1 = text_data.split(')')[0]# print(text_data1)json_data = json.loads(text_data1)title = jsonpath(json_data,'$..title')url = jsonpath(json_data,'$..docurl')for i,j in zip(title,url):print(i)print(j)print('=======================================')# print(title)# print(url)
if __name__ == '__main__':url = "https://news.163.com/special/cm_yaowen20200213/?callback=data_callback "# h = get_data()# parse_data(h)for i in range(2,6):print('==========', '当前是第{}页'.format(i))page_url = 'https://news.163.com/special/cm_yaowen20200213_0{}/?callback=data_callback'.format(i)h = get_data(page_url)parse_data(h)

6fe1a5bc51994e42a2d68a1c2185b90f.png

 

http://www.zhongyajixie.com/news/47686.html

相关文章:

  • wordpress集成api优化网站排名的方法
  • 吉林省建设厅网站市政建设北京百度推广开户
  • 小精灵儿童网站免费做踢全球网站流量排名查询
  • 做网站写页面多少钱站长工具app
  • 网站开发 问题 关键技术全国疫情今天最新消息
  • 在哪个网站可以自助建站seo免费培训教程
  • 免费制作链接的软件北京网站优化多少钱
  • WordPress门户主题破解官网排名优化方案
  • 网站开发的论文引言微软优化大师
  • 深圳 高端 建站公司中文搜索引擎网站
  • 动态域名做网站武汉seo广告推广
  • wordpress素锦如何做好网站推广优化
  • wordpress pc站m站微营销推广方案
  • 桂林网站建设公司公司宣传网页怎么做
  • 网站域名多少钱营销一体化平台
  • 优质做网站哪家正规seo教程论坛
  • 网站怎么做精准引流网站推广的常用途径有哪些
  • 个人网站备案模板汕尾网站seo
  • 做旅游广告在哪个网站做效果好百度seo排名工具
  • 网站搜不出来怎么办上海全网营销推广
  • 网站建设编辑新产品如何快速推广市场
  • 长春 万网 网站建设宁波受欢迎全网seo优化
  • wordpress主题 瀑布流seo全网推广
  • 网站怎么做排名正规的微信推广平台
  • 媒体网站推广法3天网站seo优化成为超级品牌
  • 制作单位网站百度免费下载
  • 做网站需要独立ip吗百度推广一年大概需要多少钱
  • dart语言做的网站短视频seo询盘获客系统软件
  • 海南房产网站建设快速刷排名的软件最好
  • win2003怎么做网站aso优化报价