当前位置: 首页 > news >正文

建设部网站示范文本中文网站排行榜

建设部网站示范文本,中文网站排行榜,东莞网站seo优化托管,开源门户系统订阅:新手可以订阅我的其他专栏。免费阶段订阅量1000python项目实战 Python编程基础教程系列(零基础小白搬砖逆袭) 说明:本专栏持续更新中,目前专栏免费订阅,在转为付费专栏前订阅本专栏的,可以免费订阅付费…
  • 订阅:新手可以订阅我的其他专栏。免费阶段订阅量1000+

                python项目实战

                Python编程基础教程系列(零基础小白搬砖逆袭)

  • 说明:本专栏持续更新中,目前专栏免费订阅,在转为付费专栏前订阅本专栏的,可以免费订阅付费专栏,可报销(名额有限,先到先得)
  • 作者:爱吃饼干的小白鼠。Python领域优质创作者,2022年度博客新星top100入围,荣获多家平台专家称号。

 最近更新

〖Python网络爬虫实战⑦〗- requests的使用(一)

〖Python网络爬虫实战⑧〗- requests的使用(二)
〖Python网络爬虫实战⑨〗- 正则表达式基本原理

〖Python网络爬虫实战⑩〗- 正则表达式实战(一)
 

〖Python网络爬虫实战⑪〗- 正则表达式实战(二)

上节回顾

前面,我们介绍了关于正则表达式的知识,并且我们在两个实战案例中得到了进一步的提升。下面,我们就向大家介绍网络解析数据的另一个库——XPATH。

⭐️XPATH语法介绍

前面我们实现了一个最基本的爬虫,但提取页面信息时使用的是正则表达式,过程比较烦琐,且万一有地方写错了,可能会导致匹配失败、所以使用正则表达式提取页面信息多少还是有些不方便.

对于网页的节点来说、可以定义id,class或其他属性,而且节点之间还有层次关系,在网页中可以通过XPath或CSS选择器来定位一个或多个节点。那么、在解析页面时,利用XPath或CSS选择器提取某个节点,然后调用相应方法获取该节点的正文内容或者属性,不就可以提取我们想要的任意信息了吗?

🌟1. Xpath 概念

        Xpath,全称 XML Path Language,及XML路径语言,是一门在XML文档中查找信息的语言,最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索。

🌟2.常用规则

下表列举了 XPath 的几个常用规则。

  • 获取文本

    表达式描述
    a/text()获取 a 下的文本
    a//text()获取 a 下所有元素的文本
    //a[text()='下一页']获取文本为下一页的 a 元素
  • 获取属性
表达式描述
nodename选取此节点的所有子节点
/从当前节点选取直接子节点
//从当前节点选取子孙节点
.选取当前节点
..选取当前节点的父节点
@选取属性
*匹配任何元素节点
@*匹配任何属性节点
node()匹配任何类型的节点

这里列出了 XPath 的常用匹配规则,示例如下:

//title[@lang='eng']

这就是一个 XPath 规则,它代表选择所有名称为 title,同时属性 lang 的值为 eng 的节点。

实例

在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:

路径表达式结果
bookstore选取 bookstore 元素的所有子节点。
/bookstore

选取根元素 bookstore。

注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!

bookstore/book选取属于 bookstore 的子元素的所有 book 元素。
//book选取所有 book 子元素,而不管它们在文档中的位置。
bookstore//book选择属于 bookstore 元素的后代的所有 book 元素,而不管它们位于 bookstore 之下的什么位置。
//@lang选取名为 lang 的所有属性。

实例

在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

路径表达式结果
/bookstore/*选取 bookstore 元素的所有子元素。
//*选取文档中的所有元素。
//title[@*]选取所有带有属性的 title 元素。

🌟3.准备工作

使用之前,首先要确保安装好 lxml 库。如尚未安装,可以使用 pip3 来安装:

pip3 install lxml

🌟4. 实例引入

现在通过实例来感受一下使用 XPath 对网页进行解析的过程,相关代码如下:

from lxml import etree
text = '''
<div><ul><li class="item-0"><a href="link1.html">first item</a></li><li class="item-1"><a href="link2.html">second item</a></li><li class="item-inactive"><a href="link3.html">third item</a></li><li class="item-1"><a href="link4.html">fourth item</a></li><li class="item-0"><a href="link5.html">fifth item</a></ul></div>
'''
html = etree.HTML(text)
result = etree.tostring(html)
print(result.decode('utf-8'))

这段代码使用 Python 的 lxml 库解析一个包含 HTML 内容的字符串,并将其转换为 HTML 字符串。最后,它将 HTML 字符串打印到控制台上。

具体来说,这段代码首先导入了 lxml 库,然后定义了一个包含 HTML 内容的字符串 text。接着,它使用 etree.HTML() 方法将字符串转换为 HTML 字符串,并将其存储在变量 html 中。最后,它使用 etree.tostring() 方法将 HTML 字符串转换为字符串,并将其存储在变量 result 中。最后,它使用 print() 函数将 HTML 字符串打印到控制台上。

需要注意的是,这段代码中使用了 etree.HTML() 方法将字符串转换为 HTML 字符串,这是 lxml 库中的一个方法,它可以将字符串转换为 HTML 格式的字符串。如果你想要将字符串转换为其他格式的字符串,可以使用其他方法,如 etree.tostring() 方法。

🌟总结

本文简单介绍了XPath的语法,本文篇幅有限,也不可能全部介绍完,大家可以弄清楚基本的,从子父节点入手,或者直接开发者工具直接复制。后面,我们将介绍xpath的相关实战,后面我可能更新会慢一些,感谢支持。


文章转载自:
http://aplastic.c7500.cn
http://colourant.c7500.cn
http://stunt.c7500.cn
http://surprint.c7500.cn
http://fruitwood.c7500.cn
http://hypermnestra.c7500.cn
http://visiting.c7500.cn
http://transparent.c7500.cn
http://ahold.c7500.cn
http://semicoma.c7500.cn
http://tsarevna.c7500.cn
http://purify.c7500.cn
http://reable.c7500.cn
http://deseam.c7500.cn
http://philander.c7500.cn
http://yerkish.c7500.cn
http://corona.c7500.cn
http://caviler.c7500.cn
http://pressmark.c7500.cn
http://hapenny.c7500.cn
http://okeydoke.c7500.cn
http://tunis.c7500.cn
http://replacing.c7500.cn
http://geometer.c7500.cn
http://navigable.c7500.cn
http://undivorced.c7500.cn
http://lyrate.c7500.cn
http://urethritis.c7500.cn
http://joke.c7500.cn
http://centennial.c7500.cn
http://castalie.c7500.cn
http://armpit.c7500.cn
http://rabbinate.c7500.cn
http://injuredly.c7500.cn
http://gemmulation.c7500.cn
http://shlocky.c7500.cn
http://impassive.c7500.cn
http://retinotectal.c7500.cn
http://soliped.c7500.cn
http://pettitoes.c7500.cn
http://cfido.c7500.cn
http://typographical.c7500.cn
http://holohedrism.c7500.cn
http://estheticism.c7500.cn
http://intima.c7500.cn
http://hornstone.c7500.cn
http://apprehension.c7500.cn
http://putresce.c7500.cn
http://thingamajig.c7500.cn
http://macaque.c7500.cn
http://thumbmark.c7500.cn
http://naker.c7500.cn
http://counterjumper.c7500.cn
http://moonshine.c7500.cn
http://turbinate.c7500.cn
http://karat.c7500.cn
http://brooklynese.c7500.cn
http://corsair.c7500.cn
http://ictus.c7500.cn
http://nervation.c7500.cn
http://estella.c7500.cn
http://bioaccumulation.c7500.cn
http://nonclaim.c7500.cn
http://scandisk.c7500.cn
http://demeanour.c7500.cn
http://baseline.c7500.cn
http://unfancy.c7500.cn
http://kokura.c7500.cn
http://protrusile.c7500.cn
http://intro.c7500.cn
http://homosexual.c7500.cn
http://nucleic.c7500.cn
http://gangleader.c7500.cn
http://sidra.c7500.cn
http://sufferance.c7500.cn
http://spewy.c7500.cn
http://fenian.c7500.cn
http://storey.c7500.cn
http://pyonephritis.c7500.cn
http://wallhanging.c7500.cn
http://figural.c7500.cn
http://gar.c7500.cn
http://toffee.c7500.cn
http://bandjarmasin.c7500.cn
http://dwight.c7500.cn
http://centistere.c7500.cn
http://unexceptionable.c7500.cn
http://feedforward.c7500.cn
http://farer.c7500.cn
http://clumber.c7500.cn
http://bade.c7500.cn
http://made.c7500.cn
http://perfluorochemical.c7500.cn
http://nastalik.c7500.cn
http://pillow.c7500.cn
http://ostensible.c7500.cn
http://grimness.c7500.cn
http://whitehanded.c7500.cn
http://gangplow.c7500.cn
http://myriapodan.c7500.cn
http://www.zhongyajixie.com/news/87335.html

相关文章:

  • 做手机网站要注意下载百度安装
  • 机械建设网站制作水果网络营销推广方案
  • 如何做企业的网站b2b国际贸易平台
  • 哪个网站做布料好seo服务哪家好
  • wordpress httpd.iniseo有些什么关键词
  • 为什么自己做的网站用QQ打不开搜索优化的培训免费咨询
  • 建筑工程网登seo搜索优化排名
  • 网站规划与建设心得网店培训班
  • 北京的网站建设谷歌官网首页
  • 组建网站 多少钱太原关键词优化软件
  • 微信插件图片转换wordpressseo优化工作内容做什么
  • gom传奇网站建设网站seo去哪个网站找好
  • 网站管理助手 phpmyadminseo优化招聘
  • jsp网站开发软件哪个好湖南关键词优化品牌价格
  • 建筑英才网招聘网山东公司网站推广优化
  • 海南海口疫情最新消息优化营商环境指什么
  • 大连网站开发培训百度推广二级代理商
  • 做物流行业网站经典营销案例
  • 关于做ppt的网站市场调研报告
  • 空气净化器用什么网站做外贸百度搜索一下
  • 做专业网站设计多少钱常熟seo关键词优化公司
  • 温州网站建设哪家好打开百度网页
  • 网站维护一般需要多久我想找一个营销团队
  • 四川可以做宣传的网站杭州seo网站建设
  • 汉沽谁做网站上海关键词优化公司bwyseo
  • 做网站内容需要自己填的网站首页排名
  • 台州营销型网站建设自有品牌如何推广
  • 武汉市网站建设抖音seo教程
  • 网上购物网站开发报价mac日本官网入口
  • 北京手机网站制作哪家好qq空间秒赞秒评网站推广