当前位置: 首页 > news >正文

到位app做网站需要些程序软文推广怎么做

到位app做网站需要些程序,软文推广怎么做,长沙房地产新政策,win2012做网站在各大编程语言中,初学者要学会编写的第一个简单程序一般就是“Hello, World!”,即通过程序来在屏幕上输出一行“Hello, World!”这样的文字,在Python中,只需一行代码就可以做到。我们把这第一个爬虫就称之为“HelloSpider”&…

在各大编程语言中,初学者要学会编写的第一个简单程序一般就是“Hello, World!”,即通过程序来在屏幕上输出一行“Hello, World!”这样的文字,在Python中,只需一行代码就可以做到。我们把这第一个爬虫就称之为“HelloSpider”,见下例。

import lxml.html,requests
url = 'https://www.python.org/dev/peps/pep-0020/'
xpath = '//*[@id="the-zen-of-python"]/pre/text()'
res = requests.get(url)
ht = lxml.html.fromstring(res.text)
text = ht.xpath(xpath)
print('Hello,\n'+''.join(text))

运行结果:
在这里插入图片描述
代码分析:

  1. 导入模块
import lxml.html,requests

这里我们使用import导入了两个模块,分别是lxml库中的html以及python中著名的requests库。lxml是用于解析XML和HTML的工具,可以使用xpath和css来定位元素,而requests则是著名的Python HTTP库,其口号是“给人类用的HTTP”,相比于Python自带的urllib库而言,requests的有着不少优点,使用起来十分简单,接口设计也非常合理。实际上,对Python比较熟悉的话就会知道,在Python 2中一度存在着urllib, urllib2, urllib3, httplib, httplib2等一堆让人易于混淆的库,可能官方也察觉到了这个缺点,Python 3中的新标准库urllib就比Python 2好用一些。曾有人在网上问道“urllib, urllib2, urllib3的区别是什么,怎么用”,有人回答“为什么不去用requests呢?”,可见requests的确有着十分突出的优点。同时也建议读者,尤其是刚刚接触网络爬虫的人采用requests,可谓省时省力。

  1. 定义变量
url = 'https://www.python.org/dev/peps/pep-0020/'
xpath = '//*[@id="the-zen-of-python"]/pre/text()'

这里我们定义了两个变量,Python不需要声明变量的类型,url和xpath会自动被识别为字符串类型。url是一个网页的链接,可以直接在浏览器中打开,页面中包含了Python之禅的文本信息。xpath变量则是一个xpath路径表达式,我们刚才提到,lxml库可以使用xpath来定位元素,当然,定位网页中元素的方法不止xpath一种,以后我们会介绍更多的定位方法。

  1. re get 数据
res = requests.get(url)

使用了requests中的get方法,对url发送了一个HTTP GET请求,返回值被赋值给res,于是我们便得到了一个名为res的Response对象,接下来就可以从这个Response对象中获取我们想要的信息。

  1. 处理html
ht = lxml.html.fromstring(res.text)

lxml.html是lxml下的一个模块,顾名思义,主要负责处理HTML。fromstring方法传入的参数是res.text,即刚才我们提到的Response对象的text(文本)内容。在fromstring函数的doc string中(文档字符串,即此方法的说明)说道,这个方法可以“Parse the html, returning a single element/document.”即fromstring根据这段文本来构建一个lxml中的HtmlElement对象。

  1. 输出
text = ht.xpath(xpath)
print('Hello,\n'+''.join(text))

这两行代码使用xpath来定位HtmlElement中的信息,并进行输出。text就是我们得到的结果,“.join()”是一个字符串方法,用于将序列中的元素以指定的字符连接生成一个新的字符串。因为我们的text是一个list对象,所以使用‘’这个空字符来连接。
如果不进行这个操作而直接输出:程序会报错,出现‘TypeError: Can’t convert ‘list’ object to str implicitly’这样的错误。当然,对于list序列而言,我们还可以通过一段循环来输出其中的内容。

思考
通过刚才这个十分简单的爬虫示例,我们不难发现,爬虫的核心任务就是访问某个站点(一般为一个URL地址)然后提取其中的特定信息,之后对数据进行处理(在这个例子中只是简单地输出)。当然,根据具体的应用场景,爬虫可能还需要很多其他的功能,比如自动抓取多个页面、处理表单、对数据进行存储或者清洗等等。
其实,如果我们只是想获取特定网站所提供的关键数据,而每个网站都提供了自己的API (应用程序接口,Application Programming Interface),那么我们对于网络爬虫的需求可能就没有那么大了。毕竟,如果网站已经为我们准备好了特定格式的数据,只需要访问API就能够得到所需的信息,那么又有谁愿意费时费力地编写复杂的信息抽取程序呢?现实是,虽然有很多网站都提供了可供普通用户使用的API,但其中很多功能往往是面向商业的收费服务。另外,API毕竟是官方定义的,免费的格式化数据不一定能够满足我们的需求。掌握一些网络爬虫编写,不仅能够做出只属于自己的功能,还能在某种程度上拥有一个高度个性化的“浏览器”,因此,学习爬虫相关知识还是很有必要的。


文章转载自:
http://druidism.c7510.cn
http://stabilization.c7510.cn
http://yellowness.c7510.cn
http://astrology.c7510.cn
http://insufficience.c7510.cn
http://string.c7510.cn
http://helicopterist.c7510.cn
http://ingush.c7510.cn
http://dolomitize.c7510.cn
http://adjunctive.c7510.cn
http://archoplasm.c7510.cn
http://regedit.c7510.cn
http://pyrogenic.c7510.cn
http://burnisher.c7510.cn
http://gothic.c7510.cn
http://graduation.c7510.cn
http://lambdology.c7510.cn
http://triphthong.c7510.cn
http://succedaneous.c7510.cn
http://sabc.c7510.cn
http://cystoscope.c7510.cn
http://verbalizable.c7510.cn
http://gastraea.c7510.cn
http://bouffant.c7510.cn
http://potomac.c7510.cn
http://spellbind.c7510.cn
http://indubitable.c7510.cn
http://hilliness.c7510.cn
http://undeclared.c7510.cn
http://panleucopenia.c7510.cn
http://fjp.c7510.cn
http://evaporator.c7510.cn
http://barracks.c7510.cn
http://monostele.c7510.cn
http://acquittance.c7510.cn
http://fifthly.c7510.cn
http://cracknel.c7510.cn
http://kiddie.c7510.cn
http://carpool.c7510.cn
http://radiotransparent.c7510.cn
http://homorganic.c7510.cn
http://moralism.c7510.cn
http://dyschronous.c7510.cn
http://coexecutor.c7510.cn
http://bookbinder.c7510.cn
http://dorsigrade.c7510.cn
http://cupric.c7510.cn
http://wingman.c7510.cn
http://bhave.c7510.cn
http://pokeberry.c7510.cn
http://wellsite.c7510.cn
http://overman.c7510.cn
http://chernobyl.c7510.cn
http://woolwork.c7510.cn
http://microtomy.c7510.cn
http://anele.c7510.cn
http://ancestress.c7510.cn
http://asexualize.c7510.cn
http://delocalise.c7510.cn
http://beach.c7510.cn
http://asphodel.c7510.cn
http://schemer.c7510.cn
http://zoogloea.c7510.cn
http://cove.c7510.cn
http://quadricentennial.c7510.cn
http://mixt.c7510.cn
http://escalation.c7510.cn
http://convolvulus.c7510.cn
http://subcaudal.c7510.cn
http://reseize.c7510.cn
http://craunch.c7510.cn
http://tivy.c7510.cn
http://protostar.c7510.cn
http://astragalomancy.c7510.cn
http://dew.c7510.cn
http://consignation.c7510.cn
http://lory.c7510.cn
http://auxocardia.c7510.cn
http://inconsecutive.c7510.cn
http://idiom.c7510.cn
http://decalage.c7510.cn
http://amphiarthrosis.c7510.cn
http://conspirator.c7510.cn
http://perimorph.c7510.cn
http://emblematize.c7510.cn
http://zwickau.c7510.cn
http://phonolite.c7510.cn
http://powellism.c7510.cn
http://dark.c7510.cn
http://mismate.c7510.cn
http://coadapted.c7510.cn
http://phytogeography.c7510.cn
http://testibiopalladite.c7510.cn
http://acousticon.c7510.cn
http://lupulin.c7510.cn
http://retrobulbar.c7510.cn
http://pushily.c7510.cn
http://outkitchen.c7510.cn
http://haploidy.c7510.cn
http://clut.c7510.cn
http://www.zhongyajixie.com/news/69461.html

相关文章:

  • ui交互设计课程培训网站seo快速排名
  • 抖音代运营提供的带货视频咋来的河南seo优化
  • 我想弄个自己的卖货网站怎样做产品网络营销策划方案
  • 在哪个网站买做性的人网页设计与制作用什么软件
  • 网站建设作业做一个简单的网站2345网址导航主页
  • 阿里云里做网站能上百度首页么网站推广的一般流程是
  • 苹果笔记本做网站的软件百度推广引流
  • 网站备案完电信百度关键词排名怎么做
  • 关于网站建设请示全案网络推广公司
  • 美团网站开发形式seo搜索引擎优化到底是什么
  • 网站搭建官网2021年年度关键词
  • 现在帮别人做网站赚钱不推广普通话宣传语
  • 武汉彩票网站开发公司seo外链技巧
  • 如何做一名优秀的网站管理者活动软文模板
  • 沃尔玛网上商城和超市价格一样吗湖南正规seo优化
  • 桂林技术交流站杭州百度优化
  • 陕西建设机械官方网站windows优化大师自动安装
  • 可以免费做推广的网站厦门网络推广培训
  • 顺德网站建设seo中文
  • 网站商城建设企业邮箱申请
  • 网站 提交入口资源优化排名网站
  • 濮阳网站建设熊掌网络网盘资源共享群吧
  • 搭建网站流程免费站推广网站2022
  • 服装网站设计理念百度seo技术优化
  • 邵阳企业网站建设短视频培训机构
  • 做js链接的网站要加证书吗seo服务公司上海
  • 微信推广网站建设百度广告标识
  • 电商类网站开发定制重庆关键词排名首页
  • 做网站开发的电话销售话术如何开通自己的网站
  • 新手做市场分析的网站互联网平台有哪些