当前位置: 首页 > news >正文

苏州园区疫情攀枝花网站seo

苏州园区疫情,攀枝花网站seo,室内设计效果图接单平台,外贸企业网站模版Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。 安装scrapy pip install scrapy2.5.0 1.新建 Scrapy项目 scrapy startproject mySpider # 项目名为mySpider 2.进入到spiders目录 cd mySpider/mySpider/spiders 3.创建爬虫 scrapy gensp…

Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。

安装scrapy

pip install scrapy==2.5.0

1.新建 Scrapy项目

scrapy startproject mySpider   # 项目名为mySpider

2.进入到spiders目录

 cd mySpider/mySpider/spiders

3.创建爬虫

 scrapy genspider dgcuAI  ai.dgcu.edu.cn      # 爬虫名为dgcuAI,爬取域为ai.dgcu.edu.cn

 4.制作爬虫

创建爬虫之后,打开dgcuAI.py文件。

引入Selector

from scrapy.selector import Selector

修改start_urls:

start_urls = ['http://ai.dgcu.edu.cn/front/category/2.html']

 修改parse函数:

    def parse(self, response):

        print(response.url)

        selector = Selector(response)

        # # 使用XPath表达式提取信息:

        # 标题: //div[@class="pageList"]/ul/li/a/div[@class="major-content1"]/text()

        # 链接: //div[@class="pageList"]/ul/li/a/@href

        # 日期: //div[@class="pageList"]/ul/li/a/div[@class="major-content2"]/text()

        node_list = selector.xpath("//div[@class='pageList']/ul/li")

        for node in node_list:

            # 文章标题

            title = node.xpath('./a[1]/div[@class="major-content1"]/text()').extract_first()

            # 文章链接

            url = node.xpath('./a[1]/@href').extract_first()

            # 日期

            date = node.xpath('./a[1]/div[@class="major-content2"]/text()').extract_first()

            print("文章标题:", title)

            print("文章链接:",url)

            print("日期:",date)

 5.运行爬虫

 在mySpider/mySpider/文件夹下创建run.py文件,并运行:

from scrapy import cmdline

cmdline.execute("scrapy crawl dgcuAI -s LOG_ENABLED=False".split())

其中“-s LOG_ENABLED=False ”表示不打印日志信息,若代码运行有错误则需要“-s LOG_ENABLED=True ”,这样就能在控制台看到错误信息。

运行结果:

http://www.zhongyajixie.com/news/2593.html

相关文章:

  • 网站制作明细报价表台州关键词首页优化
  • 兴宁电子商务网站建设网络营销网站设计
  • 北京好的网站建设公司优化大师是干什么的
  • 做网站虚拟主机规格十大it教育培训机构排名
  • 开个做网站公司国内优秀网站案例
  • wordpress中国风主题重庆高端网站seo
  • 新闻网站建设概述免费做网站网站的软件
  • 深圳龙江网站设计百度推广账号
  • 企业做网站需要注意事项武汉建站优化厂家
  • 房地产公司网站建设报价方案百度一下首页极简版
  • 做网站首页与分页什么样子武汉网站竞价推广
  • 多多在线免费观看电视剧抖音seo优化
  • 天津哪家做企业网站灵感关键词生成器
  • 上海殷行建设网站百度认证
  • 常宁网站建设常宁网站建设吉林关键词优化的方法
  • 个人可以做行业网站吗2024年疫情还会封控吗
  • 网站系统模版企业网站系统
  • 网站设计实训心得体会优化快速排名教程
  • wordpress获取用户idseo与sem的区别与联系
  • 网站修改图片怎么做售卖链接
  • 有了网站 域名然后么做北京seo分析
  • 手机付费咨询网站建设百度竞价登录
  • 网站制作 网站建设 杭州网络营销能干什么工作
  • 龙岗网站建设哪家好磁力库
  • 帮别人做海报网站周口网络推广公司
  • 知名网站有哪些免费b2b平台推广
  • 网站开发用什么开发西安seo按天收费
  • 做直播券的网站有多少钱网站推广方法大全
  • 网站系统设计说明书谷歌seo新规则
  • 健身网站怎么做整合营销