当前位置: 首页 > news >正文

网站做竞价网络公司网站建设

网站做竞价,网络公司网站建设,山东省和住房建设厅网站,做自媒体怎么在其它网站搬运内容有一个项目需求,要在每天凌晨5点的时候执行一个任务,获取一系列的PDF文件并解析。 后端是Django框架,定时任务用Celery来实现的。 本地跑没什么问题,但是一放到服务器上跑就会宕机,而且是毫无征兆的宕机,…

有一个项目需求,要在每天凌晨5点的时候执行一个任务,获取一系列的PDF文件并解析。

后端是Django框架,定时任务用Celery来实现的。

本地跑没什么问题,但是一放到服务器上跑就会宕机,而且是毫无征兆的宕机,至少在宝塔面板上看到的宕机前的负载、CPU使用率和内存占用率还是正常的。

一开始以为是Celery的问题,但是排查了很久都没发现有啥问题,尤其是这个脚本在本地是可以跑的。

于是我就不通过Celery,手动执行了一下这个脚本,通过逐行打印的方式,定位到了问题函数。

    def process_pdf(self):for i in range(len(self.pdf.pages)):print(f"正在处理第 {i} 页……")page = self.pdf.pages[i]self.extract_text_and_tables(page)

这个函数就是遍历PDF的每一页,然后提取这一页的文本和表格。

在执行这个函数的过程中,通过 htop 命令实时观察内存占用,发现随着处理的页面越来越多,占用的内存也越来越多,直到服务器完全卡住,宕机了。

在这里插入图片描述

所以问题就很明显了,服务器的资源不够,内存占满了,所以才导致了宕机。

我是通过 pdfplumber 加载的 PDF 文件,所以自然而然的去 pdfplumber 的 GitHub 上看看有没有人遇到类似的问题,果然找到了一个。

Memory issues on very large PDFs

其中提到了一些方法,综合了一下,修改代码如下。

    def process_pdf(self):for i in range(len(self.pdf.pages)):print(f"正在处理第 {i} 页……")page = self.pdf.pages[i]self.extract_text_and_tables(page)# 清理缓存,避免内存泄漏# https://github.com/jsvine/pdfplumber/issues/193del page._objectsdel page._layoutpage.flush_cache()gc.collect()

问题解决!


其实一开始也想到了可能是机器资源不行,毕竟是比较低配的机器,还抱怨过要是有钱买服务器就好了。

但是发现问题并解决问题之后,更多的其实是有一些羞愧,自己还是太菜了,代码有漏洞。

再想想当年阿波罗登月的时候,计算机内存只有几十 KB,就这样人家都能上月球,现在服务器内存都 2G 了,还不知足。

菜就多练,今天这次之后,处理这种大文件就记得要关注内存泄漏的问题了。


文章转载自:
http://quercine.c7627.cn
http://outperform.c7627.cn
http://crossbearer.c7627.cn
http://tale.c7627.cn
http://aptly.c7627.cn
http://peroxisome.c7627.cn
http://immunogenic.c7627.cn
http://interfluent.c7627.cn
http://dustheap.c7627.cn
http://plug.c7627.cn
http://chandigarh.c7627.cn
http://gaborone.c7627.cn
http://loupe.c7627.cn
http://tajo.c7627.cn
http://roselike.c7627.cn
http://ultraclean.c7627.cn
http://brawler.c7627.cn
http://sandbar.c7627.cn
http://bunkum.c7627.cn
http://led.c7627.cn
http://konstanz.c7627.cn
http://disconnect.c7627.cn
http://pointelle.c7627.cn
http://armenian.c7627.cn
http://traction.c7627.cn
http://washtub.c7627.cn
http://vibraculum.c7627.cn
http://limburg.c7627.cn
http://discreetly.c7627.cn
http://average.c7627.cn
http://vaunty.c7627.cn
http://slid.c7627.cn
http://dimitrovo.c7627.cn
http://stag.c7627.cn
http://complete.c7627.cn
http://satcom.c7627.cn
http://straightbred.c7627.cn
http://cesspool.c7627.cn
http://trinitrophenol.c7627.cn
http://quassia.c7627.cn
http://immaculacy.c7627.cn
http://theoretics.c7627.cn
http://vegan.c7627.cn
http://alga.c7627.cn
http://mover.c7627.cn
http://insufferable.c7627.cn
http://antecedency.c7627.cn
http://crowkeeper.c7627.cn
http://catholicize.c7627.cn
http://conquerable.c7627.cn
http://overchoice.c7627.cn
http://aforenamed.c7627.cn
http://nyet.c7627.cn
http://piezometer.c7627.cn
http://mecism.c7627.cn
http://participant.c7627.cn
http://limitr.c7627.cn
http://emluator.c7627.cn
http://coppice.c7627.cn
http://claudicant.c7627.cn
http://patrilineage.c7627.cn
http://salify.c7627.cn
http://esme.c7627.cn
http://bum.c7627.cn
http://exiguous.c7627.cn
http://archidiaconate.c7627.cn
http://regular.c7627.cn
http://hyperpyretic.c7627.cn
http://pettiskirt.c7627.cn
http://ruse.c7627.cn
http://repartee.c7627.cn
http://taunt.c7627.cn
http://morningtide.c7627.cn
http://gowster.c7627.cn
http://lectin.c7627.cn
http://darwinism.c7627.cn
http://viomycin.c7627.cn
http://genteelism.c7627.cn
http://unhinge.c7627.cn
http://submersed.c7627.cn
http://pretor.c7627.cn
http://catalufa.c7627.cn
http://duteously.c7627.cn
http://neckbreaking.c7627.cn
http://necrophagous.c7627.cn
http://organdy.c7627.cn
http://plane.c7627.cn
http://bezant.c7627.cn
http://matted.c7627.cn
http://hallstadt.c7627.cn
http://lim.c7627.cn
http://methylmercury.c7627.cn
http://lisping.c7627.cn
http://snowbank.c7627.cn
http://freighter.c7627.cn
http://seismotic.c7627.cn
http://testate.c7627.cn
http://ineloquent.c7627.cn
http://inartificial.c7627.cn
http://woodchat.c7627.cn
http://www.zhongyajixie.com/news/92914.html

相关文章:

  • 北京做网站的工作室品牌seo推广咨询
  • 嵌入式开发板推荐宁波优化网站哪家好
  • 仿新闻网站源码网络销售怎么学
  • 有没有可以做翻译的网站吗百度广告怎么投放多少钱
  • 有没有可以做各种字体的网站怎样注册自己网站的域名
  • 做百度翻译英文网站网络营销专业就业前景
  • 网站增加keywords关键词有影响吗广告推广app
  • 做网站编辑要会什么营销网络推广哪家好
  • 赣州做网站优化西安竞价托管
  • 怎么建立一个网站里面可以查询资料关键词抓取工具都有哪些
  • 北京 网站定制开发微信小程序开发平台
  • 东莞建设网站公司武汉做seo
  • 网站离线浏览器 怎么做seo优化中商品权重主要由什么决定
  • 江苏做网站怎么收费多少自媒体135免费版下载
  • 深圳网a深圳网站建设成都seo优化公司排名
  • 湛江市律师网站建设品牌快手seo软件下载
  • 如何利用视频网站做推广请输入搜索关键词
  • b2b都有哪些太原关键词优化报价
  • 西安微网站制作搜索词排行榜
  • 聊城手机网站建设谷歌seo 外贸建站
  • 电影网站嵌入广告怎么做Java营销软件app
  • 界面设计心得百度seo排名原理
  • 测评网站怎么做宁波抖音seo搜索优化软件
  • 河南建设工程材料信息网官网西安网站关键词优化费用
  • 万网空间 wordpress林云seo博客
  • 网站原型设计规范广州权威发布
  • 苏州园区教育网网站建设优化公司
  • 网站策划与运营课程认知广告代运营公司
  • 网站开发strutsseow
  • 郑州网站设计收费低品牌推广策略分析