当前位置: 首页 > news >正文

做视频网站服务器要求seo入门基础教程

做视频网站服务器要求,seo入门基础教程,嘉兴代办公司注册公司,在自己的网站做外链Python 实现读取pdf文件简单示例。 安装命令 需要安装操作pdf的三方类库,命令如下: pip install pdfminer3K 安装过程如下: 引入类库 需要引入很多的类库。 示例如下: import sys import importlib importlib.reload(sys)fr…

Python 实现读取pdf文件简单示例。

安装命令

需要安装操作pdf的三方类库,命令如下:

pip install pdfminer3K

安装过程如下:

引入类库

需要引入很多的类库。

示例如下:

import sys
import importlib
importlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import  PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed

 

读取pdf实现

实现步骤为:先通过二进制方式打开测试pdf文档,创建pdf文档解析测试文档内容,

最后读取文件内容,保存到另一个文件中。

示例如下:

import sys
import importlibimportlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
import osdef read_pdf(path, toPath):# 以二进制方式打开pdf文件f = open(path, 'rb')# 创建一个pdf文档分析器parser = PDFParser(f)# 创建pdf文档pdfFile = PDFDocument()# 链接分析器与文档对象parser.set_document(pdfFile)pdfFile.set_parser(parser)# 提供初始化密码pdfFile.initialize()# 检测文档是否提供txt转换if not pdfFile.is_extractable:raise PDFTextExtractionNotAllowedelse:# 解析数据# 数据管理器manager = PDFResourceManager()# 创建一个PDF设备对象laparams = LAParams()device = PDFPageAggregator(manager, laparams=laparams)# 解释器对象interpreter = PDFPageInterpreter(manager, device)for page in pdfFile.get_pages():interpreter.process_page(page)layout = device.get_result()for x in layout:if isinstance(x, LTTextBoxHorizontal):with open(toPath, 'a', encoding='utf-8') as f:print(x.get_text())f.write(x.get_text() + "\n")path = os.path.join(os.getcwd(), 'test_1.pdf')
toPath = os.path.join(os.getcwd(), 'test_2.txt')
read_pdf(path, toPath)

注意:无法读取中文,貌似需要加载中文字体。还有就是在写入pdf文件,格式不对无法打开暂时没找到原因。

总结

本篇只是使用Python 实现读取pdf文件简单示例,因为时间关系没有做深入的扩展,等之后有时间再做补充。

http://www.zhongyajixie.com/news/4550.html

相关文章:

  • 网站制作 代码编辑松原市新闻
  • 电子商务网站提供的主要功能有seo优化方法
  • 百度网站优化排名足球队世界排名榜
  • 网站和自媒体都可以做优化网站排名技巧
  • aspcms上传到虚拟主机后打开网站seo常见优化技术
  • 如何制作动漫网站模板下载地址seo排名优化软件
  • 潍坊网站建设科技有限公司名站在线
  • 网站第三方评价如何做网络营销公司简介
  • 网站建设价格方案市场运营和市场营销的区别
  • Wordpress报价主题包头seo
  • 怎样做的网站内网外网都能用近期国内新闻
  • 淄博网站建设补贴南京怎样优化关键词排名
  • 网站幻灯片js代码推广普通话绘画
  • 域名备案要先做网站的吗百度云官网登录入口
  • 建设银行官方网站广州电商项目策划书
  • 温州本地网站免费广告投放网站
  • 中国有几大建设抖音seo代理
  • 做外贸一般用什么网站游戏广告推广平台
  • wordpress首页显示摘要seo排名优化表格工具
  • 什么是网站建设中的专用主机网址大全123
  • 江苏网站建设流程app联盟推广平台
  • 门户网站代做线在科技成都网站推广公司
  • 二手交易网站怎么做seo网络推广优化教程
  • wordpress 小工具 创建济南搜索引擎优化网站
  • 阿里云做网站送服务器谷歌浏览器 安卓下载2023版
  • 电子外贸网站模板百度的代理商有哪些
  • 合肥网站建设渠道企业网站优化
  • 游戏网站域名沧州网站seo
  • 建设网站聊天室学seo哪个培训好
  • 长春餐饮网站建设竞价排名采用什么计费方式