首页 > TAG信息列表 > PymuPDF
Python - PyMuPDF模块的简单使用
1.简介 能够用来对PDF文档进行操作的Python包有好几个,如用于提取内容的PdfPlumber、PDFMiner,可以用来对PDF文件进行修改操作的PyPDF2等等,如果只是需要简单地对PDF文件实现合并、拆分、书签操作,使用PyPDF2就足以满足。但如果想对PDF文件进行一些底层操作,基本上只有PyMuPDF了。PyMuPPymuPDF实现PDF文字和图片的修改
实现了PymuPDF替换pdf指定位置文字和图片的功能,并分别保存pdf和JPG格式.#-*- coding:utf-8 -*- import os import PyPDF2 import fitz text = u"湖南省湘潭市雨湖区鹤岭镇长安村永红组" file_path = r'D:\Desktop\新建文件夹' for root,dirs,files in os.walk(file_patPymuPDF实现PDF文字和图片的修改
实现了PymuPDF替换pdf指定位置文字和图片的功能,并分别保存pdf和JPG格式. #-*- coding:utf-8 -*- import os import PyPDF2 import fitz text = u"湖南省湘潭市雨湖区鹤岭镇长安村永红组" file_path = r'D:\Desktop\新建文件夹' for root,dirs,files in os.walk(file_path)Python实现PDF内容抽取PyMuPDF
最近需要把扫描的PDF转换成文本,试用了pdfminer,pypdf2等工具,解析图片的效果都不太好,用起来也比较麻烦,后来试用了PyMuPDF,相对其它工具,它最新版本屏蔽了更多细节,围绕Page进行操作,调用非常方便。除了PDF它还支持解析epub等电子书格式。 目前网上例程大多是只抽取图片,没有同时转换图