您现在的位置是:亿华云 > 知识
这个自动化利器,Pythoner都在用!
亿华云2025-10-05 19:57:05【知识】0人已围观
简介在之前文章中,介绍了一款将网页转换成 PDF 的神器——wkhtmltopdf。在不同的操作系统中安装这个小巧的软件,就可以通过命令行直接将网页转换成 PDF 和图片。有小伙伴说这种处理方式跟用插件没
在之前文章中,个自介绍了一款将网页转换成 PDF 的动化都用神器——wkhtmltopdf。在不同的利器操作系统中安装这个小巧的软件,就可以通过命令行直接将网页转换成 PDF 和图片。个自
有小伙伴说这种处理方式跟用插件没什么区别,动化都用而且很不 Python!利器
于是个自,我去找了下,动化都用发现 wkhtmltopdf 这款软件有一个对应的利器 Python 版本的包——pdfkit。
今天我们就来看看这个包可以帮助我们做什么。个自
pdfkit 是动化都用什么
pdfkit 是把 HTML+CSS 格式的文件转换成 PDF 的一种工具,它是利器 wkhtmltopdf 这个工具包的 python 封装。所以,个自我们使用 pdfkit 之前要先安装 wkhtmltopdf 。动化都用具体安装方法很简单,利器大家可以参照上篇文章。
pdfkit 安装
安装完 wkhtmltopdf 之后,我们再来安装 pdfkit:
pip install pdfkit跟安装其他 python 包一样,只需要使用 pip 安装就行。
pdfkit 应用
pdfkit 是基于 wkhtmltopdf 的封装,云服务器所以功能肯定也是基于 wkhtmltopdf 的。
URL 对应网页转 PDF我们先来看一个例子:
path_wkthmltopdf = rC:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe
config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
pdfkit.from_url(rhttps://zhuanlan.zhihu.com/p/421726412, studypython.pdf, configuration=config)例子很简单,就三行代码。
第一行是 wkhtmltopdf 软件安装目录的 bin 目录地址;
第二行是将这个目录地址传入 pdfkit 的配置中;
第三行就是传入网页 URL 和生成文件的目标地址,传入配置信息,然后就可以生成 PDF 了。
运行之后,生成的 PDF 文件是这样的:
这个方法也很简单,跟上一个类似,只需要将 pdfkit 调用的函数改一下即可:
path_wkthmltopdf = rC:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe
config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
pdfkit.from_file(rC:\Users\xxx\Downloads\ttest\test.html,html.pdf, configuration=config)可以看到,前两行一样,第三行用了 from_file 函数。这里我传入的是一个简单的分页页面,生成的 PDF 文件如下:
如果你手中有大量的文档需要转 PDF 文件,比如说下载了很多部小说。这时候可以使用 pdfkit 的高防服务器字符串转 PDF 功能,批量操作,进行转化。
path_wkthmltopdf = rC:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe
config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
pdfkit.from_string(talk is cheap, show me your code!,str.pdf, configuration=config)运行这段代码,生成 PDF 文件如下:
总结
本文介绍了一款轻量级的三方包——pdfkit,可以将 URL 对应的网页、HTML 文件和字符串转成 PDF 文件。
有人会问:有什么用?这些直接用软件操作,很容易就解决了。
当然,对于少量的单线程操作,确实没必要写代码,使用软件反而更快更好。但是,设想一下,如果你通过爬虫爬取了很多页面,想要将这些页面转成 PDF 文件保存,这时候直接写转换程序,然后和爬虫程序结合,是不是更好更高效?
像这些小工具,功能虽然简单,但是在合适的时候使用,会大大提高你的效率,平时积累一下,服务器托管关键时刻才可以灵活运用!
很赞哦!(31)
上一篇: 互联网中的地址是数字的IP地址,域名解析的作用主要就是为了便于记忆。
下一篇: 3、查看排名
站长推荐
5、使用企业名称的英文名称作为域名也是国内许多企业选择域名的一种方式,特别适合一些与计算机、网络和通信相关的行业。
深入剖析 Java 反序列化漏洞
TS 类这十个知识点,你都掌握了么?
一个微服务业务系统的中台构建之路
2、根据用户基础选择访问提供程序。由于互联问题的存在,接入商的选择也非常重要,如果用户群主要在联通,尽量选择联通接入较好的接入商,如果用户群主要在电信,那么选择电信接入较好的接入商。如果用户组位于国家/地区,则选择更好的访问提供程序进行交互。
用 Python 将 matplotlib 图表集成到 PDF 中
外媒:甲骨文加入TikTok竞购战 正与美国投资者合作
轻松理解JS中的面向对象,顺便搞懂prototype和__proto__