R语言简单处理pdf神器——qpdf包
2020/9/2大约 1 分钟
qpdf是一个在不读取PDF内容的前提下进行pdf页面操作的package,能够方便的实现PDF页面的合并、拆分、压缩。
qpdf package
qpdf包提供了PDF文件保守的内容转换,如拆分、合并和压缩。这个包直接使用了qpdf的c++ API接口,不需要任何命令行工具,qpdf不会从PDF文件中读取实际内容。 该包总共提供了以下5个函数,所有函数均不会对原始文件产生任何影响:
pdf_split
描述: 将一个pdf文件拆分成许多个单页,一页一个新pdf文件
用法: pdf_split(input, output = NULL, password = NULL)
pdf_length
描述: 提取单个pdf文件的页数信息
用法: pdf_length(input, password = NULL)
pdf_subset
描述: 提取单个pdf文件的特定页
用法: pdf_subset(input, pages = 1, output = NULL, password = NULL)
pdf_combine
描述: 多个pdf顺序合并
用法: pdf_combine(input, output = NULL, password = NULL)
pdf_compress
描述: pdf文件压缩和线性化
用法: pdf_compress(input, output = NULL, linearize = FALSE, password = NULL)
参数汇总
| 参数名 | 含义 |
|---|---|
| input | 输入文件路径 |
| output | 输出文件路径 |
| password | 文件密码 |
| pages | 需要提取的子页页码(vector类型) |
| linearize | 是否将pdf线性化 |