由于已有某套图书的旧版本,而买新的一套又太贵,因此决定打印 PDF 电子书凑合一下。奈何很多网站的免费电子书均有水印,打印起来会很不舒服,而收费的某考研网站 PDF 需要 5元/本。于是自己探索了一下 PDF 去水印的思路,后续对 PDF 文件纠偏一下,就可以打印了。
这里发现一件好玩的事情:免费 PDF 的来源似乎就是这个收费网站,因为他们给的样图中,出现了同一页扫描偏了的情况。
使用到的工具:
- Python 3.10
- Adobe Acrobat Pro DC 2021 (来源)
去水印的思路
根据我的观察,常见的水印有两种:PDF 软件自带的水印与自定义水印。前者可以在 Adobe Acrobat 中点击 水印
- 删除
,而后者又主要包括文字水印和图片水印。如果水印和影印图片是独立的页面元素,那么就好分离了。我遇到的正是这样的情况。