当前位置: 首页 > 科技观察

如何在Linux下将网页转换为PDF文件

时间:2023-03-15 22:42:05 科技观察

当您归档某些资源或用于教育目的时,将网页另存为PDF非常方便。但是,如何在Linux中将网页转换为PDF?您可以选择在每个Linux发行版上使用Web浏览器(GUI),或使用终端将网页转换为PDF文件。在这里,我将提及这两种方法来帮助您完成工作。方法1:使用Web浏览器将网页转换为PDF文件虽然我在本教程中使用的是MozillaFirefox,但您可以使用适用于Linux的任何最佳浏览器执行相同的操作。1.加载您要转换的网页。2.在浏览器菜单中找到“打印”选项,或使用键盘快捷键Ctrl+P。3.默认情况下,它应该让您将其另存为PDF。您需要单击“保存”,然后选择目的地并保存网页。在MozillaFirefox中将网页另存为PDF这种简单方法的一个主要问题是它包含页面上的所有元素。这可能包括注释、页脚等。您可以使用PDF编辑器删除部分,但这是一项额外的任务。更好的选择是使用浏览器扩展程序,例如PrintFriendly。它允许您在下载PDF之前编辑和删除部分网页。方法2:使用终端将网页转换为PDF或图像您可能已经知道,您可以在Linux终端中浏览互联网,甚至可以使用命令行下载文件。这并不奇怪,因为您可以在终端中执行更多操作,包括将网页下载为PDF。一个漂亮的开源命令行工具wkhtmltopdf和wkhtmltoimage可以帮助您,允许您将任何HTML网页转换为PDF或图像文件。它使用QtWebKit渲染引擎来完成这项任务。您可以浏览其GitHub页面以获取更多信息。您应该能够从Linux发行版的默认存储库安装它。对于基于Ubuntu的发行版,您可以输入以下命令:sudoaptinstallwkhtmltopdf无论您要将其转换为PDF还是图像文件,其使用方法都非常简单:要将网页转换为PDF,请输入:wkhtmltopdfURL/domainfilename.pdf例如,如下所示:wkhtmltopdflinuxmint.commint.pdf您可以选择使用完整的URL,如https://linuxmint.com或使用域名,如上例所示。默认情况下,生成的文件将保存在主目录中。转换网页时,您还会获得一些有趣的选项。例如,您可以将灰度滤镜应用于PDF文件,在同一文件中制作多个页面副本,并在转换过程中排除图像。灰度过滤器可能不是对每个网页都有效,但你可以用命令试试:wkhtmltopdf-ggoogle.comgooglepage.pdf要复制同一个PDF文件中的多个页面,命令是:wkhtmltopdf--copies2linuxmint。commint.pdf并且,如果你想排除网页中的图像,只需键入:wkhtmltopdf--no-imageslinuxmint.commint.pdf另外,如果你想将网页转换为图像,命令如下:wkhtmltoimagelinuxmint.commint.png请注意,与使用浏览器的GUI方法不同,通过终端使用这些工具有其局限性。它似乎无法成功转换使用任何